增加一个新的分类器

本节相关代码：

core/model/abstract_model.py
core/model/meta/*
core/model/metric/*
core/model/pretrain/*

我们需要从论文中分类的三种方法，即matric based，meta learning，以及fine tuning，从每种方法中选出一个代表性的方法，描述如何添加这一类别的新的方法。

不过在此之前，需要先了解一下所有分类方法共同的父类abstract_model。

class AbstractModel(nn.Module):
    def __init__(self,...)
    	# base info

    @abstractmethod
    def set_forward(self,):
        # inference phase
        pass

    @abstractmethod
    def set_forward_loss(self,):
        # training phase
        pass

    def forward(self, x):
        out = self.emb_func(x)
        return out

    def train(self,):
        # override super's function

    def eval(self,):
        # override super's function

    def _init_network(self,):
        # init all layers

    def _generate_local_targets(self,):
        # formate the few shot labels

    def split_by_episode(self,):
        # split batch by way, shot and query

    def reset_base_info(self,):
        # change way, shot and query

__init__：初始化函数，用于初始化一些小样本学习中常用的如way，shot，query这样的参数设置。
set_forward：用于推理阶段调用，返回分类输出以及准确率。
set_forward_loss：用于训练阶段调用，返回分类输出、准确率以及前向损失。
forward：重写pytorch的Module中的forward函数，返回backbone的输出。
train：重写pytorch的Module中的train函数，用于解除BatchNorm层的参数固定。
eval：重写pytorch的Module中的eval函数，用于固定BatchNorm层的参数。
_init_network：用于初始化所有网络。
_generate_local_targets：用于生成小样本学习的任务中所使用的target。
split_by_episode：将输入按照episode_size,way,shot,query切分好便于后续处理。提供了几种切分方式。
reset_base_info：改变小样本学习的way,shot,query等设置。

其中，添加新的方法必须要重写set_forward以及set_forward_loss这两个函数，其他的函数都可以根据所实现方法的需要来调用。

注意，为了新添加的方法能够通过反射机制调用到，需要在对应方法类型的目录下的__init__.py文件中加上一行：

from NewMethodFileName import *

metric based

接下来将以DN4为例，描述如何在LibFewShot中添加一个新的metric based classifier。

metric based方法有一个共同的父类MetricModel，继承了AbstractModel。

class MetricModel(AbstractModel):
    def __init__(self,):
        ...

    @abstractmethod
    def set_forward(self, *args, **kwargs):
        pass

    @abstractmethod
    def set_forward_loss(self, *args, **kwargs):
        pass

    def forward(self, x):
        out = self.emb_func(x)
        return out

由于metric based方法的pipeline的方法大多比较简单，因此只是继承了abstract_model，并没有做其他修改。

建立模型

首先创建DN4的模型类，在core/model/metric/下添加dn4.py文件：（这部分代码与源码略有不同）

class DN4(MetricModel):
    def __init__(self, way_num, shot_num, query_num, emb_func, device, n_k=3):
        # base info
        super(DN4Layer, self).__init__()
        self.way_num = way_num
        self.shot_num = shot_num
        self.query_num = query_num
        self.n_k = n_k
        self.loss_func = nn.CrossEntropyLoss()

    def set_forward(self, batch):
        # inference phase
        """
        :param batch: (images, labels)
        :param batch.images: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query),C,H,W]
        :param batch.labels: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query), ]
        :return: net output and accuracy
        """
        image, global_target = batch
        image = image.to(self.device)
        episode_size = image.size(0) // (
            self.way_num * (self.shot_num + self.query_num)
        )
        feat = self.emb_func(image)
        support_feat, query_feat, support_target, query_target = self.split_by_episode(
            feat, mode=2
        )

        t, wq, c, h, w = query_feat.size()
        _, ws, _, _, _ = support_feat.size()

        # t, wq, c, hw -> t, wq, hw, c -> t, wq, 1, hw, c
        query_feat = query_feat.view(
            t, self.way_num * self.query_num, c, h * w
        ).permute(0, 1, 3, 2)
        query_feat = F.normalize(query_feat, p=2, dim=2).unsqueeze(2)

        # t, ws, c, h, w -> t, w, s, c, hw -> t, 1, w, c, shw
        support_feat = (
            support_feat.view(t, self.way_num, self.shot_num, c, h * w)
            .permute(0, 1, 3, 2, 4)
            .contiguous()
            .view(t, self.way_num, c, self.shot_num * h * w)
        )
        support_feat = F.normalize(support_feat, p=2, dim=2).unsqueeze(1)

        # t, wq, w, hw, shw -> t, wq, w, hw, n_k -> t, wq, w
        relation = torch.matmul(query_feat, support_feat)
        topk_value, _ = torch.topk(relation, self.n_k, dim=-1)
        score = torch.sum(topk_value, dim=[3, 4])

        output = score.view(episode_size * self.way_num * self.query_num, self.way_num)
        acc = accuracy(output, query_target)

        return output, acc

    def set_forward_loss(self, batch):
        # training phase
        """
        :param batch: (images, labels)
        :param batch.images: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query),C,H,W]
        :param batch.labels: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query), ]
        :return: net output, accuracy and train loss
        """
        image, global_target = batch
        image = image.to(self.device)
        episode_size = image.size(0) // (
            self.way_num * (self.shot_num + self.query_num)
        )
        emb = self.emb_func(image)
        support_feat, query_feat, support_target, query_target = self.split_by_episode(
            emb, mode=2
        )

        t, wq, c, h, w = query_feat.size()
        _, ws, _, _, _ = support_feat.size()

        # t, wq, c, hw -> t, wq, hw, c -> t, wq, 1, hw, c
        query_feat = query_feat.view(
            t, self.way_num * self.query_num, c, h * w
        ).permute(0, 1, 3, 2)
        query_feat = F.normalize(query_feat, p=2, dim=2).unsqueeze(2)

        # t, ws, c, h, w -> t, w, s, c, hw -> t, 1, w, c, shw
        support_feat = (
            support_feat.view(t, self.way_num, self.shot_num, c, h * w)
            .permute(0, 1, 3, 2, 4)
            .contiguous()
            .view(t, self.way_num, c, self.shot_num * h * w)
        )
        support_feat = F.normalize(support_feat, p=2, dim=2).unsqueeze(1)

        # t, wq, w, hw, shw -> t, wq, w, hw, n_k -> t, wq, w
        relation = torch.matmul(query_feat, support_feat)
        topk_value, _ = torch.topk(relation, self.n_k, dim=-1)
        score = torch.sum(topk_value, dim=[3, 4])

        output = score.view(episode_size * self.way_num * self.query_num, self.way_num)
        loss = self.loss_func(output, query_target)
        acc = accuracy(output, query_target)

        return output, acc, loss

在__init__中，对分类器可能用到的小样本学习的基本设置进行了初始化，还传入了DN4方法的一个超参数n_k。

在set_forward与set_forward_loss中，需要注意的是19-27,65-73行，这部分代码对输入的batch进行处理，提取特征，最后切分为小样本学习中需要使用的support set和query set的特征。具体来说，为了最大化利用计算资源，我们将所有图像同时经过backbone，之后对特征向量进行support set, query set的切分。29-50,75-96行为DN4方法的计算过程。最终set_forward的输出为$output.shape:[episode_sizewayquery,way]，acc:float$，set_forward_loss的输出为$output.shape:[episode_sizewayquery,way], acc:float, loss:tensor$。其中output需要用户根据方法进行生成，acc可以调用LibFewShot提供的accuracy函数，输入output, target就可以得到分类准确率。而loss可以使用用户在方法开始时初始化的损失函数，在set_forward_loss中使用来得到分类损失。

metric方法中只需要根据自己设计的方法，将输入处理为对应的形式就可以开始训练了。

meta learning

接下来将以MAML为例，描述如何在LibFewShot中添加一个新的meta learning classifier。

meta learning方法有一个共同的父类MetaModel，继承了AbstractModel。

class MetaModel(AbstractModel):
    def __init__(self,):
        super(MetaModel, self).__init__(init_type, ModelType.META, **kwargs)

    @abstractmethod
    def set_forward(self, *args, **kwargs):
        pass

    @abstractmethod
    def set_forward_loss(self, *args, **kwargs):
        pass

    def forward(self, x):
        out = self.emb_func(x)
        return out

    @abstractmethod
    def set_forward_adaptation(self, *args, **kwargs):
        pass

    def sub_optimizer(self, parameters, config):
        kwargs = dict()

        if config["kwargs"] is not None:
            kwargs.update(config["kwargs"])
        return getattr(torch.optim, config["name"])(parameters, **kwargs)

meta-learning方法加入了两个新函数，set_forward_adaptation和sub_optimizer。set_forward_adaptation是微调网络阶段的分类过程所采用的逻辑，而sub_optimizer用于在微调时提供新的局部优化器。

建立模型

首先创建MAML的模型类，在core/model/meta/下添加maml.py文件：（这部分代码与源码略有不同）

from ..backbone.utils import convert_maml_module

class MAML(MetaModel):
    def __init__(self, inner_param, feat_dim, **kwargs):
        super(MAML, self).__init__(**kwargs)
        self.loss_func = nn.CrossEntropyLoss()
        self.classifier = nn.Sequential(nn.Linear(feat_dim, self.way_num))
        self.inner_param = inner_param

        convert_maml_module(self)

    def forward_output(self, x):
         """
        :param x: feature vectors, shape: [batch, C]
        :return: probability of classification
        """
        out1 = self.emb_func(x)
        out2 = self.classifier(out1)
        return out2

    def set_forward(self, batch):
         """
        :param batch: (images, labels)
        :param batch.images: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query),C,H,W]
        :param batch.labels: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query), ]
        :return: net output, accuracy and train loss
        """
        image, global_target = batch  # unused global_target
        image = image.to(self.device)
        support_image, query_image, support_target, query_target = self.split_by_episode(
            image, mode=2
        )
        episode_size, _, c, h, w = support_image.size()

        output_list = []
        for i in range(episode_size):
            episode_support_image = support_image[i].contiguous().reshape(-1, c, h, w)
            episode_query_image = query_image[i].contiguous().reshape(-1, c, h, w)
            episode_support_target = support_target[i].reshape(-1)
            self.set_forward_adaptation(episode_support_image, episode_support_target)

            output = self.forward_output(episode_query_image)

            output_list.append(output)

        output = torch.cat(output_list, dim=0)
        acc = accuracy(output, query_target.contiguous().view(-1))
        return output, acc

    def set_forward_loss(self, batch):
         """
        :param batch: (images, labels)
        :param batch.images: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query),C,H,W]
        :param batch.labels: shape: [episodeSize*way*(shot*augment_times+query*augment_times_query), ]
        :return: net output, accuracy and train loss
        """
        image, global_target = batch  # unused global_target
        image = image.to(self.device)
        support_image, query_image, support_target, query_target = self.split_by_episode(
            image, mode=2
        )
        episode_size, _, c, h, w = support_image.size()

        output_list = []
        for i in range(episode_size):
            episode_support_image = support_image[i].contiguous().reshape(-1, c, h, w)
            episode_query_image = query_image[i].contiguous().reshape(-1, c, h, w)
            episode_support_target = support_target[i].reshape(-1)
            self.set_forward_adaptation(episode_support_image, episode_support_target)

            output = self.forward_output(episode_query_image)

            output_list.append(output)

        output = torch.cat(output_list, dim=0)
        loss = self.loss_func(output, query_target.contiguous().view(-1))
        acc = accuracy(output, query_target.contiguous().view(-1))
        return output, acc, loss

    def set_forward_adaptation(self, support_set, support_target):
        lr = self.inner_param["lr"]
        fast_parameters = list(self.parameters())
        for parameter in self.parameters():
            parameter.fast = None

        self.emb_func.train()
        self.classifier.train()
        for i in range(self.inner_param["iter"]):
            output = self.forward_output(support_set)
            loss = self.loss_func(output, support_target)
            grad = torch.autograd.grad(loss, fast_parameters, create_graph=True)
            fast_parameters = []

            for k, weight in enumerate(self.parameters()):
                if weight.fast is None:
                    weight.fast = weight - lr * grad[k]
                else:
                    weight.fast = weight.fast - lr * grad[k]
                fast_parameters.append(weight.fast)

MAML中最重要的有两部分。第一部分是第10行的convert_maml_module函数，用于将网络中的所有层转换为MAML格式的层以便于参数更新。另一部分是set_forward_adaption函数，用于更新网络的快参数。MAML是一种常用的meta learning方法，因此我们使用MAML作为例子来展示如何添加一个meta learning方法到LibFewShot库中。

fine tuning

接下来将以Baseline为例，描述如何在LibFewShot中添加一个新的fine-tuning classifier。

fine-tuning方法有一个共同的父类FinetuningModel，继承了AbstractModel。

class FinetuningModel(AbstractModel):
    def __init__(self,):
        super(FinetuningModel, self).__init__()
        # ...

    @abstractmethod
    def set_forward(self, *args, **kwargs):
        pass

    @abstractmethod
    def set_forward_loss(self, *args, **kwargs):
        pass

    def forward(self, x):
        out = self.emb_func(x)
        return out

    @abstractmethod
    def set_forward_adaptation(self, *args, **kwargs):
        pass

    def sub_optimizer(self, model, config):
        kwargs = dict()
        if config["kwargs"] is not None:
            kwargs.update(config["kwargs"])
        return getattr(torch.optim, config["name"])(model.parameters(), **kwargs)

fine-tuning方法训练时的目标是训练出一个好的特征抽取器，在测试时使用小样本学习的设置，通过support set来对模型进行微调。也有的方法是在训练完毕特征抽取器后，再使用小样本学习的训练设置来进行整个模型的微调。为了与meta learning的方法统一，我们添加了一个set_forward_adaptation抽象函数，用于处理在测试时的前向过程。另外，由于有一些fine-tuning方法的测试过程中，也需要训练分类器，因此，添加了一个sub_optimizer方法，传入需要优化的参数以及优化的配置参数，返回优化器，用以方便调用。

建立模型

首先创建Baseline的模型类，在core/model/finetuning/下添加baseline.py文件：（这部分代码与源码略有不同）

class FinetuningModel(AbstractModel):
    def __init__(self,):
        super(FinetuningModel, self).__init__()
        # ...

    @abstractmethod
    def set_forward(self, *args, **kwargs):
        pass

    @abstractmethod
    def set_forward_loss(self, *args, **kwargs):
        pass

    def forward(self, x):
        out = self.emb_func(x)
        return out

    @abstractmethod
    def set_forward_adaptation(self, *args, **kwargs):
        pass

    def sub_optimizer(self, model, config):
        kwargs = dict()
        if config["kwargs"] is not None:
            kwargs.update(config["kwargs"])
        return getattr(torch.optim, config["name"])(model.parameters(), **kwargs)

set_forward_loss方法与经典有监督分类方法相同，而set_forward方法与meta learning方法相同。set_forward_loss函数的内容是测试阶段的主要过程。由backbone从support set中提取的特征被用于训练一个分类器，而从query set中提取的特征被该分类器进行分类。