编写`.yaml`配置文件

本节相关代码：

core/config/config.py
config/*

LibFewShot中配置文件的组成

LibFewSHot的配置文件采用了yaml格式的文件，同时也支持从命令行中读取一些全局配置的更改。我们预先定义了一个默认的配置core/config/default.yaml。用户可以将自定义的配置放在config/目录下，保存为yaml格式的文件。配置定义在解析时的优先级顺序是default.yaml->config/->console。后一个定义会覆盖前一个定义中名称相同的值。

尽管default.yaml中设置的是小样本学习中的一些最基础的配置，无法仅依靠default.yaml直接运行程序。运行代码前，用户需要在config/目录下定义已经在LibFewShot中实现了的方法的配置。

考虑到小样本方法有一些基本参数例如way, shot或者device id，这样的参数是经常需要改动的。LibFewShot支持在命令行中对一些简单的配置进行更改而不需要修改yaml文件。同样的，在训练和测试过程中，很多不同的小样本学习方法的参数是相同的。为了简洁起见，我们将这些相同的参数包装到了一起，放到了config/headers目录下，这样就能够通过导入的方式简洁地编写自定义方法的yaml文件。

以下是config/headers目录下文件的构成。

data.yaml：定义了训练所使用的数据的相关配置。
device.yaml：定义了训练所使用的GPU的相关配置。
losses.yaml：定义了训练所用的损失的相关配置。
misc.yaml：定义了训练过程中一些杂项设置。
model.yaml：定义了模型训练的相关配置。
optimizer.yaml：定义了训练所使用的优化器的相关配置。

LibFewShot中配置文件的设置

以下详细介绍配置文件中每部分代表的信息以及如何编写。将以DN4方法的配置给出示例。

数据设置

data_root：数据集存放的路径
image_size：输入图像的尺寸
use_momery：是否使用内存加速读取
augment：是否使用数据增强
augment_times：support_set使用数据增强/转换的次数。相当于多次扩充support set数据。

augment_times_query：query_set使用数据增强/转换的次数。相当于多次扩充了query set数据。

data_root: /data/miniImageNet--ravi
image_size: 84
use_memory: False
augment: True
augment_times: 1
augment_times_query: 1

模型设置

backbone：方法所使用的backbone信息。
- name：使用的backbone的名称，需要与LibFewShot中实现的backbone的大小写一致。
- kwargs：backbone初始化时用到的参数，必须保持名称与代码中的名称一致。
  - is_flatten：默认False，如果为True，则返回flatten后的特征向量。
  - avg_pool：默认False，如果为True，则返回global average pooling后的特征向量。
  - is_feature：默认False，如果为True，则返回backbone中每一个block的输出。
```
backbone:
    name: Conv64FLeakyReLU
    kwargs:
        is_flatten: False
```
classifier：方法所使用的方法信息。
- name：使用的方法的名称，需要与LibFewShot中实现的方法的名称一致。
- kwargs：方法初始化时用到的参数，必须保持名称与代码中的名称一致。
```
classifier:
    name: DN4
    kwargs:
        n_k: 3
```

训练设置

epoch：训练的epoch数。
test_epoch：测试的epoch数。
pretrain_path：预训练权重地址。训练开始时会检查该设置。如果不为空，将会把目标地址的预训练权重载入到当前训练的backbone中。
resume：如果设置为True，将从默认地址中读取训练状态从而支持断点重训。
way_num：训练中的way的数量。
shot_num：训练中的shot的数量。
query_num：训练中的query的数量。
test_way：测试中的way的数量。如果未指定，将会把way_num赋值给test_way。
test_shot：测试中的shot的数量。如果未指定，将会把shot_num赋值给test_way。
test_query：测试中的query的数量。如果未指定，将会把query_num赋值给test_way。
episode_size：网络每次训练所使用的任务数量.
batch_size：pre-training的方法在pre-train时所使用的batch size。在某些方法中，该属性是无用的。
train_episode：训练阶段每个epoch的任务数量。

test_episode：测试阶段每个epoch的任务数量。

epoch: 50
test_epoch: 5

pretrain_path: ~
resume: False

way_num: 5
shot_num: 5
query_num: 15
test_way: ~
test_shot: ~
test_query: ~
episode_size: 1
# batch_size只在pre-train中起效
batch_size: 128
train_episode: 10000
test_episode: 1000

优化器设置

optimizer：训练阶段使用的优化器信息。
- name：优化器名称，当前仅支持Pytorch提供的所有优化器。
- kwargs：传入优化器的参数，名称需要与Pytorch优化器所需要的参数名称相同。
- other：当前仅支持单独指定方法中的每一部分所使用的学习率，名称需要与方法中所使用的变量名相同。
```
optimizer:
    name: Adam
    kwargs:
        lr: 0.01
    other:
        emb_func: 0.01
        #演示用，dn4分类时没有可训练参数
        dn4_layer: 0.001
```
lr_scheduler：训练时使用的学习率调整策略，当前仅支持Pytorch提供的所有学习率调整策略。
- name：学习率调整策略名称。
- kwargs：其他Pytorch学习率调整策略所需要的参数。
```
lr_scheduler:
  name: StepLR
  kwargs:
    gamma: 0.5
    step_size: 10
```

硬件设置

device_ids：训练可以用到的gpu的编号，与nvidia-smi命令显示的编号相同。
n_gpu：训练使用并行训练的gpu个数，如果为1则不适用并行训练。
deterministic：是否开启torch.backend.cudnn.benchmark以及torch.backend.cudnn.deterministic以及是否使训练随机种子确定。

seed：训练时numpy，torch，cuda使用的种子点。

device_ids: 0,1,2,3,4,5,6,7
n_gpu: 4
seed: 0
deterministic: False

杂项设置

log_name：如果为空，即使用自动生成的classifier.name-data_root-backbone-way_num-shot_num文件目录。
log_level：训练中日志输出等级。
log_interval：日志输出间隔的任务数目。
result_root：结果存放的根目录
save_interval：权重保存的epoch间隔
save_part：方法中需要保存的部分在方法中的变量名称。这些名称的变量会在模型保存时单独对这些变量保存一次。需要保存的部分在save_part下以列表的形式给出。
```
log_name: ~
log_level: info
log_interval: 100
result_root: ./results
save_interval: 10
save_part:
    - emb_func
    - dn4_layer
```

编写.yaml配置文件