|
|
|
@ -1,6 +1,6 @@ |
|
|
|
|
# PaddleRS训练API说明 |
|
|
|
|
|
|
|
|
|
**训练器**封装了模型训练、验证、量化以及动态图推理等逻辑,定义在`paddlers/tasks/`目录下的文件中。为了方便用户使用,PaddleRS为所有支持的模型均提供了继承自父类[`BaseModel`](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/base.py)的训练器,并对外提供数个API。变化检测、场景分类、图像分割以及目标检测任务对应的训练器类型分别为`BaseChangeDetector`、`BaseClassifier`、`BaseDetector`和`BaseSegmenter`。本文档介绍训练器的初始化函数以及`train()`、`evaluate()` API。 |
|
|
|
|
**训练器**封装了模型训练、验证、量化以及动态图推理等逻辑,定义在`paddlers/tasks/`目录下的文件中。为了方便用户使用,PaddleRS为所有支持的模型均提供了继承自父类[`BaseModel`](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/base.py)的训练器,并对外提供数个API。变化检测、场景分类、目标检测、图像复原以及图像分割任务对应的训练器类型分别为`BaseChangeDetector`、`BaseClassifier`、`BaseDetector`、`BaseRestorer`和`BaseSegmenter`。本文档介绍训练器的初始化函数以及`train()`、`evaluate()` API。 |
|
|
|
|
|
|
|
|
|
## 初始化训练器 |
|
|
|
|
|
|
|
|
@ -10,27 +10,33 @@ |
|
|
|
|
|
|
|
|
|
- 一般支持设置`num_classes`、`use_mixed_loss`以及`in_channels`参数,分别表示模型输出类别数、是否使用预置的混合损失以及输入通道数。部分子类如`DSIFN`暂不支持对`in_channels`参数的设置。 |
|
|
|
|
- `use_mixed_loss`参将在未来被弃用,因此不建议使用。 |
|
|
|
|
- 可通过`losses`参数指定模型训练时使用的损失函数。`losses`需为一个字典,其中`'types'`键和`'coef'`键对应的值为两个等长的列表,分别表示损失函数对象(一个可调用对象)和损失函数的权重。例如:`losses={'types': [LossType1(), LossType2()], 'coef': [1.0, 0.5]}`在训练过程中将等价于计算如下损失函数:`1.0*LossType1()(logits, labels)+0.5*LossType2()(logits, labels)`,其中`logits`和`labels`分别是模型输出和真值标签。 |
|
|
|
|
- 不同的子类支持与模型相关的输入参数,详情请参考[模型定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/rs_models/cd)和[训练器定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/change_detector.py)。 |
|
|
|
|
|
|
|
|
|
### 初始化`BaseClassifier`子类对象 |
|
|
|
|
|
|
|
|
|
- 一般支持设置`num_classes`和`use_mixed_loss`参数,分别表示模型输出类别数以及是否使用预置的混合损失。 |
|
|
|
|
- `use_mixed_loss`参将在未来被弃用,因此不建议使用。 |
|
|
|
|
- 可通过`losses`参数指定模型训练时使用的损失函数,传入实参需为`paddlers.models.clas_losses.CombinedLoss`类型对象。 |
|
|
|
|
- 不同的子类支持与模型相关的输入参数,详情请参考[模型定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/rs_models/clas)和[训练器定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/classifier.py)。 |
|
|
|
|
|
|
|
|
|
### 初始化`BaseDetector`子类对象 |
|
|
|
|
|
|
|
|
|
- 一般支持设置`num_classes`和`backbone`参数,分别表示模型输出类别数以及所用的骨干网络类型。相比其它任务,目标检测任务的训练器支持设置的初始化参数较多,囊括网络结构、损失函数、后处理策略等方面。 |
|
|
|
|
- 与分割、分类、变化检测等任务不同,检测任务不支持通过`losses`参数指定损失函数。不过对于部分训练器如`PPYOLO`,可通过`use_iou_loss`等参数定制损失函数。 |
|
|
|
|
- 不同的子类支持与模型相关的输入参数,详情请参考[模型定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/rs_models/det)和[训练器定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/object_detector.py)。 |
|
|
|
|
|
|
|
|
|
### 初始化`BaseRestorer`子类对象 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- 一般支持设置`sr_factor`参数,表示超分辨率倍数;对于不支持超分辨率重建任务的模型,`sr_factor`设置为`None`。 |
|
|
|
|
- 可通过`losses`参数指定模型训练时使用的损失函数,传入实参需为可调用对象或字典。手动指定的`losses`与子类的`default_loss()`方法返回值必须具有相同的格式。 |
|
|
|
|
- 不同的子类支持与模型相关的输入参数,详情请参考[模型定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/rs_models/res)和[训练器定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/restorer.py)。 |
|
|
|
|
|
|
|
|
|
### 初始化`BaseSegmenter`子类对象 |
|
|
|
|
|
|
|
|
|
- 一般支持设置`in_channels`、`num_classes`以及`use_mixed_loss`参数,分别表示输入通道数、输出类别数以及是否使用预置的混合损失。部分模型如`FarSeg`暂不支持对`in_channels`参数的设置。 |
|
|
|
|
- `use_mixed_loss`参将在未来被弃用,因此不建议使用。 |
|
|
|
|
- 可通过`losses`参数指定模型训练时使用的损失函数。`losses`需为一个字典,其中`'types'`键和`'coef'`键对应的值为两个等长的列表,分别表示损失函数对象(一个可调用对象)和损失函数的权重。例如:`losses={'types': [LossType1(), LossType2()], 'coef': [1.0, 0.5]}`在训练过程中将等价于计算如下损失函数:`1.0*LossType1()(logits, labels)+0.5*LossType2()(logits, labels)`,其中`logits`和`labels`分别是模型输出和真值标签。 |
|
|
|
|
- 不同的子类支持与模型相关的输入参数,详情请参考[模型定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/rs_models/seg)和[训练器定义](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/tasks/segmentor.py)。 |
|
|
|
|
|
|
|
|
|
## `train()` |
|
|
|
@ -176,6 +182,46 @@ def train(self, |
|
|
|
|
|
|
|
|
|
### `BaseRestorer.train()` |
|
|
|
|
|
|
|
|
|
接口形式: |
|
|
|
|
|
|
|
|
|
```python |
|
|
|
|
def train(self, |
|
|
|
|
num_epochs, |
|
|
|
|
train_dataset, |
|
|
|
|
train_batch_size=2, |
|
|
|
|
eval_dataset=None, |
|
|
|
|
optimizer=None, |
|
|
|
|
save_interval_epochs=1, |
|
|
|
|
log_interval_steps=2, |
|
|
|
|
save_dir='output', |
|
|
|
|
pretrain_weights='CITYSCAPES', |
|
|
|
|
learning_rate=0.01, |
|
|
|
|
lr_decay_power=0.9, |
|
|
|
|
early_stop=False, |
|
|
|
|
early_stop_patience=5, |
|
|
|
|
use_vdl=True, |
|
|
|
|
resume_checkpoint=None): |
|
|
|
|
``` |
|
|
|
|
|
|
|
|
|
其中各参数的含义如下: |
|
|
|
|
|
|
|
|
|
|参数名称|类型|参数说明|默认值| |
|
|
|
|
|-------|----|--------|-----| |
|
|
|
|
|`num_epochs`|`int`|训练的epoch数目。|| |
|
|
|
|
|`train_dataset`|`paddlers.datasets.ResDataset`|训练数据集。|| |
|
|
|
|
|`train_batch_size`|`int`|训练时使用的batch size。|`2`| |
|
|
|
|
|`eval_dataset`|`paddlers.datasets.ResDataset` \| `None`|验证数据集。|`None`| |
|
|
|
|
|`optimizer`|`paddle.optimizer.Optimizer` \| `None`|训练时使用的优化器。若为`None`,则使用默认定义的优化器。|`None`| |
|
|
|
|
|`save_interval_epochs`|`int`|训练时存储模型的间隔epoch数。|`1`| |
|
|
|
|
|`log_interval_steps`|`int`|训练时打印日志的间隔step数(即迭代数)。|`2`| |
|
|
|
|
|`save_dir`|`str`|存储模型的路径。|`'output'`| |
|
|
|
|
|`pretrain_weights`|`str` \| `None`|预训练权重的名称/路径。若为`None`,则不适用预训练权重。|`'CITYSCAPES'`| |
|
|
|
|
|`learning_rate`|`float`|训练时使用的学习率大小,适用于默认优化器。|`0.01`| |
|
|
|
|
|`lr_decay_power`|`float`|学习率衰减系数,适用于默认优化器。|`0.9`| |
|
|
|
|
|`early_stop`|`bool`|训练过程是否启用早停策略。|`False`| |
|
|
|
|
|`early_stop_patience`|`int`|启用早停策略时的`patience`参数(参见[`EarlyStop`](https://github.com/PaddlePaddle/PaddleRS/blob/develop/paddlers/utils/utils.py))。|`5`| |
|
|
|
|
|`use_vdl`|`bool`|是否启用VisualDL日志。|`True`| |
|
|
|
|
|`resume_checkpoint`|`str` \| `None`|检查点路径。PaddleRS支持从检查点(包含先前训练过程中存储的模型权重和优化器权重)继续训练,但需注意`resume_checkpoint`与`pretrain_weights`不得同时设置为`None`以外的值。|`None`| |
|
|
|
|
|
|
|
|
|
### `BaseSegmenter.train()` |
|
|
|
|
|
|
|
|
@ -280,7 +326,7 @@ def evaluate(self, eval_dataset, batch_size=1, return_details=False): |
|
|
|
|
|
|
|
|
|
``` |
|
|
|
|
{"top1": top1准确率, |
|
|
|
|
"top5": `top5准确率} |
|
|
|
|
"top5": top5准确率} |
|
|
|
|
``` |
|
|
|
|
|
|
|
|
|
### `BaseDetector.evaluate()` |
|
|
|
@ -320,6 +366,26 @@ def evaluate(self, |
|
|
|
|
|
|
|
|
|
### `BaseRestorer.evaluate()` |
|
|
|
|
|
|
|
|
|
接口形式: |
|
|
|
|
|
|
|
|
|
```python |
|
|
|
|
def evaluate(self, eval_dataset, batch_size=1, return_details=False): |
|
|
|
|
``` |
|
|
|
|
|
|
|
|
|
输入参数如下: |
|
|
|
|
|
|
|
|
|
|参数名称|类型|参数说明|默认值| |
|
|
|
|
|-------|----|--------|-----| |
|
|
|
|
|`eval_dataset`|`paddlers.datasets.ResDataset`|评估数据集。|| |
|
|
|
|
|`batch_size`|`int`|评估时使用的batch size(多卡训练时,为所有设备合计batch size)。|`1`| |
|
|
|
|
|`return_details`|`bool`|*当前版本请勿手动设置此参数。*|`False`| |
|
|
|
|
|
|
|
|
|
输出为一个`collections.OrderedDict`对象,包含如下键值对: |
|
|
|
|
|
|
|
|
|
``` |
|
|
|
|
{"psnr": PSNR指标, |
|
|
|
|
"ssim": SSIM指标} |
|
|
|
|
``` |
|
|
|
|
|
|
|
|
|
### `BaseSegmenter.evaluate()` |
|
|
|
|
|
|
|
|
|