PaddleRS/docs/cases/sr_seg_cn.md

# [使用图像超分提高低分辨率无人机影像的分割精度](https://aistudio.baidu.com/aistudio/projectdetail/3696814)

## 一、项目背景

- 前段时间写了个项目：[PaddleSeg：使用Transfomer模型对航空遥感图像分割](https://aistudio.baidu.com/aistudio/projectdetail/3565870)，项目利用PaddleSeg模块训练Transfomer类的语义分割模型，在UDD6数据集中**mIOU达到74.50%** ，原论文使用DeepLabV3+的mIOU为73.18%， **高1.32%** ，训练效果图如下，其中：车辆：红色；道路：浅蓝色；植被：深蓝色；建筑立面：亮绿色；建筑屋顶：紫色；其他：焦绿色

```python
%cd /home/aistudio/
import matplotlib.pyplot as plt
from PIL import Image

output = Image.open(r"work/example/Seg/UDD6_result/added_prediction/000161.JPG")

plt.figure(figsize=(18, 12))  # 设置窗口大小
plt.imshow(output), plt.axis('off')
```

![output_1_2](https://user-images.githubusercontent.com/71769312/161358238-5dc85c26-de33-4552-83ea-ad9936a5c85a.png)

- 训练的结果很不错，所使用的UDD6数据是从北京、葫芦岛、沧州、郑州四个城市，使用大疆精灵四无人机在60m-100m高度之间采集。但是，**在实际的生产过程中，城市、飞行的高度、图像的质量会发生变化**
- 采集飞行高度升高可以在相同时间内获取更大面积的数据，但分辨率会降低，对低质量的数据，**直接使用先前训练的数据预测效果不理想**，**再标注数据、训练模型将是一个不小的工作量**，解决的方法除了提升模型的泛化能力，也可以考虑使用图像超分对低质量的无人机图像重建，然后再进行预测
- 本项目使用PaddleRS提供的无人机遥感图像超分模块，对**真实的低质量无人机影像**数据进行**超分**，然后再使用前段时间用UDD6训练的Segformer模型预测，与直接使用低分辨率模型对比。由于没有对低质量数据进行标注无法计算指标。但人眼判别，超分之后的预测结果更好，**左边是人工标注的label，中间是低分辨率的预测结果，右边是超分辨率重建后的结果**

```python
img = Image.open(r"work/example/Seg/gt_result/data_05_2_14.png")
lq = Image.open(r"work/example/Seg/lq_result/added_prediction/data_05_2_14.png")
sr = Image.open(r"work/example/Seg/sr_result/added_prediction/data_05_2_14.png")

plt.figure(figsize=(18, 12))
plt.subplot(1,3,1), plt.title('GT')
plt.imshow(img), plt.axis('off')
plt.subplot(1,3,2), plt.title('predict_LR')
plt.imshow(lq), plt.axis('off')
plt.subplot(1,3,3), plt.title('predict_SR')
plt.imshow(sr), plt.axis('off')
plt.show()
```

![output_3_0](https://user-images.githubusercontent.com/71769312/161358300-b85cdda4-7d1f-40e7-a39b-74b2cd5347b6.png)

## 二、数据介绍与展示
- 使用的数据是使用大疆精灵四无人机在**上海，飞行高度为300m**采集的，采集的时候天气也一般，可以看后续的示例发现质量不高。由于只是展示超分重建后进行预测的效果，所以只是简单标注了其中5张照片，毕竟**标注数据真的是一件很费力的事！** 要是能用公开数据集训练的模型来预测自己的数据，这多是一件美事！
- 部分标注数据展示如下

```python
add_lb = Image.open(r"work/example/Seg/gt_result/data_05_2_19.png")
lb = Image.open(r"work/example/Seg/gt_label/data_05_2_19.png")
img = Image.open(r"work/ValData/DJI300/data_05_2_19.png")

plt.figure(figsize=(18, 12))
plt.subplot(1,3,1), plt.title('image')
plt.imshow(img), plt.axis('off')
plt.subplot(1,3,2), plt.title('label')
plt.imshow(lb), plt.axis('off')
plt.subplot(1,3,3), plt.title('add_label')
plt.imshow(add_lb), plt.axis('off')
plt.show()
```

![output_5_0](https://user-images.githubusercontent.com/71769312/161358312-3c16cbb0-1162-4fbe-b3d6-9403502aefef.png)

## 三、无人机遥感图像超分
- 因为PaddleRS提供了预训练的超分模型，所以这步主要分为以下两个步骤：
    - 准备PaddleRS并设置好环境
    - 调用PaddleRS中的超分预测接口，对低分辨率无人机影像进行**超分重建**

```python
# 从github上克隆仓库
!git clone https://github.com/PaddleCV-SIG/PaddleRS.git
```

```python
# 安装依赖，大概一分多钟
%cd PaddleRS/
!pip install -r requirements.txt
```

```python
# 进行图像超分处理，使用的模型为DRN
import os
import paddle
import numpy as np
from PIL import Image
from paddlers.models.ppgan.apps.drn_predictor import DRNPredictor

# 输出预测结果的文件夹
output = r'../work/example'
# 待输入的低分辨率影像位置
input_dir = r"../work/ValData/DJI300"

paddle.device.set_device("gpu:0")  # 若是cpu环境，则替换为 paddle.device.set_device("cpu")
predictor = DRNPredictor(output)  # 实例化

filenames = [f for f in os.listdir(input_dir) if f.endswith('.png')]
for filename in filenames:
    imgPath = os.path.join(input_dir, filename)
    predictor.run(imgPath)  # 预测
```

- 超分重建结果前后对比展示

```python
# 可视化
import os
import matplotlib.pyplot as plt
%matplotlib inline

lq_dir = r"../work/ValData/DJI300"  # 低分辨率影像文件夹
sr_dir = r"../work/example/DRN"  # 超分辨率影像所在文件夹
img_list = [f for f in os.listdir(lq_dir) if f.endswith('.png')]
show_num = 3  # 展示多少对影像
for i in range(show_num):
    lq_box = (100, 100, 175, 175)
    sr_box = (400, 400, 700, 700)
    filename = img_list[i]
    image = Image.open(os.path.join(lq_dir, filename)).crop(lq_box)  # 读取低分辨率影像
    sr_img = Image.open(os.path.join(sr_dir, filename)).crop(sr_box)  # 读取超分辨率影像

    plt.figure(figsize=(12, 8))
    plt.subplot(1,2,1), plt.title('Input')
    plt.imshow(image), plt.axis('off')
    plt.subplot(1,2,2), plt.title('Output')
    plt.imshow(sr_img), plt.axis('off')
    plt.show()
```

![output_11_0](https://user-images.githubusercontent.com/71769312/161358324-c45d750d-b47e-4201-b70c-3c374498fd86.png)

![output_11_1](https://user-images.githubusercontent.com/71769312/161358335-0b85035e-0a9d-4b5a-8d0c-14ecaeffd947.png)

![output_11_2](https://user-images.githubusercontent.com/71769312/161358342-d2875098-cb9b-4bc2-99b0-bcab4c1bc5e1.png)

## 四、超分前后图像分割效果对比

- 使用的模型为Segformer_b3,用UDD6数据集训练了40000次
- 已经将性能最好的模型以及.yml文件放在work文件夹下
- 运行以下命令可对指定的文件夹下的图像进行预测
- 首先用该模型对低质量的无人机数据进行预测，然后再使用超分重建后的图像预测，最后对比一下预测的效果

```python
%cd ..
# clone PaddleSeg的项目
!git clone https://gitee.com/paddlepaddle/PaddleSeg
```

```python
# 安装依赖
%cd /home/aistudio/PaddleSeg
!pip install  -r requirements.txt
```

```python
# 对低分辨率的无人机影像进行预测
!python predict.py \
       --config ../work/segformer_b3_UDD.yml \
       --model_path ../work/best_model/model.pdparams \
       --image_path ../work/ValData/DJI300 \
       --save_dir ../work/example/Seg/lq_result
```

```python
# 对使用DRN超分重建后的影像进行预测
!python predict.py \
       --config ../work/segformer_b3_UDD.yml \
       --model_path ../work/best_model/model.pdparams \
       --image_path ../work/example/DRN \
       --save_dir ../work/example/Seg/sr_result
```

**展示预测结果**
- 其中，颜色如下：

|   种类 | 颜色   |
|----------|---------|
|  **其他**  |  焦绿色  |
| 建筑外立面 |  亮绿色  |
|  **道路**  |  淡蓝色  |
| 植被 |  深蓝色  |
|  **车辆** |  红色  |
| 屋顶 |  紫色  |

- 由于只标注了五张图片，所以只展示五张图片的结果，剩下的预测结果均在 `work/example/Seg/`文件夹下,其中左边是真值，中间是低分辨率影像预测结果，右边是超分重建后预测结果

```python
# 展示部分预测的结果
%cd /home/aistudio/
import matplotlib.pyplot as plt
from PIL import Image
import os

img_dir = r"work/example/Seg/gt_result"  # 低分辨率影像文件夹
lq_dir = r"work/example/Seg/lq_result/added_prediction"
sr_dir = r"work/example/Seg/sr_result/added_prediction"  # 超分辨率预测的结果影像所在文件夹
img_list = [f for f in os.listdir(img_dir) if f.endswith('.png') ]
for filename in img_list:
    img = Image.open(os.path.join(img_dir, filename))
    lq_pred = Image.open(os.path.join(lq_dir, filename))
    sr_pred = Image.open(os.path.join(sr_dir, filename))

    plt.figure(figsize=(12, 8))
    plt.subplot(1,3,1), plt.title('GT')
    plt.imshow(img), plt.axis('off')
    plt.subplot(1,3,2), plt.title('LR_pred')
    plt.imshow(lq_pred), plt.axis('off')
    plt.subplot(1,3,3), plt.title('SR_pred')
    plt.imshow(sr_pred), plt.axis('off')
    plt.show()

```

![output_18_1](https://user-images.githubusercontent.com/71769312/161358523-42063419-b490-4fca-b0d4-cb2b05f7f74a.png)

![output_18_2](https://user-images.githubusercontent.com/71769312/161358556-e2f66be4-4758-4c7a-9b3b-636aa2b53215.png)

![output_18_3](https://user-images.githubusercontent.com/71769312/161358599-e74696f3-b374-4d5c-a9f4-7ffaef8938a0.png)

![output_18_4](https://user-images.githubusercontent.com/71769312/161358621-c3c0d225-b67f-4bff-91ba-4be714162584.png)

![output_18_5](https://user-images.githubusercontent.com/71769312/161358643-9aba7db1-6c68-48f2-be53-8eec30f27d60.png)

## 五、总结
- 本项目调用PaddleRS提供的超分重建接口，选用DRN模型对真实采集的低分辨率影像进行重建，再对重建后的图像进行分割，从结果上看，**超分重建后的图片的分割结果更好**
- **不足之处**：虽然相对于低分辨率影像，超分重建后的预测精度从目视的角度有所提高，但是并没有达到UDD6测试集中的效果，所以**模型的泛化能力也需要提高才行，光靠超分重建依然不够**
- **后续工作**：将会把超分重建这一步整合到PaddleRS中的transform模块，在high-level任务预测之前可以进行调用改善图像质量，请大家多多关注[PaddleRS](https://github.com/PaddleCV-SIG/PaddleRS)