目录
1. 信息 TransUnet
1.1. 时间 open time
2021
1.2. 链接 Link github
1.3. 应用 Use
本是应用于医疗影像
使用的若是PNG多波段图像,可以按照以下链接进行修改:TransUnet官方代码训练自己数据集-彩色RGB3通道图像的分割
以下内容是我自己在修改过程中做的笔记。
2. 自用 TransUnet
因我前期自己调整好了代码,只参考了上述链接的dataset.py文件中的内容,使代码可以应用于3通道彩色影像。但目录的安排与其不同(我是严格按照github上的官方代码设置目录),但也正常运行了起来,故而也做记录。
我认为复现代码最重要的是能少修改就要少修改。
2.1. 目录 Tree
—| D:\T01_transUnet
————| data
————————| Synapse
———————————————| test_vol_h5····(50_0.png.npz, 50_1.png.npz, ...)
———————————————| train_npz······(1_0.png.npz, 1_1.png.npz, ...)
————| model
————————| vit_checkpoint
———————————————| imagenet21k···(R50+ViT-B_16.npz)
————| predictions
————| TransUNet-main(该子文件夹为从github上下载下来的压缩包解压后的文件夹,里面的布局不做调整)
一些说明:
- “···”之后跟着的,是文件夹中储存的文件的示例。
- data->Synapse下的train和test_vol_h5文件夹中存放的数据类型,都会被更改为存放.npz,参考1.3.部分中csdn代码,其对数据读取的方式做了调整。
- model中存放的是下载下来的预训练权重。
- predictions中的内容是测试模型时使用的,训练过程不涉及这个文件夹。
2.2. 修改 Change
参考1.3.中的修改即可TransUnet官方代码训练自己数据集-彩色RGB3通道图像的分割。
但对于如何预处理数据,我认为还是没有说的特别清楚,之后会发布我的预处理全过程。主要是因为以下方面:
-
一些公开的数据集,其内的图像数据的尺寸并不是规整的512 × 512,有时会是1500 × 1500, 10000 × 10000等。如何对它们进行裁剪没有说明。
-
有些label是3波段的,如何转换成1个波段的label,没有说明(包括将0和255的值转换成0和1的)。
-
我自己遇到的一些问题,也会详细说明。