pytorch不定长数据的dataloader读取

时间：2023-02-27 18:12:37浏览次数：70

标签：读取 dataloader batch padding pytorch collate fn bbox

　　参考资料：

　　https://pytorch.org/docs/stable/data.html#dataloader-collate-fn

　　https://blog.csdn.net/anshiquanshu/article/details/112868740

　　在使用Pytorch深度学习框架的时候，一定绕不开的就是dataset和dataloader，后者依赖于前者，并给出了高效加载数据的解决方案（多线程，batch训练等）。

　　以RGB图片为例，dataset出来的数据形状是(3, H, W)，而dataloader出来的数据形状是(batch_size, 3, H, W)。很明显，多了一维即batch维度。这显然是dataloader将数据给“叠”了起来。事实上，dataloader是有一个参数为collate_fn的，它的默认值是None，即当你在使用dataloader并不指定collate_fn的时候，实际上pytorch调用了默认的collate_fn函数，将数据“叠”起来之后再交给你。

　　然而，当你的数据是不定长的数据的时候，它就没有办法成功把数据叠起来，比如我就遇到了如下报错：

　　RuntimeError: stack expects each tensor to be equal size, but got [2, 4] at entry 0 and [5, 4] at entry 1

　　一个数据长度为2，一个数据长度为5，显然无法直接stack？此时在面对不定长数据的时候就需要自定义collate_fn进行填充了。譬如，pytorch文档上有这么一段话：

　　A custom collate_fn can be used to customize collation, e.g., padding sequential data to max length of a batch.

　　那么，如何自定义一个collate_fn？这个collate_fn的输入和输出又是什么？我们来看一下这个例子：

def padding_collate_fn(data_batch):
    batch_bbox_list = [item['bbox'] for item in data_batch]
    batch_label_list = [item['label'] for item in data_batch]
    batch_filename_list = [item['filename'] for item in data_batch]
    
    padding_bbox = pad_sequence(batch_bbox_list, batch_first=True, padding_value=0)
    padding_label = pad_sequence(batch_bbox_list, batch_first=True, padding_value=5)
    
    result = dict()
    result["bbox"] = padding_bbox
    result["label"] = padding_label
    result["filename"] = batch_filename_list
    
    return result

　　首先我原始的dataset输出是一个字典，上述代码就是把字典中的值取出来再叠起来，最后放到大字典中返回。其中pad_sequence这个函数在torch.nn.utils.rnn这个包里，很好用。

　　实际上，batch就是你的dataset[index] ~ dataset[index + batch_size] 构成的列表，知道这一点后问题就迎刃而解了。

标签：读取,dataloader,batch,padding,pytorch,collate,fn,bbox
From： https://www.cnblogs.com/chester-cs/p/17160501.html

C#使用GDAL读取TIF文件
GDAL官网C#使用GDAL库需安装以下两个Nuget包：GDAL和GDAL.Native也可以安装这几个包：这两种方式的注册方式会不太一样，其他用法大致相同。在此选中的是第一种方式，即在此安......
直播系统源代码，读取多行文本、读取文件分割多行文本
直播系统源代码，读取多行文本、读取文件分割多行文本读取文本 publicfunctiondaoru(){/* *逐行读取TXT文件 */ $rep=str_replace("\n",',',"TD......
基于pytorch实现模型剪枝
一，剪枝分类所谓模型剪枝，其实是一种从神经网络中移除"不必要"权重或偏差（weigths/bias）的模型压缩技术。关于什么参数才是“不必要的”，这是一个目前依然在研究的领域。1.1，非......
ASP.NET读取目录及文件
<spanstyle="font-size:18px;">DirectoryInfodir=newDirectoryInfo(path);FileInfo[]files=dir.GetFiles();</span><spanstyle="font-size:18px;">for(inti=0;i<f......
JAVA读取Excel文件
工具类 /***同步无模型读取（默认读取sheet0,从第2行开始读）**@paramfilePath文件路径*@returnList<Map<Integer,String>>*/......
登峰造极,师出造化,Pytorch人工智能AI图像增强框架ControlNet绘画实践,基于Python3.10
人工智能太疯狂，传统劳动力和内容创作平台被AI枪毙，弃尸尘埃。并非空穴来风，也不是危言耸听，人工智能AI图像增强框架ControlNet正在疯狂地改写绘画艺术的发展进程，你问我绘画行......
Python中如何读取npy、npz文件？
npy以及npz这两种文件格式，是python第三方库numpy才能够保存和读取的文件类型，而也只有通过该库才有方法来完成读取保存操作。下面这篇文章所要介绍的内容就是，python读取和保......
【问题记录】代码里import的torch版本不是我安装的pytorch版本
背景之前用的机器现在没卡，今天暂时换了另一个机器。我之前是打包过我的conda环境的，今天脑抽觉得解包创建新conda环境有点慢，关键的包也没几个，就直接install了。执行了下面......
1、Kyuubi在竞技世界大数据平台实践--Kyuubi on K8S读取kerberosed CD
背景为满足业务大数据架构使用多种sql引擎：spark，flink，trino(同时查询hive，clickhouse等)，需要部署一个统一的sql入口，该入口满足多引擎多平台运行；本次实践是上述需求的一个......
python-djanggo 实现读取excel 表格在网页中展示
1.准备读取数据放到项目文件夹下 2.熟悉表结构 3.准备处理依赖库pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplepandasopenpyxl ......

pytorch不定长数据的dataloader读取

相关文章

赞助商

阅读排行