首页 > 其他分享 >DataLoader

DataLoader

时间:2022-10-02 17:00:13浏览次数:46  
标签:数据 DataLoader 默认 epoch bool optional

导包:from torch.utils.data import DataLoader 

DataLoader是Pytorch中用来处理模型输入数据的一个工具类。组合了数据集(dataset) + 采样器(sampler),并在数据集上提供单线程或多线程(num_workers )的可迭代对象。

1、重要参数

 1  epoch:所有的训练样本输入到模型中称为一个epoch; 
 2  iteration:一批样本输入到模型中,称为一个Iteration;
 3  batchszie:批大小、批尺寸,决定一个epoch有多少个Iteration;
 4  迭代次数(iteration)= 样本总数(epoch)/批尺寸(batchszie)
 5  dataset (Dataset) – 决定数据从哪读取或者从何读取;
 6  batch_size (python:int, optional) – 批尺寸(每次训练样本个数,默认为1),听说是2的幂次可以发挥更好的性能(32,64,128,256)
 7  shuffle (bool, optional) – 每一个 epoch是否为乱序 (default: False);
 8  num_workers (python:int, optional) – 是否多进程读取数据(默认为0);
 9  drop_last (bool, optional) – 当样本数不能被batchsize整除时,最后一批数据是否舍弃(default: False)
10  pin_memory(bool, optional) - 如果为True会将数据放置到GPU上去(默认为false) 

 

标签:数据,DataLoader,默认,epoch,bool,optional
From: https://www.cnblogs.com/xiaoliang-333/p/16749021.html

相关文章

  • Pytorch——Dataset&Dataloader
    在利用Pytorch进行深度学习的训练时需要将数据进行打包,这就是Dataset与Dataloader的作用。 Dataset将数据进行包装,Dataloader迭代包装好的数据并输出每次训练所......