pytorch TensorDataset和DataLoader区别

时间：2022-11-10 09:34:45浏览次数：45

标签：torch TensorDataset DataLoader batch pytorch train data

TensorDataset

TensorDataset可以用来对 tensor 进行打包，就好像 python 中的 zip 功能。该类通过每一个 tensor 的第一个维度进行索引。因此，该类中的 tensor 第一维度必须相等. 另外：TensorDataset 中的参数必须是 tensor

import torch
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

a = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9]])
b = torch.tensor([44, 55, 66, 44, 55, 66, 44, 55, 66, 44, 55, 66])
train_ids = TensorDataset(a, b) 
# 切片输出
print(train_ids[0:2])
print('=' * 80)
# 循环取数据
for x_train, y_label in train_ids:
    print(x_train, y_label)
# DataLoader进行数据封装
print('=' * 80)
train_loader = DataLoader(dataset=train_ids, batch_size=4, shuffle=True)
for i, data in enumerate(train_loader, 1):  # 注意enumerate返回值有两个,一个是序号，一个是数据（包含训练数据和标签）
    x_data, label = data
    print(' batch:{0} x_data:{1}  label: {2}'.format(i, x_data, label))

　输出结果：

DataLoader

DataLoader就是用来包装所使用的数据，每次抛出一批数据，作为迭代器使用

import torch
import torch.utils.data as Data
BATCH_SIZE = 5
# linspace, 生成1到10的10个数构成的等差数列
x = torch.linspace(1, 10, 10)
y = torch.linspace(10, 1, 10)

# 把数据放在数据库中
torch_dataset = Data.TensorDataset(x, y)
# 从数据库中每次抽出batch size个样本
loader = Data.DataLoader(dataset=torch_dataset,
                         batch_size=BATCH_SIZE, # x, y 是相差为1个数为10的等差数列, batch= 5, 遍历loader就只有两个数据
                         shuffle=False, # 不打乱顺序,便于查看
                         num_workers=0)

def show_batch():
    for step, (batch_x, batch_y) in enumerate(loader):
        # training
        print("steop:{}, batch_x:{}, batch_y:{}".format(step, batch_x, batch_y)) #方便输出

if __name__ == '__main__':
    show_batch()

输出结果：

标签：torch,TensorDataset,DataLoader,batch,pytorch,train,data
From： https://www.cnblogs.com/pass-ion/p/16876011.html

pytorch入门
初衷：看不懂论文开源代码参考：B站小土堆(土堆yyds~) PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】_哔哩哔哩_bilibili 1.环境配置参考：(39条消息)win10......
一文读懂 PyTorch 版本 SRGAN训练和测试【CVPR 2017】
????声明:作为全网AI领域干货最多的博主之一，❤️不负光阴不负卿❤️????深度学习：#超分重建、一文读懂????超分重建经典网络SRGAN详尽教程????最近更新：2022年2月28......
使用PyTorch实现简单的AlphaZero的算法（1）：背景和介绍
在本文中，我们将在PyTorch中为ChainReaction[2]游戏从头开始实现DeepMind的AlphaZero[1]。为了使AlphaZero的学习过程更有效，我们还将使用一个相对较新的改进，称为“Playout......
PyTorch实现非极大值抑制(NMS)
NMS即nonmaximumsuppression即非极大抑制，顾名思义就是抑制不是极大值的元素，搜索局部的极大值。在最近几年常见的物体检测算法（包括rcnn、sppnet、fast-rcnn、faster-rcnn......
Pytorch中模型调用
注意：RNN、LSTM的batch_first参数，对于不同的网络层，输入的维度虽然不同，但是通常输入的第一个维度都是batch_size，比如torch.nn.Linear的输入(batch_size,in_features)，torch.nn......
PyTorch笔记：hook的作用
参考自https://zhuanlan.zhihu.com/p/279903361，原始来自：https://towardsdatascience.com/how-to-use-pytorch-hooks-5041d777f904在Module官方文档那片笔记中已经有一部......
PyTorch笔记：如何保存与加载checkpoints
https://pytorch.org/tutorials/recipes/recipes/saving_and_loading_a_general_checkpoint.html保存和加载checkpoints很有帮助。为了保存checkpoints，必须将它们放在......
PyTorch笔记：Python中的state_dict是啥
来自：https://pytorch.org/tutorials/recipes/recipes/what_is_state_dict.html在PyTorch中，可学习的参数都被保存在模型的parameters中，可以通过model.parameters()访问......
PyTorch笔记：Modules官方文档
来自https://pytorch.org/docs/stable/notes/modules.htmlASimpleCustomModuleimporttorchfromtorchimportnnclassMyLinear(nn.Module):def__init__(se......
使用LabVIEW实现基于pytorch的DeepLabv3图像语义分割
前言今天我们一起来看一下如何使用LabVIEW实现语义分割。一、什么是语义分割图像语义分割（semanticsegmentation），从字面意思上理解就是让计算机根据图像的语义来进......

pytorch TensorDataset和DataLoader区别

相关文章

赞助商

阅读排行