pytorch 训练模型很慢，卡在数据读取，卡I/O的有效解决方案

时间：2022-10-29 19:31:46浏览次数：74

标签：读取 idx 解决方案 self pitch pytorch speaker text path

多线程加载

在 datalaoder中指定num_works > 0,多线程加载数据集，最大可设置为 cpu 核数
设置 pin_memory = True, 固定内存访问单元，节约内存调度时间
示例如下：

loader = DataLoader(
        dataset,
        batch_size=batch_size * group_size,
        shuffle=True,
        collate_fn=dataset.collate_fn,
        num_workers=2,
        pin_memory=True,
    )

预加载数据集

说别的都没大用，还得是预加载

原理：将整个数据集预先 load 到内存单元中，读取则直接访问内存，不存在与磁盘的I/O问题
构建自己的dataset类
示例如下：

class My_Dataset(Dataset):
    def __init__(
        self, filename, preprocess_config, train_config, sort=False, drop_last=False
    ):
        self.dataset_name = preprocess_config["dataset"]
        self.preprocessed_path = preprocess_config["path"]["preprocessed_path"]
        self.cleaners = preprocess_config["preprocessing"]["text"]["text_cleaners"]
        self.batch_size = train_config["optimizer"]["batch_size"]

        self.basename, self.speaker, self.text, self.raw_text = self.process_meta(
            filename
        )
        with open(os.path.join(self.preprocessed_path, "speakers.json")) as f:
            self.speaker_map = json.load(f)
        self.sort = sort
        self.drop_last = drop_last
        # add
        self.mel_list = []
        self.pitch_list = []
        self.energy_list = []
        self.duration_list = []
        for idx in range(len(self.text)):
            basename = self.basename[idx]
            speaker = self.speaker[idx]
            mel_path = os.path.join(
            self.preprocessed_path,
            "mel",
            "{}-mel-{}.npy".format(speaker, basename),
            )
            mel = np.load(mel_path)
            pitch_path = os.path.join(
                self.preprocessed_path,
                "pitch",
                "{}-pitch-{}.npy".format(speaker, basename),
            )
            pitch = np.load(pitch_path)
            energy_path = os.path.join(
                self.preprocessed_path,
                "energy",
                "{}-energy-{}.npy".format(speaker, basename),
            )
            energy = np.load(energy_path)
            duration_path = os.path.join(
                self.preprocessed_path,
                "duration",
                "{}-duration-{}.npy".format(speaker, basename),
            )
            duration = np.load(duration_path)
            self.mel_list.append(mel)
            self.pitch_list.append(pitch)
            self.energy_list.append(energy)
            self.duration_list.append(duration)

    def __len__(self):
        return len(self.text)

    def __getitem__(self, idx):
        basename = self.basename[idx]
        speaker = self.speaker[idx]
        speaker_id = self.speaker_map[speaker]
        raw_text = self.raw_text[idx]
        phone = np.array(text_to_sequence(self.text[idx], self.cleaners))
        
        mel = self.mel_list[idx]
        pitch = self.pitch_list[idx]       
        energy = self.energy_list[idx]        
        duration = self.duration_list[idx]

        sample = {
            "id": basename,
            "speaker": speaker_id,
            "text": phone,
            "raw_text": raw_text,
            "mel": mel,
            "pitch": pitch,
            "energy": energy,
            "duration": duration,
        }

        return sample

在 __init__函数里，即将所有数据load进内存
__getitem__(self, idx):函数，则直接通过列表idx访问每一条数据

标签：读取,idx,解决方案,self,pitch,pytorch,speaker,text,path
From： https://blog.51cto.com/u_15365984/5806481

GTX1050 安装GPU版pytorch流程
版本安装情况Windows10+NVIDIAGTX1050（笔记本版）+ DriverVersion:471.41+CUDA10.1+python3.7+conda4.10.1+pytorch1.7.1Anaconda安装官网进行下载：ht......
【多服务场景化解决方案】AR虚拟技术助力智能家装
1、介绍总览本应用采用了华为图形引擎服务的AR虚拟技术，您可以在手机相机里摆放想要购置的家具家电，交互式体验让您可以轻松操控它们的3D图例，以此来确定这些家具家......
Python读取单元格中数据如000008，读出来后就变成了8，怎么破？
大家好，我是皮皮。一、前言前几天在Python星耀交流群【此类生物】问了一个Python数据处理的问题，提问截图如下：下面是他的数据：二、实现过程这里【甯同学】提出在前面进......
（文件操作）读取文本文件ANSI(GBK).txt中前n行内容并显示（该文件内容按GBK格式保存），n由键盘
样例输入4 样例输出(1)静夜思李白床前明月光，疑是地上霜。样例输入6 样例输出(1)静夜思李白床前明月光，疑是地上霜。举头望明月，低头思故乡。......
PyTorch: 张量的拼接、切分、索引
本文已收录于Pytorch系列专栏：Pytorch入门与实践专栏旨在详解Pytorch，精炼地总结重点，面向入门学习者，掌握Pytorch框架，为数据分析，机器学习及深度学习的代码能力打下......
docker 中 apt-get update 失败解决方案
1.更换apt的镜像源1.1进入目录cd/etc/apt1.2备份源文件cp/etc/apt/sources.list/etc/apt/sources.list.bak1.3更改镜像源cat<<EOF>/etc/apt/sources.listde......
vscode中文乱码问题及几种常见的解决方案
问题原因：代码文件的字符编码格式为UTF-8，但是terminal的字符编码格式为GBK。解决思路：统一代码文件和terminal的字符编码格式。解决办法方法1：通过编码重新打开，选择G......
PyTorch ：了解Tensor(张量)及其创建方法
本文已收录于Pytorch系列专栏：Pytorch入门与实践专栏旨在详解Pytorch，精炼地总结重点，面向入门学习者，掌握Pytorch框架，为数据分析，机器学习及深度学习的代码能力打下......
企业vr产品开发的解决方案-深圳华锐视点
伴随着VR全景技术成熟，我们的场景交互方式也越来越丰富，在其他线上展示方面，企业VR开发可以应用到博物馆、学校、景区、园区、工厂等场所。VR旅游将VR虚拟现实......
企业级自定义表单引擎解决方案（十五）--前端开源说明
一直做后端开发，前端还真不是强项，半桶水的样子，好在现在前端框架和组件层出不穷，基本上勉强可以上路。自定义表单对前端要求非常高，技术上的难度不亚于后端，而且要考虑扩展性......

pytorch 训练模型很慢，卡在数据读取，卡I/O的有效解决方案

多线程加载

预加载数据集

相关文章

赞助商

阅读排行