pytorch dataloader加速

举报
风吹稻花香 发表于 2021/06/04 22:28:04 2021/06/04
【摘要】   Pytorch IO提速 1. 把内存变成硬盘,把需要读的数据塞到里面去,加快了io。   Optimizing PyTorch training code 如何给你PyTorch里的Dataloader打鸡血 轻轻松松为你的Linux系统创建RAM Disk 把内存当硬盘,提速你的linux系统 Linux创建使用内存硬盘(RAM DISK)...

 

Pytorch IO提速
1. 把内存变成硬盘,把需要读的数据塞到里面去,加快了io。

 

Optimizing PyTorch training code
如何给你PyTorch里的Dataloader打鸡血
轻轻松松为你的Linux系统创建RAM Disk
把内存当硬盘,提速你的linux系统

Linux创建使用内存硬盘(RAM DISK)
 

2. 使用英伟达的 NVIDIA/DALI 模块

A library containing both highly optimized building blocks and an execution engine for data pre-processing in deep learning applications

Pytorch_example

博客: Introducing GPU Instances: Using Deep Learning to Obtain Frontal Rendering of Facial Images
DALI 文档 : dali-pytorch
 
3. 使用英伟达的 NVIDIA/apex 模块

 

 

4. 将原始图像保存为pt或hdf5文件

hdf5: Saving and loading a large number of images (data) into a single HDF5 file  (图片转换成HDF5文件(加载,保存))
pt : https://discuss.pytorch.org/t/how-to-speed-up-the-data-loader/13740/3

 

 

5.  将原始数据保存为lmdb格式

博客:Efficiently processing large image datasets in Python

 

 

6.  Python简易实现并行操作

一行 Python 代码实现并行 

文章来源: blog.csdn.net,作者:网奇,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/jacke121/article/details/108935002

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。