Py之h5py:Python库之h5py库的简介、安装、使用方法详细攻略

举报
一个处女座的程序猿 发表于 2021/03/30 04:18:42 2021/03/30
【摘要】 Py之h5py:Python库之h5py库的简介、安装、使用方法详细攻略       目录 h5py的简介 Websites Installation Reporting bugs h5py的安装 h5py的使用方法 1、写入数据 2、读取数据         h5py的简介       使用h5py库读写超过内存的大数据 。在简单数据的...

Py之h5py:Python库之h5py库的简介、安装、使用方法详细攻略

 

 

 

目录

h5py的简介

Websites

Installation

Reporting bugs

h5py的安装

h5py的使用方法

1、写入数据

2、读取数据


 

 

 

 

h5py的简介

      使用h5py库读写超过内存的大数据 。在简单数据的读操作中,我们通常一次性把数据全部读入到内存中。读写超过内存的大数据时,有别于简单数据的读写操作,受限于内存大小,通常需要指定位置、指定区域读写操作,避免无关数据的读写。  h5py库刚好可以实现这一功能。
      h5py的优势:速度快、压缩效率高,总之,numpy.savez和cPickle存储work或不work的都可以试一试h5py!h5py文件是存放两类对象的容器,数据集(dataset)和组(group),dataset类似数组类的数据集合,和numpy的数组差不多。group是像文件夹一样的容器,它好比python中的字典,有键(key)和值(value)。group中可以存放dataset或者其他的group。”键”就是组成员的名称,”值”就是组成员对象本身(组或者数据集),下面来看下如何创建组和数据集。

相关文章HDF5 for Python

 

      h5py is a thin, pythonic wrapper around the HDF5, which runs on Python 3 (3.6+).

Websites

Installation

Pre-build h5py can either be installed via your Python Distribution (e.g. Continuum AnacondaEnthought Canopy) or from PyPI via pip. h5py is also distributed in many Linux Distributions (e.g. Ubuntu, Fedora), and in the MacOS package managers HomebrewMacports, or Fink.

More detailed installation instructions, including how to install h5py with MPI support, can be found at: https://docs.h5py.org/en/latest/build.html.

Reporting bugs

Open a bug at https://github.com/h5py/h5py/issues. For general questions, ask on the list (https://groups.google.com/d/forum/h5py).

 

 

h5py的安装

pip install h5py

安装成功!哈哈,继续学习去啦!

 

h5py的使用方法

后期更新……

1、写入数据


  
  1. import h5py
  2. """
  3.     create_dataset : 新建 dataset
  4.     create_group : 新建 group
  5. """
  6. x = np.arange(100)
  7. with h5py.File('test.h5','w') as f:
  8.     f.create_dataset('test_numpy',data=x)
  9.     subgroup = f.create_group('subgroup')
  10.     subgroup.create_dataset('test_numpy',data=x)
  11.     subsub = subgroup.create_group('subsub')
  12.     subsub.create_dataset('test_numpy',data=x)

 

2、读取数据


  
  1. """
  2. keys() : 获取本文件夹下所有的文件及文件夹的名字
  3. f['key_name'] : 获取对应的对象
  4. """
  5. def read_data(filename):
  6. with h5py.File(filename,'r') as f:
  7. def print_name(name):
  8. print(name)
  9. f.visit(print_name)
  10. print('---------------------------------------')
  11. subgroup = f['subgroup']
  12. print(subgroup.keys())
  13. print('---------------------------------------')
  14. dset = f['test_numpy']
  15. print(dset)
  16. print(dset.name)
  17. print(dset.shape)
  18. print(dset.dtype)
  19. print(dset[:])
  20. print('---------------------------------------')
  21. read_data('test.h5')

 

 

参考文章
h5py 必知--String存储

 

 

 

 

 

 

 

文章来源: yunyaniu.blog.csdn.net,作者:一个处女座的程序猿,版权归原作者所有,如需转载,请联系作者。

原文链接:yunyaniu.blog.csdn.net/article/details/79682551

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。