HPC 软件栈与数据分析软件栈对比

举报
Leo Xiao 发表于 2021/03/12 18:15:55 2021/03/12
【摘要】 HPC 软件栈与数据分析软件栈对比 HPC 软件栈 +------------------------------------------------------------+Application | Applications and community Codes | Level +-------...

HPC 软件栈与数据分析软件栈对比

HPC 软件栈

		          +------------------------------------------------------------+
Application		  |          Applications and community Codes                  |
   Level		  +------------------------------------------------------------+

MiddleWare     +--------------------------------+		            +------+
Management	   | FORTRAN, C, C++, IDE           |		            |      |
			   |                                |		            |      |
			   +--------------------------------+		            |      |
			   +--------------------------------+		            |SCI.V |
			   |  Domain Specific library       |		            |IS.   |
			   |                                |		            |      |
			   +--------------------------------+		            |      |
			   +----------------+ +---------------+	+--------------+|      |
			   |MPI/OPENMP +Acce| |  Numercial    |	|Programming/  ||      |
			   |lerator tools   | |Libraries      |	|Debugging(eg. ||      |
			   |                | |               |	|PAPI)         ||      |
			   +----------------+ +---------------+	+--------------+|      |
			   +----------------+ +---------------+	+--------------+|      |
			   |Lustre(Parallel | | Batch Schedu  |	| System Monit ||      |
			   |File System)    | + ler(eg. SLURM)|	| or Tools     ||      |
			   |                | |               |	|              ||      |
			   +----------------+ +---------------+	+--------------++------+
-----------------------------------------------------------------------------------------
System 	  	   +---------------------------------------------------+
Software	   | Containers (Singularity, Shifter, etc.)           |
			   |                                                   |
			   +---------------------------------------------------+
			   +---------------------------------------------------+
			   |             Linux OS Variant                      |
			   |                                                   |
			   +---------------------------------------------------+
-----------------------------------------------------------------------------------------
Cluster 	   +---------------+ +----------+ +----------+ +-------+
Hardware	   | Infiniband +  | |Local +   | | X86 Rack+| |In-Situ|
			   | Eth Switches  | | SAN      | |GPU or .. | |Proce. |
			   +---------------+ +----------+ +----------+ +-------+

数据分析软件栈

		          +------------------------------------------------------------+
Application		  |         Manhout R and Applications                         |
   Level		  +------------------------------------------------------------+

MiddleWare+------+     +------------+ +------------+ +--------+		        +------+
Management|      |     |   HIVE     | | PIG        | |FLUME   |		        |      |
	      |      |     |            | |            | |        |		        |      |
	      |      |     +------------+ +------------+ +--------+		        |      |
	      |      |                                       			        |Zooke |
	      |      |     +------------+ +------------+   +------------------+	|eper( |
	      | cloud|     |MAPREDUCE   | |  STORM     |   |     SQOOP        |	|coordi|
	      |serv  |     |            | |            |   |                  | |nation|
	      |      |     +------------+ +------------+   +------------------+ |      |
	      |      |     +---------------------------------------------------+|      |
	      |      |     |                   YARN                            ||      |
	      |      |     +---------------------------------------------------+|      |
	      |      |     +---------------------------------------------------+|      |
	      |      |     |             HBASE Bigtable(KV Store)              ||      |
	      |      |	   +---------------------------------------------------+
	      |      |     +---------------------------------------------------+|      |
	      |      |     |                HDFS                               ||      |
	      |      |     +---------------------------------------------------++------+
---------------------------------------------------------------------------------------
System    |      |     +---------------------------------------------------+
Software  |      |     |       Virtual Machine and CLoud Service Container |
	      |      |     |                                                   |
	      |      |     +---------------------------------------------------+
	      |      |     +---------------------------------------------------+
	      |      |     |             Linux OS Variant                      |
	      +------+     |                                                   |
			           +---------------------------------------------------+
-----------------------------------------------------------------------------------------
Cluster	       +---------------+  +--------------+	 +-----------------+
Hardware	   | Ethenet       |  | Local Storage|	 | X86 Racks       |
			   |   	 Switches  |  |              |	 |                 |
			   +---------------+  +--------------+	 +-----------------+

资源管理诉求差异

对比项 科学与工程计算 企业与商业计算
主要用途 求解方程 查询和搜索
本质差别 向计算发送数据(大数据大计算) 向数据发送计算(小数据小计算)
系统效率来源于 并行计算 分布处理
对可扩展性的期望 强(计算方法,系统性能)
主要编程模型 消息传递(MPI)、共享存储(OpenMP)、 向量(SIMD) Map-reduce, SPMD
主流语言 FORTRAN,C++, Python:强调性能 Java, Scala, Hadoop,Python, R:强调好用
计算特征 数值计算(代数,图形绘制、图像生成/处理等) 非数值计算(集合,关系,图等)
访存特征 可预测,规则 随机,不规则
存储特征 集中式,单副本,POSIX/RAID 分散式,多副本
源文件系统 Lustre, GPFS HDFS,S3, NFS等

数据格式与文件系统差异

对比项 科学与工程计算 企业与商业计算
结构化数据 向量,矩阵,张量 表格,键值,对象
非结构化数据 网格,基于物理的图形和图像 文档,基于拍摄的图片
提取/变换/加载 Fourier, Wavelet, Laplace, 等; Cartesian, Radial, Toroidal, 等 文件格式变换, e.g. CSV to VRML
搜索和查询 周期性、自相似性、异常性等性质 SQL,SPARQL等(通过求和、平均,分组等)
可视化需求 顶点(点云),表面,体 词云、平行坐标,BI工具
训练的数据量 O(GBs~TBs)per sample(单个数据量大), O(103)samples(数据个数相对少), O(10)categories(数据类别相对少) O(KB)per sample(单个数据量小), O(106)samples(数据个数相对多), O(104)categories(数据类别相对多)
数据形式 HDFS, NETCDF 关系,文档,键值
校验方法 交叉验证(ROC曲面,统计学意义) 手工/目标事务专家验证, A/B测试

用户面差异

对比项 科学与工程计算 企业与商业计算
计算/算法模型 领域专用 CNN,RNN,LSTM,GAN等
AI基准应用 由理论模型(如NavierStokes)构建的机器学习算法 基于人的认知模型构建的机器学习算法
并行性来源 模型,全程序 数据,服务请求
应用实例 计算操纵,代理建模 语言,测试图像解释,超个性化
对系统优劣的度量 可解释性,可行性 时效性,精确度,模型规模
硬件设计重点 计算和内存,多节点体系结构,高速互连通信,(如,SSD硬盘),深度优化 存储系统,内部以太网组建,任务容错,低 成本标准部件(如:HDD硬盘),使用简单
用户访问模式 系统登录/开放底层接口;用户对软硬件系统结构特性的深度了解决定重大应用的成败与否 云服务/资源虚拟化;软硬件系统结构特性对 大多数用户是透明的
项目资助模式 非赢利性资助,解决人类重大挑战性问题 (公益性;追求科学意义) 价值驱动,满足中小企业与商业应用需求 (收费使用;成本分摊,追求利益)
运维管理模式 主要依托国家科研机构和高校,长期的政府补贴 公司化运作
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。