NVIDIA显卡硬件技术交流整理

举报
zuozewei 发表于 2021/10/31 23:56:12 2021/10/31
【摘要】 NVIDIA显卡硬件技术交流整理


跨工作站显卡资源共享

目前万兆网卡,但是不推荐window平台,一般使用在服务器,目前是压缩数据包方式。一个4k/帧大概为4MB

· RDMA技术

  • 对硬件有哪些限制,能否用于以太网络?
  • 是否依赖网络带宽限制,能否达到网络带宽的极限传输速率?
  • 使用什么协议传输数据,是否可靠?
  • RDMA接收到的数据能否直接被其他进程使用,例如:Unity3D?
  • 单机多卡是否对RDMA的传输速率有影响?

答:推荐IB网

· 是否有其他方式可以实现跨工作站的显存数据共享?

答:暂无,只能底层优化才能解决。

· 硬编码技术

o 视频编码H264、H265能否结合RDMA使用?

   答:两者没有关系,不能直接硬编码完码流直接传输到另一台工作站显卡内,中间必须过CPU。比如现在海康都没有这样的成功案例。国外一个研究机构使用FPGA的工具,直接拍,直接接卡上的芯片,直接PCI传送出去。吞吐量几百万张照片/每秒。

o 目前单卡对H264、H265的编解码带宽最高是多少?

答:后续给资料

o 单机多卡对编解码的带宽提升是否是倍增,例如:单卡编码带宽为160Mbps,双

卡则为320Mbps?

答:多显卡编码芯片均可使用,独立控制,负载均衡,建议放到一块CPU上(同一个CPU插槽上管理)

o 显卡的硬解码速率是否高于硬编码,即:硬解码带宽高于硬编码带宽?

答:看具体使用的芯片

o 显卡在进行硬编码、硬解码时是否会占用显卡显存?

答:不看显存,占用的是CUDA核心(显卡负载会有变化);专用于硬件码的推荐Tesla p4(使用在后端),

如果GPU利用率变化不大,可能是你的编码率不是特别高。

不同显卡硬解能力不一样

o 显卡硬编码、硬解码的分辨率是否有限制,16384?

答:目前最高8K,非标分辨率可能不支持

专业卡与游戏卡的区别

· 在使用DX执行GPU计算并拷贝数据到内存时,专业卡执行时间稳定,但游戏卡波动较大(1080Ti),游戏卡是否具备动态超频的特性?

答:专业卡固定频率运行,游戏卡动态频率运行,专业卡稳定;(驱动层面差别),游戏卡会出现驱动崩溃、程序卡死、蓝屏、最坏是卡烧掉。

N卡游戏卡比A卡数据要好看

Dx的应用在游戏卡上跑,肯定是不如专业卡的

Mosaic拼接在N卡所有功能里面属于几个小功能,游戏卡不具备这个功能

· 显卡是否具有类似于CPU时钟的功能,可用于跨工作站的帧同步?

答:基于底层开发和利用同步卡进行多工作站同步

单工作站多显卡

· 使用DX渲染图形时,如何利用多卡对性能进行提升?

答:多卡是自动做负载均衡的,建议安装在同一CPU管理的PCI-E插槽

Cuda Nccl GPU多卡优化库


· 若DX渲染的图形跨了显卡,是否对性能有影响,即:一半的图形在A卡上,另一

半在B卡上?

答:无,多卡是自动做负载均衡的,并发处理的。


· 若使用一张卡(A)做计算,一张卡做渲染(B),当A卡计算完的数据需要拷贝到B卡时,是否需要从系统内存中转?

答:需要


硬件使用选型


1) P6000可以同时出几路8K30hz?并且是否可同时进行Mosaic?P6000/5000/4000/2000显卡如何选择?

答:可输出4路8K(dp1.4),并可进行Mosaic拼接,显卡负载不到100%,目前压力不大,NVIDIA的显卡DX性能要弱于AMD


2) 双P6000显卡性能是否是双倍提升?

答:双卡性能提示,后续给网站可查询官方公布数据,显存每块各自占用,并行处理

需补充数据


3) NVIDIA Quadro显卡单工作站多块显卡拼接时是否需要同步卡?

答:需要同步卡,Win10;同步卡主要解决多个显卡通道的同步;(有可能与软件也有关系)


4) Mosaic拼接可做的最大分辨率是?

答:linux可做到32K;Windows10,需确认后回复


5) Mosaic拼接和主桌面+扩展桌面两种模式下相同的使用模式,显卡压力是否有区别;

答:显卡处理方式不一样,Mosaic压力变大,更耗资源(整个桌面被拉大,GPU性能吃的更多,多线程与单线程 GPU核心处理上的差异)


6) DP转成HDMI后进行Mosaic拼接对线材有什么要求?(包括DP转双链路DVI和DP转HDMI1.4/2.0)

答:DP转HDMI需要被动式(只是针对P系列),被动式DVI,目前无推荐品牌型号(最好先接自带的线再进行转接)


7) Mosaic拼接后屏幕闪,拼接缝隙撕裂,不同步卡,造成类似问题的原因有哪些?

答:屏幕接口,线材,需实际进行排查测试


8) 对显卡性能影响最大的因素是?(Mosaic后的分辨率?刷新率?其他等);

答:多方因素,都有影响


9) HP、联想、DELL的工作站双显卡可以不用同步卡?

答:需要,都需要解决通道间的同步

HP、联想、DELL的工作站是属于OEM渠道

丽台是走中国区企业级渠道


10) 驱动是从NVIDIA官网下还是从工作站官网下?版本最新即可?

答:官网,最新


11) 在Win7、Win8.1和Win10中Mosaic后性能不同,是否全是Windows系统自身优化的原因?

答:Windows的毛玻璃,透明效果造成撕裂等,Win10系统更新优化同时,显卡驱动也和系统做了对接优化,进而提升了性能和效果


12) 显卡驱动设置中是否有可以的优化的设置?

答:不建议调,可能会对其他程序有影响


13) 自定义分辨率的刷新率高低会对实际的业务应用有多大影响?对显卡的压力是否有区别?

答:目前无区别,能测试成功即可


14) Mosaic拼接是否可以使用不同的分辨率来进行Mosaic拼接(AMD专业卡可以,4个通道出来的宽度和高度不一致进行拼接);

答:NVIDIA显卡要求较高,可给NVIDIA提建议,效果甚微


15) 多工作站,多同步卡分布式投屏的同步性优化建议和方法;

可参加CUDA培训对系统优化


16) NVIDIA是否有出6通道显卡的计划(用于拼接屏幕保证通道数量);

答:无,拼接只是NVIDIA的小众功能

NVIDIA专业卡重点力求通道稳,而不是通道数多,重点在于稳定性。

NVIDIA定位为Ai/机器学习引领这个领域,多屏拼接AMD具有优势


17) 专业卡的详细参数哪里查(如,解码能力,编码能力能,常见参数都有,但是编码能力限制查不到);

答:后续给相关资料


18) 驱动显卡设置介绍,如垂直同步等驱动是否需要做设置?

答:一般不用设置


其它方面补充:


1)产品对显卡优化的整体策略:
答:需要提升产品对显卡性能的利用(完全发挥显卡的性能),不能单纯的升级硬件。这块国外软件利用的比较好,国内软件优化的比较差。

2)目前我们项目上最大的显存利用到18个G,负载80%左右,产品优化的方向?
答:需要基于CUDA的优化,参加CUDA培训
1)显存不够用的情况下,可以使用物理内存缓冲,减少显存使用量,减少显存堆积问题
2)全部调用显卡核心处理器

显存满载,70、80%代表核心没有全部利用,可能传输那个地方存在瓶颈
渲染算法的差别:
1)传统渲染算法
2)AI算法神经网络方式分布式渲染
AI算法提速5倍以上,大大降低CUDA计算量和线程使用率(方格图像算法)

3)A卡与N卡的侧重点不一样:
N卡重点在opengl,同时也支持dx,会考虑均衡
A卡重点在dx

4)A卡、N卡在视频硬解是存在区别的
可考虑后端方面进行优化,比如硬解

5)P6000,p5000区别
1)P6000->AI算法,深度学习领域
2)p5000Cuda核心数2650  P600Cuda核心数03860

Cuda Nccl GPU分布式并行GPU计算优化库

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200