NVIDIA显卡硬件技术交流整理
跨工作站显卡资源共享
目前万兆网卡,但是不推荐window平台,一般使用在服务器,目前是压缩数据包方式。一个4k/帧大概为4MB
· RDMA技术
- 对硬件有哪些限制,能否用于以太网络?
- 是否依赖网络带宽限制,能否达到网络带宽的极限传输速率?
- 使用什么协议传输数据,是否可靠?
- RDMA接收到的数据能否直接被其他进程使用,例如:Unity3D?
- 单机多卡是否对RDMA的传输速率有影响?
答:推荐IB网
· 是否有其他方式可以实现跨工作站的显存数据共享?
答:暂无,只能底层优化才能解决。
· 硬编码技术
o 视频编码H264、H265能否结合RDMA使用?
答:两者没有关系,不能直接硬编码完码流直接传输到另一台工作站显卡内,中间必须过CPU。比如现在海康都没有这样的成功案例。国外一个研究机构使用FPGA的工具,直接拍,直接接卡上的芯片,直接PCI传送出去。吞吐量几百万张照片/每秒。
o 目前单卡对H264、H265的编解码带宽最高是多少?
答:后续给资料
o 单机多卡对编解码的带宽提升是否是倍增,例如:单卡编码带宽为160Mbps,双
卡则为320Mbps?
答:多显卡编码芯片均可使用,独立控制,负载均衡,建议放到一块CPU上(同一个CPU插槽上管理)
o 显卡的硬解码速率是否高于硬编码,即:硬解码带宽高于硬编码带宽?
答:看具体使用的芯片
o 显卡在进行硬编码、硬解码时是否会占用显卡显存?
答:不看显存,占用的是CUDA核心(显卡负载会有变化);专用于硬件码的推荐Tesla p4(使用在后端),
如果GPU利用率变化不大,可能是你的编码率不是特别高。
不同显卡硬解能力不一样。
o 显卡硬编码、硬解码的分辨率是否有限制,16384?
答:目前最高8K,非标分辨率可能不支持
专业卡与游戏卡的区别
· 在使用DX执行GPU计算并拷贝数据到内存时,专业卡执行时间稳定,但游戏卡波动较大(1080Ti),游戏卡是否具备动态超频的特性?
答:专业卡固定频率运行,游戏卡动态频率运行,专业卡稳定;(驱动层面差别),游戏卡会出现驱动崩溃、程序卡死、蓝屏、最坏是卡烧掉。
N卡游戏卡比A卡数据要好看
Dx的应用在游戏卡上跑,肯定是不如专业卡的
Mosaic拼接在N卡所有功能里面属于几个小功能,游戏卡不具备这个功能
· 显卡是否具有类似于CPU时钟的功能,可用于跨工作站的帧同步?
答:基于底层开发和利用同步卡进行多工作站同步
单工作站多显卡
· 使用DX渲染图形时,如何利用多卡对性能进行提升?
答:多卡是自动做负载均衡的,建议安装在同一CPU管理的PCI-E插槽
Cuda Nccl GPU多卡优化库
· 若DX渲染的图形跨了显卡,是否对性能有影响,即:一半的图形在A卡上,另一
半在B卡上?
答:无,多卡是自动做负载均衡的,并发处理的。
· 若使用一张卡(A)做计算,一张卡做渲染(B),当A卡计算完的数据需要拷贝到B卡时,是否需要从系统内存中转?
答:需要
硬件使用选型
1) P6000可以同时出几路8K30hz?并且是否可同时进行Mosaic?P6000/5000/4000/2000显卡如何选择?
答:可输出4路8K(dp1.4),并可进行Mosaic拼接,显卡负载不到100%,目前压力不大,NVIDIA的显卡DX性能要弱于AMD
2) 双P6000显卡性能是否是双倍提升?
答:双卡性能提示,后续给网站可查询官方公布数据,显存每块各自占用,并行处理
需补充数据
3) NVIDIA Quadro显卡单工作站多块显卡拼接时是否需要同步卡?
答:需要同步卡,Win10;同步卡主要解决多个显卡通道的同步;(有可能与软件也有关系)
4) Mosaic拼接可做的最大分辨率是?
答:linux可做到32K;Windows10,需确认后回复
5) Mosaic拼接和主桌面+扩展桌面两种模式下相同的使用模式,显卡压力是否有区别;
答:显卡处理方式不一样,Mosaic压力变大,更耗资源(整个桌面被拉大,GPU性能吃的更多,多线程与单线程 GPU核心处理上的差异)
6) DP转成HDMI后进行Mosaic拼接对线材有什么要求?(包括DP转双链路DVI和DP转HDMI1.4/2.0)
答:DP转HDMI需要被动式(只是针对P系列),被动式DVI,目前无推荐品牌型号(最好先接自带的线再进行转接)
7) Mosaic拼接后屏幕闪,拼接缝隙撕裂,不同步卡,造成类似问题的原因有哪些?
答:屏幕接口,线材,需实际进行排查测试
8) 对显卡性能影响最大的因素是?(Mosaic后的分辨率?刷新率?其他等);
答:多方因素,都有影响
9) HP、联想、DELL的工作站双显卡可以不用同步卡?
答:需要,都需要解决通道间的同步
HP、联想、DELL的工作站是属于OEM渠道
丽台是走中国区企业级渠道
10) 驱动是从NVIDIA官网下还是从工作站官网下?版本最新即可?
答:官网,最新
11) 在Win7、Win8.1和Win10中Mosaic后性能不同,是否全是Windows系统自身优化的原因?
答:Windows的毛玻璃,透明效果造成撕裂等,Win10系统更新优化同时,显卡驱动也和系统做了对接优化,进而提升了性能和效果
12) 显卡驱动设置中是否有可以的优化的设置?
答:不建议调,可能会对其他程序有影响
13) 自定义分辨率的刷新率高低会对实际的业务应用有多大影响?对显卡的压力是否有区别?
答:目前无区别,能测试成功即可
14) Mosaic拼接是否可以使用不同的分辨率来进行Mosaic拼接(AMD专业卡可以,4个通道出来的宽度和高度不一致进行拼接);
答:NVIDIA显卡要求较高,可给NVIDIA提建议,效果甚微
15) 多工作站,多同步卡分布式投屏的同步性优化建议和方法;
答:可参加CUDA培训对系统优化
16) NVIDIA是否有出6通道显卡的计划(用于拼接屏幕保证通道数量);
答:无,拼接只是NVIDIA的小众功能
NVIDIA专业卡重点力求通道稳,而不是通道数多,重点在于稳定性。
NVIDIA定位为Ai/机器学习引领这个领域,多屏拼接AMD具有优势
17) 专业卡的详细参数哪里查(如,解码能力,编码能力能,常见参数都有,但是编码能力限制查不到);
答:后续给相关资料
18) 驱动显卡设置介绍,如垂直同步等驱动是否需要做设置?
答:一般不用设置
其它方面补充:
1)产品对显卡优化的整体策略:
答:需要提升产品对显卡性能的利用(完全发挥显卡的性能),不能单纯的升级硬件。这块国外软件利用的比较好,国内软件优化的比较差。
2)目前我们项目上最大的显存利用到18个G,负载80%左右,产品优化的方向?
答:需要基于CUDA的优化,参加CUDA培训
1)显存不够用的情况下,可以使用物理内存缓冲,减少显存使用量,减少显存堆积问题
2)全部调用显卡核心处理器
显存满载,70、80%代表核心没有全部利用,可能传输那个地方存在瓶颈
渲染算法的差别:
1)传统渲染算法
2)AI算法神经网络方式分布式渲染
AI算法提速5倍以上,大大降低CUDA计算量和线程使用率(方格图像算法)
3)A卡与N卡的侧重点不一样:
N卡重点在opengl,同时也支持dx,会考虑均衡
A卡重点在dx
4)A卡、N卡在视频硬解是存在区别的
可考虑后端方面进行优化,比如硬解
5)P6000,p5000区别
1)P6000->AI算法,深度学习领域
2)p5000Cuda核心数2650 P600Cuda核心数03860
Cuda Nccl GPU分布式并行GPU计算优化库
- 点赞
- 收藏
- 关注作者
评论(0)