在工业领域,DSP将要被ARM淘汰了?ARM + DSP才是更优解?

举报
创龙科技 发表于 2022/05/25 16:37:30 2022/05/25
【摘要】 随着ARM芯片技术的高速更新迭代,越来越多工业应用场景都使用ARM架构实现,ARM既可跑操作系统(Linux、FreeRTOS等)满足复杂应用需求,亦可跑裸机满足高实时等应用需求。由于ARM生态系统十分完善,因此在人机交互、网络通信、文件系统管理方面,有着得天独厚的优势。业界部分开发者当中,曾经有着DSP(数字信号处理器)将要被ARM淘汰的流言。那么,DSP真的要被时代抛弃了吗?暂且让我们先...

随着ARM芯片技术的高速更新迭代,越来越多工业应用场景都使用ARM架构实现,ARM既可跑操作系统(Linux、FreeRTOS等)满足复杂应用需求,亦可跑裸机满足高实时等应用需求。由于ARM生态系统十分完善,因此在人机交互、网络通信、文件系统管理方面,有着得天独厚的优势。

业界部分开发者当中,曾经有着DSP(数字信号处理器)将要被ARM淘汰的流言。那么,DSP真的要被时代抛弃了吗?暂且让我们先来盘一盘DSP的特点与优势吧。

图 1 C66x DSP结构框图

(1)DSP芯片一般采用的是哈佛结构(Havard Structure),可同时对数据和程序进行寻址,大大提高了数据处理能力,非常适合于实时信号处理。TI公司的DSP芯片结构是改进的哈佛结构,改进之处是在数据总线和程序总线之间进行局部的交叉连接,使得允许数据存放在程序存储器中,并被算术运算指令直接使用,增强了芯片的灵活性。

(2)DSP拥有专门的指令集,主要是专门针对数字信号处理的,如通讯和多媒体处理。

(3)DSP采用专用的硬件乘法器以及快速的指令周期,它可在一个指令周期中同时完成一次乘法和一次加法,这非常适合快速傅立叶变换的需求。目前TI公司的C6000系列的C66x DSP处理器工作主频可高达1.25GHz。

(4)浮点运算DSP比定点运算DSP的动态范围要大很多。定点DSP的字长每增加1bit,动态范围过大6dB,32bit浮点运动DSP的动态范围可做到1536dB,不仅大大扩大了动态范围,提高了运算精度,还大大节省了运算时间和存储空间,为复杂算法的实时处理提供了保证。目前TI公司的C6000系列的C66x DSP处理器的浮点可高达22.4GFLOPS。

可以看到,以上DSP优势是ARM所不擅长的。在面对一些需要高速复杂的运算场景,DSP仍然拥有不可替代作用,特别是精密数控系统、机器人控制系统、测试测量仪器、能源电力监测、电力电子技术、音视频处理等工业应用领域

面对这些复杂的应用场景,既需要ARM的强大综合处理能力,又需要DSP的强大数字信号处理能力,因此ARM + DSP也成为了工业领域很多产品的经典架构。而不是部分开发者所认为的ARM即将淘汰DSP,其实DSP一般都已经和ARM架构融合到一个SoC处理器中,各自发挥各自的优势,此时的DSP也更类似ARM的一个协处理器。

TI从2000年开始一直不断推出ARM + DSP架构SoC处理器,从以往的DM6446、DM3730、OMAPL138,到最新的AM5728、AM5708,每一款处理器都在工业应用领域大放光彩,如基于TI Sitara系列AM5728(双核ARM Cortex-A15 +浮点双核DSP C66x) + Xilinx Artix-7 FPGA处理器设计的高端异构多核开发板(TL5728F-EVM)。

TL5728-EasyEVM-A4.jpg-revHEAD.svn000.tmp(1).jpg

下面详细介绍下TI最新ARM + DSP处理器AM5708/AM5728,它们分别由ARM Cortex-A15 + 浮点DSP C66x构成。

芯片硬件资源对比

表 1

AM5728

AM5708

2x ARM Cortex-A15,主频1.5GHz

1x ARM Cortex-A15,主频1GHz

2x DSP C66x,主频750MHz,支持浮点运算

1x DSP C66x,主频750MHz,支持浮点运算

2x IPU(Image Processing Unit),每个IPU子系统含2个ARM Cortex-M4核心,共4个ARM Cortex-M4核心

2x IPU(Image Processing Unit),每个IPU子系统含2个ARM Cortex-M4核心,共4个ARM Cortex-M4核心

2x PRU-ICSS,每个PRU-ICSS子系统含2个PRU(Programmable Real-time Unit)核心,共4个PRU核心

2x PRU-ICSS,每个PRU-ICSS子系统含2个PRU(Programmable Real-time Unit)核心,共4个PRU核心,支持EtherCAT等协议

1x IVA-HD Video Codec,支持1路1080P60 H.264视频硬件编解码

1x IVA-HD Video Codec,支持1路1080P60 H.264视频硬件编解码

2x SGX544 3D GPU图形加速器

1x SGX544 3D GPU图形加速器

1x GC320 2D图形加速器

1x GC320 2D图形加速器

2.5MByte On-Chip Memory

512KByte On-Chip Shared Memory

3x VIP(Video Input Ports),支持8路1080P60视频输入

1x VIP(Video Input Ports),支持4路1080P60视频输入

不支持MIPI

1x MIPI CSI-2(Camera Serial Interface 2)

1x TV OUTPUT,支持HDMI/DPI 1080P60

1x TV OUTPUT,支持HDMI/DPI 1080P60

3x LCD OUTPUT

2x LCD OUTPUT

3x eHRPWM

3x eHRPWM

3x eCAP

3x eCAP

3x eQEP

3x eQEP

1x NMI

1x NMI

1x PCIe Gen2,支持一个双通道端口,或两个单通道端口,每通道最高通信速率5Gbps

1x PCIe Gen2,支持一个双通道端口,或两个单通道端口,每通道最高通信速率5Gbps

1x USB 2.0

1x USB 2.0

1x USB 3.0

1x USB 3.0

2x 10/100/1000M Ethernet

2x 10/100/1000M Ethernet

3x MMC/SD/SDIO

3x eMMC/SD/SDIO

10x UART

10x UART

1x JTAG

1x JTAG

2x Watchdog

2x Watchdog

1x SATA

不支持SATA

1x GPMC

1x GPMC,支持8个片选信号

5x I2C

5x I2C

2x DCAN

2x DCAN

8x McASP

8x McASP

1x QSPI

1x QSPI

4x SPI

4x SPI

核心板满负载功耗:10.1W

核心板满负载功耗:5.1W

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。