ZHCSDR5B March 2012 – April 2015 TMS320C6654
PRODUCTION DATA.
TI 的 Keystone 多核结构提供了一个高性能结构,此结构将精简指令集 (RISC) 和 DSP 内核与应用专用协处理器和 I/O 集成在一起。Keystone 是第一个为到所有处理内核、外设、协处理器、和 I/O 的无阻塞访问提供足够内部带宽的结构。它通过四个主要的硬件元件实现这一功能:多核导航器,TeraNet,多核共享内存控制器,和超链接。
多内核导航器是一款基于包的创新管理器,可控制 8192 个队列。 在把各种任务分发给这些队列时,多核导航器可提供硬件加速分发功能,将任务导向可用的适当硬件。 这种基于数据包的片上系统 (SoC) 使用容量达 2Tbp 的 TeraNet 交换中央资源来传输数据包。 凭借多核共享存储器控制器,处理内核无需借助于 TeraNet 即可直接访问共享存储器,因此访问存储器时不会影响数据包的传输。
HyperLink 可提供 40Gbaud 芯片级互连,实现 SoC 串联工作。 其具有低协议开销和高吞吐量等优势,是芯片间互连的理想接口。 HyperLink 通过与多内核导航器协作,可将任务透明地分发给串联器件,而任务的执行就如同在本地资源上运行一样。
C6654 DSP 是一款基于 TI 的 KeyStone 多核架构的最高性能定点/浮点 DSP。 该器件集成了创新的 C66x DSP 内核,可以高达 850MHz 的内核速度运行。 TI 的 C6654 DSP 提供了处理频率高达 850MHz 的累加 DSP,并实现了一套易于使用的低功耗平台,可供关键任务、医疗成像、测试和自动化等诸多需要高性能的应用领域的开发人员使用。 此外,它还完全向后兼容所有现有的 C6000 系列定点和浮点 DSP。
TI 的 KeyStone 架构提供了一套集成有各类子系统(C66x 内核、存储器子系统、外设和加速器)的可编程平台,并且采用多种创新组件和技术来最大限度改善器件内和器件间的通信,使得各种 DSP 资源能够高效且无缝地运作。 这一架构的核心是诸如多内核导航器的关键组件,这些组件可实现多种组件间的高效数据管理。 TeraNet 是一种可实现快速且无竞争的内部数据移动的无阻塞交换结构。 多内核共享存储器控制器可在不使用交换结构功能的情况下访问共享存储器和外部存储器。
对于定点运算,C66x 内核的乘积累加 (MAC) 计算能力是 C64x+ 内核的 4 倍。 此外,C66x 内核集成了浮点运算能力,原始计算性能处于行业领先水平,在 850MHz 工作频率下,每个内核能够达到 27.2GMACS 和 13.6GFLOPS。 该内核每个周期能够执行 8 次单精度浮点 MAC 运算,并且可执行双精度和混合精度运算,同时符合 IEEE754 标准。 C66x 新增了 90 条指令(相比 C64x+ 内核),主要针对浮点运算和面向向量数学的处理。 上述性能改进大大提升了常见 DSP 内核在信号处理、数学运算和图像采集功能方面的性能。 C66x 内核代码向后兼容 TI 的上一代 C6000 定点和浮点 DSP 内核,确保了软件的可移植性并缩短了软件开发周期,以便将应用程序移植到更快的硬件中。
C6654 DSP 集成了大量的片上存储器。 除了 32KB 的 L1 程序和数据缓存之外,每个内核还有 1024KB 的专用存储器,可配置为映射的 RAM 或缓存。 所有 L2 存储器均包含检错与纠错功能。 该器件包含一个以 1066MHz 频率运行的 32 位 DDR-3 外部存储器接口 (EMIF),用于快速访问外部存储器。
该系列支持多种高速标准接口,、PCI Express Gen2 和千兆以太网。 它还包括 I2C、UART、多通道缓冲串行端口 (McBSP)、通用并行端口和一个 16 位异步 EMIF 以及通用 CMOS IO。
C6654 器件具有一套完整的开发工具,其中包括一个增强型 C 编译器、一个用于简化编程和调度过程的汇编优化器,以及一个用于查看源代码执行的 Windows® 调试器接口。