ZHCU881D May 2020 – May 2024
C7000 CPU DSP 架构是米6体育平台手机版_好二三四 (TI) 最新的高性能数字信号处理器 (DSP)。其配备在某些米6体育平台手机版_好二三四 (TI) Keystone 3 器件中。这种超长指令字 (VLIW) DSP 因其宽矢量指令和多个功能单元而拥有显著的数学处理能力。本优化指南可以帮助开发人员实现 C7000 DSP 的最高性能。
当集成到更大的 TI 器件(例如一些 Keystone 3 器件)时,C7000 往往与矩阵乘法加速器 (MMA) 搭配使用,这样,可显著提高某些机器学习网络的性能。我们建议使用 TI 深度学习库,已对其进行经优以便使用矩阵乘法加速器。TI 深度学习库是 Processor(处理器) SDK 的一部分。
C7000 DSP 拥有矢量 (SIMD) 指令,根据数据类型和 C7000 CPU 版本,该指令能够在单条指令中执行多达 64 个操作。C7000 DSP 内核上几乎所有的计算指令都是完全流水线作业,这意味着在每个时钟周期均可启动独立指令。矢量指令与流水线行为的组合允许您在每个周期中进行大量的计算。C7000 DSP 内核具备定点和浮点矢量指令。
每个 C7000 DSP 内核都有若干功能单元。在每个时钟周期中,每个功能单元可以执行一条独立指令。在本指南中,重点介绍第一代 C7000 DSP 内核(C7100 和 C7120)。由于 C7100 和 C7120 DSP 内核有 13 个功能单元,因此每个时钟周期可执行 13 条指令。在现实中,一些功能单元专门用于执行某些类型的指令,因此出于这样或那样的原因,通常在每个周期中并非所有的 13 个功能单元都在执行指令。
有关 C7000 指令集的更多信息,请参阅 C71x DSP CPU、指令集和矩阵乘法加速器技术参考手册 (SPRUIP0)。