ZHCU881D May 2020 – May 2024
C7100 CPU 有两个流引擎。流引擎是 C7000 CPU 内核的一个特性,有助于将数据从存储器加载到 CPU。流引擎可以将数据从存储器预取到 CPU 附近的位置,从而显著提高存储器层次结构的性能。预取数据可以显著减少数据载入 CPU 所需的时间。它还可以减少 L1 数据缓存容量的未命中次数,因为通过流引擎访问数据时会绕过 L1 缓存。
流引擎支持多达六维地址访问模式。当性能瓶颈涉及到存储器读取时(如果 D 单元资源限制占主导或缓存未命中占主导),如果提前知道存储器中对象的访问模式,请考虑使用一个或两个流引擎。流引擎与手动矢量化的循环结合使用时效果最好。更多有关流引擎和代码示例的信息,请参阅 C71x DSP CPU、指令集和矩阵乘法加速器技术参考手册 (SPRUIP0)、C7000 优化 C/C++ 编译器用户指南 (SPRUIG8) 以及编译器安装目录中的 include
目录下的 c7x_strm.h
文件。
C7000 编译器尚未自动使用流引擎特性。