ZHCUBL2K January 2018 – March 2024
C7000 主机仿真矩阵乘法加速器 (MMA) 接口与目标硬件上 C7000 编译器使用的接口相同,但有一个重要差异。c7x_mma.h
中提到的所有内在函数和定义也都是针对 C7000 主机仿真定义和实现的,并且可以以相同的方式使用。但是,程序必须通过调用所提供的 _HWAADV() 内在函数来显式指明 MMA 状态何时推进。这是因为与目标硬件不同,为主机仿真的 MMA 不能与 CPU 时钟的概念联系起来。
程序必须跟踪旨在并行执行的指令,并通过在每组“并行”指令之后调用 __HWAADV() 来显式推进 MMA 状态。
为了方便在主机模式和目标模式之间轻松移植,目标编译器将 __HWAADV() 内在函数定义为空宏。