ZHCUAQ1F july 2015 – april 2023
如果没有Example5-10 中的 .mptr 指令,a[0-1] 和 b[0-1] 的加载将并行调度,而 a[2-3] 和 b[2-3] 的加载也可能并行调度。这会导致每个周期中有 50% 的几率会发生存储器冲突。但是,Example5-11 中显示的循环内核不会发生存储器组冲突。
在Example5-8 中,如果使用了 .mptr 指令来指定 a 和 b 指向不同的基址,则汇编优化器不会找到 1 周期循环内核的调度,因为总是会发生存储器组冲突。但是,它会找到一个 2 周期循环内核的调度。