ZHCACB1 February   2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1

 

  1.   摘要
  2.   商标
  3. 1引言
    1. 1.1 更改 Cortex-A53 时钟频率
  4. 2处理器内核基准测试
    1. 2.1 Dhrystone
  5. 3计算和存储系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
      3. 3.1.3 临界存储器访问延迟
    2. 3.2 CoreMark-Pro
    3. 3.3 快速傅里叶变换
    4. 3.4 加密基准测试
  6. 4应用基准测试
    1. 4.1 机器学习推理
  7. 5参考文献

临界存储器访问延迟

本节提供从 AM62Ax 中的处理器到系统中的各种存储器目标的读取存储器访问延迟测量。此类测量是在 AM62Ax 平台上使用 SDK 中当前未包含的裸机芯片验证测试进行的。测试在 LPDDR4 之外的 A53、C7x 和 R5F 处理器上执行。每个测试包括一个由 8192 次迭代组成的循环,可读取总计 32KiB 的数据。每个测试的周期数被计数并除以相应的处理器时钟频率以获得延迟时间。表 3-4 展示了平均延迟结果。

表 3-4 A53、C7x、R5F MCU 和 R5F WKUP 的临界存储器访问延迟
存储器 Arm-Cortex-A53
(平均 ns)
C7x DSP(平均 ns) Arm-Cortex-R5F MCU(平均 ns) Arm-Cortex-R5F WKUP(平均 ns)
LPDDR4 137 154 202 172
OCSRAM MAIN 59 57 122 77
OCSRAM MCU 120 118 58 85
OCSRAM WKUP 210 189 203 156
C7X SRAM - 本地路径 不适用 20 不适用 不适用
C7X SRAM - 外部路径 80 不适用 151 103
R5F MCU TCM - 本地路径 不适用 不适用 1 不适用
R5F MCU TCM - 外部路径 143 144 不适用 120
R5F WKUP TCM - 本地路径 不适用 不适用 不适用 1
R5F WKUP TCM - 外部路径 112 108 120 不适用

测试是在 0.75V VDD_CORE 设置(A53:1.25GHz,C7x DSP:1.0GHz 和 R5:800MHz)和 LPDDR4 @3200MT/s 下完成的。