ZHCADZ6A April   2024  – August 2024 AM62P , AM62P-Q1

 

  1.   摘要
  2.   2
  3.   商标
  4. 1引言
    1. 1.1 更改 Cortex-A53 时钟频率
  5. 2处理器内核和计算基准测试
    1. 2.1 Dhrystone
    2. 2.2 CoreMark-Pro
    3. 2.3 快速傅里叶变换
    4. 2.4 加密基准测试
    5. 2.5 IPC 邮箱延迟
  6. 3存储器系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
    2. 3.2 临界存储器访问延迟
    3. 3.3 UDMA:DDR 至 DDR 数据复制
  7. 4图形处理单元基准测试
    1. 4.1 Glmark2
    2. 4.2 GFXBench5
  8. 5视频编解码器
  9. 6参考资料
  10. 7修订历史记录

Dhrystone

Dhrystone 基准测试侧重于处理器内核性能。该基准测试在所有现代处理器中均采用预加载 L1 高速缓存运行。该基准测试随时钟速度的增加而线性增加。虽然该基准测试于 1984 年由 Reinhold P. Weicker 引入,但 Dhrystone 至今仍用于嵌入式处理。业界已采用 VAX 11/780 作为参考 1 MIPS 机器。VAX 11/780 每秒可达到 1757 Dhrystones。计算分数时,通过参考 1MIPS 机器的分数 (1757),对基准测试循环运行的时间进行归一化。由于分数随时钟速度的增加而线性增加,常见问题被进一步归一化为 DMIPS/MHz/内核。对于标准 Arm 内核,在相同的编译器和标志中,DMIPS/MHz 将是相同的。Dhrystone 是一个单核基准测试,有时会使用多个简单内核并行运行此基准测试。

Dhrystone(版本 2.1,C 语言)基准测试包含在 SDK 中,只需运行命令 dhrystone 即可执行。由于执行时间短,TI 建议运行大量迭代测试以测量准确的结果。在为 Arm-Cortex-A53 实施的测试中使用了 1 亿多次迭代。下面的代码块展示了用于 Dhrystone 基准执行的终端打印输出的简短版本。

root@am62pxx-evm:~# dhrystone
	
Dhrystone Benchmark, Version 2.1 (Language: C)
	
Program compiled without 'register' attribute
	
Please give the number of runs through the benchmark: 100000000
	
Execution starts, 100000000 runs through Dhrystone
Execution ends
	
Final values of the variables used in the benchmark:
.
.
.	
	
Microseconds for one run through Dhrystone:    0.1
Dhrystones per Second:                      7142857.0

表 2-1 展示了此基准测试的结果,其中包含编译器和操作系统详情。AM62Ax 具有四个 A53 内核,以 1.25GHz 和 1.4GHz 运行时的总分数分别为 14,229DMIPS 和 16,261DMIPS。

表 2-1 Dhrystone 基准测试
Arm-Cortex-A53 (1.25GHz) Arm-Cortex-A53 (1.4GHz)
Dhrystones/秒 6,250,000 7,142,857
归一化 dhrystones(除以参考 1MIPS 机器的 1757) 3,557 4,065
每个核心的 DMIPS/MHz ~3 ~3
编译器和标志 GCC 11.4 -march=ARMv8 -O3
操作系统 Linux 6.1.80 (2023)