ZHCACB1 February   2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1

 

  1.   摘要
  2.   商标
  3. 1引言
    1. 1.1 更改 Cortex-A53 时钟频率
  4. 2处理器内核基准测试
    1. 2.1 Dhrystone
  5. 3计算和存储系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
      3. 3.1.3 临界存储器访问延迟
    2. 3.2 CoreMark-Pro
    3. 3.3 快速傅里叶变换
    4. 3.4 加密基准测试
  6. 4应用基准测试
    1. 4.1 机器学习推理
  7. 5参考文献

Dhrystone

Dhrystone 基准测试侧重于处理器内核性能。它在所有现代处理器中均采用热 L1 缓存运行。该测试程序随时钟速度的增加而线性增加。虽然该基准测试于 1984 年由 Reinhold P. Weicker 引入,但 Dhrystone 至今仍用于嵌入式处理。业界已采用 VAX 11/780 作为参考 1 MIPS 机器。VAX 11/780 每秒可达到 1757 Dhrystones。计算分数时,通过参考 1 MIPS 机器的分数 (1757),对运行基准循环的时间进行标准化。由于分数随时钟速度的增加而线性增加,通常进一步标准化为 DMIPS/MHz/内核。对于标准 Arm 内核,在相同的编译器和标志中,DMIPS/MHz 将是相同的。Dhrystone 是一个单核基准测试,有时会使用多个简单内核并行运行此基准测试。

Dhrystone(版本 2.1,C 语言)基准测试包含在 SDK 中。只需运行 dhrystone 命令即可执行它。由于执行时间短,建议运行大量迭代测试以测量准确的结果。在为 Arm-Cortex-A53 实施的测试中使用了 1 亿多次迭代。下面的代码块展示了用于 Dhrystone 基准执行的终端打印输出的简短版本。

root@am62axx-evm:~# dhrystone
	
Dhrystone Benchmark, Version 2.1 (Language: C)
	
Program compiled without 'register' attribute
	
Please give the number of runs through the benchmark: 100000000
	
Execution starts, 100000000 runs through Dhrystone
Execution ends
	
Final values of the variables used in the benchmark:  
.
.
.
Microseconds for one run through Dhrystone:    0.1
Dhrystones per Second:                      7142857.0

表 2-1 展示了此基准测试的结果,其中包含编译器和操作系统详情。 AM62Ax 具有四个以 1.25GHz 和 1.4GHz 运行的 A53 内核,其总分数分别为 14,880 DMIPS 和 16,261 DMIPS。

表 2-1 Dhrystone 基准测试
Arm-Cortex-A53(1.25GHz) Arm-Cortex-A53 (1.4GHz)
Dhrystones/s 6,535,947 7,142,857
标准化 Dhrystones(除以参考 1 1MIPS 机器的分数 1757) 3,720 4,065
每个核心的 DMIPS/MHz ~3 ~3
编译器和标志 GCC 9.2 -march=ARMv8 -O3
操作系统 Linux 5.10 (2021 LTS)