ZHCABI1B February   2022  – January 2024 AM2434 , AM6411 , AM6412 , AM6421 , AM6441 , AM6442

 

  1.   摘要
  2.   2
  3.   商标
  4. 1简介
  5. 2处理器内核基准测试
    1. 2.1 Dhrystone
    2. 2.2 三角函数
  6. 3计算和存储系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
      3. 3.1.3 Cortex-R5 存储器存取延迟
    2. 3.2 CoreMark®-Pro
    3. 3.3 快速傅里叶变换
    4. 3.4 加密基准测试
  7. 4应用基准测试
    1. 4.1 机器学习推理
    2. 4.2 场定向控制 (FOC) 环路
    3. 4.3 使用 BCDMA 时的 PCIE 到 DDR 性能
      1. 4.3.1 测试设置
      2. 4.3.2 结果和观察
    4. 4.4 使用 BCDMA 时的 DDR 到 DDR 性能
      1. 4.4.1 测试设置
      2. 4.4.2 结果和观察
  8. 5参考文献
  9. 6修订历史记录

STREAM

STREAM 是测量数据存储系统性能的微基准测试,无需任何数据重复。它旨在不命中高速缓存,执行数据预取和推测存取。STREAM 使用双精度浮点(64 位),但对于大多数现代处理器而言,存储器存取成为瓶颈。四个单项分数包括 copy(复制)、scale(乘常数)、add(数字相加)及 triad(乘法累加)。对于带宽,每读取一个字节计数为 1,每写入一个字节计数为 1,得到的分数是 LMBench 带宽的两倍。下表显示了相对于理论线速测得的带宽和效率。使用的线速是 DDR MT/s 与宽度的乘积。为了获得总体最大吞吐量,使用命令 stream -M 16M -P 2 -N 10,这意味着两个并行线程和 10 次迭代。

DDR4-1600MT/s-16 位带宽 DDR4-1600MT/s-16 位效率 LPDDR4-1600MT/s-16 位带宽 LPDDR4-1600MT/s-16 位效率
复制 2482MB/s 78% 2221MB/s 69%
乘常数 2516MB/s 79% 2268MB/s 71%
add 2350MB/s 73% 2130MB/s 67%
triad 2355MB/s 74% 2139MB/s 67%