ZHCACB1 February   2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1

 

  1.   摘要
  2.   商标
  3. 1引言
    1. 1.1 更改 Cortex-A53 时钟频率
  4. 2处理器内核基准测试
    1. 2.1 Dhrystone
  5. 3计算和存储系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
      3. 3.1.3 临界存储器访问延迟
    2. 3.2 CoreMark-Pro
    3. 3.3 快速傅里叶变换
    4. 3.4 加密基准测试
  6. 4应用基准测试
    1. 4.1 机器学习推理
  7. 5参考文献

机器学习推理

EdgeAI 云将提供 AM62Ax 上 2TOPS 深度学习加速器(具有 MMA 的 C7x 256v)上的综合机器学习性能数字:Edge AI (ti.com)

TensorFlow Lite 用于在边缘深度学习推理中测试 Arm-Cortex-A53 处理器的性能。以下示例为运行两次 TensorFlow Lite 模型,根据 ImageNet 数据库和 1000 种物体类别进行图像分类(224 x 224 像素,3 字节颜色)。选择量化 Mobilenetv1 和浮点 Mobilenetv2 作为共同基准,可用于内插计算推理应用的性能。这些模型在 SDK 中不可用。TensorFlow Lite 分类器和模型 (1.15-R5.0) 是从官方托管网站 tensorflow.org 下载的。海军少将葛丽丝·霍普 (Grace Hopper) 的示例图像安装在文件系统中(可点击访问)。示例 label_image 程序在调用 TensorFlow Lite 之前裁剪并调整 bmp 图像大小为 224 x 224 像素。下面的代码块展示了 Mobilenetv1 (mobilenet_v1_1.0_224_quant.tflite) 和 Mobilenetv2 (mobilenet_v2_1.0_224.tflite) 模型对相同图像分辨率 (224x224x3) 进行推理执行的终端打印输出。

root@am62axx-evm:/usr/share/tensorflow-lite/examples# ./label_image -i grace_hopper.bmp -l labels.txt -m mobilenet_v1_1.0_224_quant.tflite
Loaded model mobilenet_v1_1.0_224_quant.tflite
resolved reporter
invoked
average time: 56.945 ms
0.780392: 653 military uniform
0.105882: 907 Windsor tie
0.0156863: 458 bow tie
0.0117647: 466 bulletproof vest
0.00784314: 835 suit

root@am62axx-evm:/usr/share/tensorflow-lite/examples# ./label_image -i grace_hopper.bmp -l labels.txt -m mobilenet_v2_1.0_224.tflite
Loaded model mobilenet_v2_1.0_224.tflite
resolved reporter
invoked
average time: 178.05 ms
0.911345: 653 military uniform
0.014466: 835 suit
0.0062473: 440 bearskin
0.00296661: 907 Windsor tie
0.00269019: 753 racket

为了对 Arm-Cortex-A53 处理器进行全面性能评估,在 1.25GHz 和 1.4GHz 下执行了基准测试。表 4-1 展示了所有测试执行的平均时间。

表 4-1 所有测试执行的平均时间
型号 1.25GHz 时的
Arm-Cortex-A53
1.4GHz 时的
Arm-Cortex-A53
Mobilenetv1 mobilenet_v1_1.0_224_quant.tflite 63.35ms 56.94ms
Mobilenetv2 mobilenet_v2_1.0_224.tflite 192.10ms 178.05ms