ZHCACB1 February 2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1
EdgeAI 云将提供 AM62Ax 上 2TOPS 深度学习加速器(具有 MMA 的 C7x 256v)上的综合机器学习性能数字:Edge AI (ti.com)。
TensorFlow Lite 用于在边缘深度学习推理中测试 Arm-Cortex-A53 处理器的性能。以下示例为运行两次 TensorFlow Lite 模型,根据 ImageNet 数据库和 1000 种物体类别进行图像分类(224 x 224 像素,3 字节颜色)。选择量化 Mobilenetv1 和浮点 Mobilenetv2 作为共同基准,可用于内插计算推理应用的性能。这些模型在 SDK 中不可用。TensorFlow Lite 分类器和模型 (1.15-R5.0) 是从官方托管网站 tensorflow.org 下载的。海军少将葛丽丝·霍普 (Grace Hopper) 的示例图像安装在文件系统中(可点击访问)。示例 label_image 程序在调用 TensorFlow Lite 之前裁剪并调整 bmp 图像大小为 224 x 224 像素。下面的代码块展示了 Mobilenetv1 (mobilenet_v1_1.0_224_quant.tflite) 和 Mobilenetv2 (mobilenet_v2_1.0_224.tflite) 模型对相同图像分辨率 (224x224x3) 进行推理执行的终端打印输出。
root@am62axx-evm:/usr/share/tensorflow-lite/examples# ./label_image -i grace_hopper.bmp -l labels.txt -m mobilenet_v1_1.0_224_quant.tflite
Loaded model mobilenet_v1_1.0_224_quant.tflite
resolved reporter
invoked
average time: 56.945 ms
0.780392: 653 military uniform
0.105882: 907 Windsor tie
0.0156863: 458 bow tie
0.0117647: 466 bulletproof vest
0.00784314: 835 suit
root@am62axx-evm:/usr/share/tensorflow-lite/examples# ./label_image -i grace_hopper.bmp -l labels.txt -m mobilenet_v2_1.0_224.tflite
Loaded model mobilenet_v2_1.0_224.tflite
resolved reporter
invoked
average time: 178.05 ms
0.911345: 653 military uniform
0.014466: 835 suit
0.0062473: 440 bearskin
0.00296661: 907 Windsor tie
0.00269019: 753 racket
为了对 Arm-Cortex-A53 处理器进行全面性能评估,在 1.25GHz 和 1.4GHz 下执行了基准测试。表 4-1 展示了所有测试执行的平均时间。
型号 | 1.25GHz 时的 Arm-Cortex-A53 |
1.4GHz 时的 Arm-Cortex-A53 |
---|---|---|
Mobilenetv1 mobilenet_v1_1.0_224_quant.tflite | 63.35ms | 56.94ms |
Mobilenetv2 mobilenet_v2_1.0_224.tflite | 192.10ms | 178.05ms |