ZHCAAX4A April 2021 – April 2021 TDA4VM , TDA4VM-Q1
此部分描述了构成本文所述可视化定位算法的每个子任务如何无缝映射至 TDA4VM 器件。此应用包含三个主要步骤:图像预处理、DKAZE 特征提取和定位。TDA4x 系列器件是以此类应用为核心设计的,因此每一个子任务都可以映射到器件中的专用硬件,以确保高效和准确地执行任务。客户可用的第一个 TDA4x 系列变体 TDA4VM 器件的图解显示在图 3-1 中。
下方图 3-1 所示的方框图详细说明了构成 TDA4VM SoC 的关键组件。其中包括一个耦合到 C7x DSP 的深度学习硬件加速器、几个通用 Arm® 内核、一个视觉预处理硬件加速器和专为某些广泛使用的 CV 任务而设计的硬件加速器。接下来,构成算法的子任务映射至图 3-2 中的不同 SoC 组件。
第一个子任务是图像预处理,可以完全在片上视觉预处理加速器 (VPAC) 上执行,VPAC 包括一个图像信号处理器 (ISP)。此模块通过 CSI-2 接口从摄像头获取图像,并在进一步处理之前执行必要的预处理步骤。TDA4VM 上的 VPAC 模块包含原始前端 (RFE)、双噪声滤波器、全局和局部色调映射模块、灵活的颜色处理模块、镜头失真校正和缩放引擎。如需更多有关 VPAC 的信息,请单击此处。
下一个子任务是 DKAZE 特征提取,可使用片上 DNN 硬件加速器 C7x/MMA 执行。C7x/MMA 是为了加快常用深度学习操作而专门设计的 HWA。C7x/MMA 由具有数十年经验的工程师围绕汽车和工业应用而设计,是目前市场上功效卓越的深度学习加速器之一。C7x/MMA 模块的功率与 TOPS 比率在当今市场中表现出色。如需更多有关 C7x/MMA 的信息,请单击此处。
最后,可视化定位子任务在 SoC 上一个可用的 DSP(C7x 或 C66x)上执行。
下面图 3-2 中的流程图显示了从可视化定位算法到 TDA4VM 器件的子任务映射。