米6体育平台手机版

ZHCUAU3J January 2018 – March 2024

1
请先阅读
1. 关于本手册
2. 标记规则
3. 相关文档
4. 米6体育平台手机版_好二三四 (TI) 提供的相关文档
5. 商标
1 软件开发工具简介
1. 1.1 软件开发工具概述
2. 1.2 编译器接口
3. 1.3 ANSI/ISO 标准
4. 1.4 输出文件
2 开始使用代码生成工具
1. 2.1 Code Composer Studio 项目如何使用编译器
2. 2.2 从命令行编译
3 使用 C/C++ 编译器
1. 3.1 关于编译器
2. 3.2 调用 C/C++ 编译器
3. 3.3 使用选项更改编译器的行为
4. 3.4 通过环境变量控制编译器
  1. 3.4.1 设置默认编译器选项 (C7X_C_OPTION)
  2. 3.4.2 命名一个或多个备用目录 (C7X_C_DIR)
5. 3.5 控制预处理器
6. 3.6 将参数传递给 main()
7. 3.7 了解诊断消息
  1. 3.7.1 控制诊断消息
  2. 3.7.2 如何使用诊断抑制选项
8. 3.8 其他消息
9. 3.9 生成原始列表文件（--gen_preprocessor_listing 选项）
10. 3.10 使用内联函数扩展
11. 3.11 使用交叉列出功能
12. 3.12 关于应用程序二进制接口
13. 3.13 启用入口挂钩和出口挂钩函数
4 优化您的代码
1. 4.1 调用优化
2. 4.2 控制代码大小与速度
3. 4.3 执行文件级优化（--opt_level=3 选项）
  1. 4.3.1 创建优化信息文件（--gen_opt_info 选项）
4. 4.4 程序级优化（--program_level_compile 和 --opt_level=3 选项）
  1. 4.4.1 控制程序级优化（--call_assumptions 选项）
5. 4.5 自动内联扩展（--auto_inline 选项）
6. 4.6 链接时优化（--opt_level=4 选项）
  1. 4.6.1 选项处理
  2. 4.6.2 不兼容的类型
7. 4.7 优化软件流水线
8. 4.8 冗余循环
9. 4.9 指示是否使用了某些别名技术
  1. 4.9.1 采用某些别名时使用 --aliased_variables 选项
10. 4.10 防止重新排列关联浮点运算
11. 4.11 使用性能建议优化代码
  1. 4.11.1 建议 #35000：使用 restrict 提高循环性能
12. 4.12 通过优化使用交叉列出特性
13. 4.13 调试和分析优化代码
  1. 4.13.1 分析优化的代码
14. 4.14 正在执行什么类型的优化？
15. 4.15 流引擎和流地址生成器
16. 4.16 嵌套循环控制器 (NLC)
  1. 4.16.1 可能限制使用 NLC 的障碍
5 C/C++ 语言实现
1. 5.1 C7000 C 的特征
  1. 5.1.1 实现定义的行为
2. 5.2 C7000 C++ 的特性
3. 5.3 数据类型
  1. 5.3.1 枚举类型大小
  2. 5.3.2 矢量数据类型
4. 5.4 文件编码和字符集
5. 5.5 关键字
6. 5.6 C++ 异常处理
7. 5.7 寄存器变量和参数
8. 5.8 pragma 指令
9. 5.9 _Pragma 运算符
10. 5.10 应用程序二进制接口
11. 5.11 目标文件符号命名规则（链接名）
12. 5.12 更改 ANSI/ISO C/C++ 语言模式
13. 5.13 GNU 和 Clang 语言扩展
14. 5.14 向量数据类型的运算和函数
15. 5.15 C7000 内在函数
16. 5.16 C7000 可扩展矢量编程
6 运行时环境
1. 6.1 存储器
2. 6.2 对象表示
3. 6.3 寄存器惯例
4. 6.4 函数结构和调用惯例
5. 6.5 访问 C 和 C++ 中的链接器符号
6. 6.6 运行时支持算术例程
7. 6.7 系统初始化
  1. 6.7.1 用于系统预初始化的引导挂钩函数
  2. 6.7.2 变量的自动初始化
7 使用运行时支持函数并构建库
1. 7.1 C 和 C++ 运行时支持库
2. 7.2 C I/O 函数
  1. 7.2.1 高级别 I/O 函数
    1. 7.2.1.1 格式化和格式转换缓冲区
  2. 7.2.2 低级 I/O 实现概述
    1. open
    2. close
    3. read
    4. write
    5. lseek
    6. unlink
    7. rename
  3. 7.2.3 器件驱动程序级别 I/O 函数
    1. DEV_open
    2. DEV_close
    3. DEV_read
    4. DEV_write
    5. DEV_lseek
    6. DEV_unlink
    7. DEV_rename
  4. 7.2.4 为 C I/O 添加用户定义的器件驱动程序
    1. 7.2.4.1 将默认流映射到器件
  5. 7.2.5 器件前缀
3. 7.3 处理可重入性（_register_lock() 和 _register_unlock() 函数）
4. 7.4 库构建流程
8 目标模块简介
1. 8.1 目标文件格式规范
2. 8.2 可执行目标文件
3. 8.3 段简介
  1. 8.3.1 特殊段名
4. 8.4 链接器如何处理段
  1. 8.4.1 合并输入段
  2. 8.4.2 放置段
5. 8.5 符号
  1. 8.5.1 局部符号
  2. 8.5.2 弱符号
6. 8.6 加载程序
9 程序加载和运行
1. 9.1 负载
2. 9.2 入口点
3. 9.3 运行时初始化
4. 9.4 main 的参数
5. 9.5 运行时重定位
6. 9.6 其他信息
10归档器说明
1. 10.1 归档器概述
2. 10.2 归档器在软件开发流程中的作用
3. 10.3 调用归档器
4. 10.4 归档器示例
5. 10.5 库信息归档器说明
11链接 C/C++ 代码
1. 11.1 通过编译器调用链接器（-z 选项）
2. 11.2 链接器代码优化
3. 11.3 控制链接过程
12链接器说明
1. 12.1 链接器概述
2. 12.2 链接器在软件开发流程中的作用
3. 12.3 调用链接器
4. 12.4 链接器选项
5. 12.5 链接器命令文件
6. 12.6 链接器符号
7. 12.7 默认放置算法
  1. 12.7.1 分配算法如何创建输出段
  2. 12.7.2 减少存储器碎片
8. 12.8 使用由链接器生成的复制表
9. 12.9 部分（增量）链接
10. 12.10 链接 C/C++ 代码
11. 12.11 链接器示例
13目标文件实用程序
1. 13.1 调用目标文件显示实用程序
2. 13.2 调用反汇编器
3. 13.3 调用名称实用程序
4. 13.4 调用符号去除实用程序
14C++ 名称还原器
1. 14.1 调用 C++ 名称还原器
2. 14.2 C++ 名称还原器的示例用法
A XML 链接信息文件说明
1. A.1 XML 信息文件元素类型
2. A.2 文档元素
  1. A.2.1 标头元素
  2. A.2.2 输入文件列表
  3. A.2.3 对象组件列表
  4. A.2.4 逻辑组列表
  5. A.2.5 放置映射
  6. A.2.6 Far Call Trampoline 列表
  7. A.2.7 符号表
B 不受支持的工具和功能
1. B.1 不受支持的工具和功能列表
C 术语表
1. 528
D 修订历史记录

5.16 C7000 可扩展矢量编程

编译器库中提供了一组实用程序，用于为 C7000 编写独立于矢量宽度的代码。要使用这些实用程序，请在源代码中 #include c7x_scalable.h。

这些实用程序仅可在 C++ 代码中使用，因为它们的实现中使用了 C++ 语言功能。

使用 TI C7000 编译器或使用 TI C7000 主机仿真进行编译时，可使用这些实用程序。

以下 API 可用，c7x_scalable.h 文件中对所有这些 API 进行了更详细的描述：

矢量类型查询和构造

c7x::max_simd<T>::value
c7x::element_count_of<T>::value
c7x::element_type_of<T>::type
c7x::component_type_of<T>::type
c7x::make_vector<T,N>::type
c7x::make_full_vector<T>::type
c7x::is_target_vector<T>::value

完整矢量类型
```
c7x::char_vec
 c7x::short_vec
 etc
```
半向量类型
```
c7x::char_hvec
c7x::short_hvec
etc
```
四分之一向量类型
```
c7x::char_qvec
c7x::short_qvec
etc
```

指针的主机仿真兼容类型

c7x::char_vec_ptr
c7x::const_short_vec_ptr
etc

模板化矢量重新解释和转换

c7x::reinterpret<T>(v)
c7x::convert<T>(v)

矢量重新解释和转换

c7x::as_char_vec(v)
c7x::convert_short_vec(v)etc

流引擎和流地址生成器帮助器

c7x::se_veclen<T>::value
c7x::se_eletype<T>::value
c7x::sa_veclen<T>::value
c7x::strm_eng<I,T>::get()
c7x::strm_eng<I,T>::get_adv()
c7x::strm_agen<I,T>::get(p)
c7x::strm_agen<I,T>::get_adv(p)
c7x::strm_agen<I,T>::get_vpred()

以下宏由 c7x_mma.h 定义，可用于确定有关 MMA 与可扩展矢量编程模型配合使用的信息：

表 5-9 与 MMA 和可扩展矢量编程配合使用的宏

宏语法	说明
__MMA_A_MAT_BYTES__	A 矩阵的大小（以字节为单位）。目前，每个 A 矩阵包含一行。
__MMA_A_ROW_WIDTH_BYTES__	A 矩阵中一行的大小（以字节为单位）。
__MMA_A_ROWS__	A 矩阵中的行数。
__MMA_A_COLS(ebytes)	给定 A 矩阵各元素中字节数时该矩阵中的列数。通常对 sizeof() 有用。例如，`__MMA_A_COLS(sizeof(short))`。
__MMA_A_ENTRIES__	可以包含在 A 存储中的 A 条目数。
__MMA_B_MAT_BYTES__	B 矩阵的大小（以字节为单位）。
__MMA_B_ROW_WIDTH_BYTES__	B 矩阵中一行的大小（以字节为单位）。
__MMA_B_ROWS(ebytes)	给定 B 矩阵各元素中的字节数时该矩阵中的行数。通常对 sizeof() 有用。例如，`__MMA_B_ROWS(sizeof(short))`。
__MMA_B_COLS(ebytes)	给定 B 矩阵各元素中的字节数时该矩阵中的列数。通常对 sizeof() 有用。例如，`__MMA_B_COLS(sizeof(short))`。
__MMA_C_MAT_BYTES__	C 矩阵的大小。目前，每个 C 矩阵包含一行。目前，对于较大的累加器，C 矩阵比 A 矩阵宽 4 倍。
__MMA_C_ROW_WIDTH_BYTES__	C 矩阵中行的大小。
__MMA_C_ROWS__	C 矩阵中的行数。
__MMA_C_COLS(ebytes)	给定 C 矩阵各元素中的字节数时该矩阵中的列数。通常对 sizeof() 有用。例如，`__MMA_C_COLS(sizeof(short))`。
__MMA_C_ENTRIES__	可以包含在 C 存储中的 C 条目数。

作为一个中等复杂度的示例，以下是使用输入类型作为模板的 memcpy 的 C++ 函数模板的实现。此示例使用流引擎和流地址生成器（请参阅节 4.15）。

#include <c7x_scalable.h>

using namespace c7x;

/* memcpy_scalable_strm<typename S>(const S*in, S *out, int len)
 *
 * S   - A basic data type such as short or float.
 * in  - The input buffer.
 * out - The output buffer.
 * len - The number of elements to copy.
 *
 * Defaulted template arguments:
 * V   - A full vector type of S
 */
template<typename S,
         typename V  = typename make_full_vector<S>::type>
void memcpy_scalable_strm(const S *restrict in, S *restrict out, int len)
{
    /*
     * Find the maximum number of vector loads/stores needed to copy the buffer,
     * including any remainder.
     */
    int cnt = len / element_count_of<V>::value;
    cnt += (len % element_count_of<V>::value > 0);

    /* Initialize the SE for a linear read in and the SA for a linear write out. */
    __SE_TEMPLATE_v1 in_tmplt = __gen_SE_TEMPLATE_v1();
    __SA_TEMPLATE_v1 out_tmplt = __gen_SA_TEMPLATE_v1();

    in_tmplt.VECLEN = se_veclen<V>::value;
    in_tmplt.ELETYPE = se_eletype<V>::value;
    in_tmplt.ICNT0 = len;

    out_tmplt.VECLEN = sa_veclen<V>::value;
    out_tmplt.ICNT0 = len;

    __SE0_OPEN(in, in_tmplt);
    __SA0_OPEN(out_tmplt);

    /* Perform the copy. If there is remainder, the last store will be predicated. */
    int i;
    for (i = 0; i < cnt; i++)
    {
        V tmp = strm_eng<0, V>::get_adv();
        __vpred pred = strm_agen<0, V>::get_vpred();
        V *addr = strm_agen<0, V>::get_adv(out);
        __vstore_pred(pred, addr, tmp);
    }

    __SE0_CLOSE();
    __SA0_CLOSE();
}