[x86] AI 计算扩展 (ACE) 规范
AI Compute Extensions (ACE) Specification

原始链接: https://x86ecosystem.org/resource/ai-compute-extensions-ace-specification/

本文件定义了用于加速计算任务的 x86 扩展,最初重点关注机器学习工作负载中重要的矩阵乘法内核和低精度数据格式。ACE 扩展定义了矩阵乘法原语,通过以下新增功能增强了 AVX 和标量代码:包含 Tile 寄存器和 Block Scale 寄存器的 ACE 寄存器状态;消耗 AVX 寄存器输入并对 Tile 寄存器状态进行操作的数据处理指令;在 ACE 寄存器状态与 AVX 寄存器之间移动数据的指令;以及用于系统管理的各种状态和操作。ACE 提供了 AVX 向量与 ACE Tile 寄存器之间的紧密集成,将高计算密度的 Tile 处理操作与 AVX 全面的数据处理功能相结合。除了矩阵加速外,AVX10 框架下还提供了一系列专用的格式转换操作。

```Hacker News新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交登录[x86] AI 计算扩展 (ACE) 规范 (x86ecosystem.org)8 分,发布者:matt_d,59 分钟前 | 隐藏 | 往期 | 收藏 | 1 条评论帮助 dgoldstein0 0 分钟前 [–] 那么这与目前大多数 x64 机器上已有的 SSE / AVX 指令有什么不同?回复 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索: ```
相关文章

原文

This document defines x86 extensions for accelerating computation tasks, initially focusing on matrix multiplication kernels and reduced precision data formats important to ML workloads.

The ACE extensions define matrix multiplication primitives that augment AVX and scalar code with new capabilities, adding:

  • ACE register state, including tile and block scale registers
  • Data processing operations that consume AVX register input and operate on tile register state
  • Data move operations to move data between ACE register state and AVX registers
  • State and operations for system management

ACE provides tight integration between AVX vectors and ACE tile registers, combining high compute density tile processing operations with the comprehensive data processing features of AVX.

In addition to matrix acceleration, a number of dedicated format convert operations are provided under the AVX10 framework.

联系我们 contact @ memedata.com