CANN/asc-devkit矩阵计算实践

发布时间:2026/5/30 21:54:35

CANN/asc-devkit矩阵计算实践 Matrix Compute Practices 样例介绍【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit概述基于 Matrix Compute API 的矩阵计算优化样例通过直调方式介绍 Matmul 与 MxFP4 Matmul 在高阶 API、基础 API、Tensor API 场景下的高性能实践。样例列表目录名称功能描述支持的产品matmul_high_performanceMatmul 高阶 API 递进式性能优化样例展示多核切分、MDL、L1/L2 Cache、常量 tiling、UnitFlag 等优化方法。Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品matmul_basic_api_high_performanceMatmul 基础 API 最佳实践样例基于静态 Tensor 编程展示基础 API 下的高性能实现细节。Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品matmul_mxfp4_high_performanceMxFP4 Matmul 高阶 API 性能调优样例展示常量化 tiling 与 scale 数据搬运优化方法。Ascend 950PR / Ascend 950DTmatmul_mxfp4_basic_api_high_performanceMxFP4 Matmul 基础 API 高性能样例基于静态 Tensor 编程展示已验证的基础 API 实现路径。Ascend 950PR / Ascend 950DTmatmul_mxfp4_tensor_api_high_performanceMxFP4 Matmul Tensor API 高性能样例基于静态 Tensor 编程展示已验证的 Tensor API 实现路径。Ascend 950PR / Ascend 950DT【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻