CANN/asc-devkit: asc_loadunalign非对齐加载接口

发布时间:2026/6/5 18:17:04

CANN/asc-devkit: asc_loadunalign非对齐加载接口 asc_loadunalign【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明reg计算数据搬运接口适用于从UB非32B对齐的起始地址连续搬入矢量数据寄存器的场景。该接口不改变源操作数在UB上的地址每次循环的调用都需要用户手动更新源操作数在UB上的地址。函数原型__simd_callee__ inline void asc_loadunalign(vector_int8_t dst, vector_load_unalign src0, __ubuf__ int8_t *src1) __simd_callee__ inline void asc_loadunalign(vector_uint8_t dst, vector_load_unalign src0, __ubuf__ uint8_t *src1) __simd_callee__ inline void asc_loadunalign(vector_int16_t dst, vector_load_unalign src0, __ubuf__ int16_t *src1) __simd_callee__ inline void asc_loadunalign(vector_uint16_t dst, vector_load_unalign src0, __ubuf__ uint16_t *src1) __simd_callee__ inline void asc_loadunalign(vector_int32_t dst, vector_load_unalign src0, __ubuf__ int32_t *src1) __simd_callee__ inline void asc_loadunalign(vector_uint32_t dst, vector_load_unalign src0, __ubuf__ uint32_t *src1) __simd_callee__ inline void asc_loadunalign(vector_half dst, vector_load_unalign src0, __ubuf__ half *src1) __simd_callee__ inline void asc_loadunalign(vector_float dst, vector_load_unalign src0, __ubuf__ float *src1) __simd_callee__ inline void asc_loadunalign(vector_int64_t dst, vector_load_unalign src0, __ubuf__ int64_t *src1) __simd_callee__ inline void asc_loadunalign(vector_bfloat16_t dst, vector_load_unalign src0, __ubuf__ bfloat16_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp8_e4m3fn_t dst, vector_load_unalign src0, __ubuf__ fp8_e4m3fn_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp8_e5m2_t dst, vector_load_unalign src0, __ubuf__ fp8_e5m2_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp8_e8m0_t dst, vector_load_unalign src0, __ubuf__ fp8_e8m0_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp4x2_e2m1_t dst, vector_load_unalign src0, __ubuf__ fp4x2_e2m1_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp4x2_e1m2_t dst, vector_load_unalign src0, __ubuf__ fp4x2_e1m2_t *src1) __simd_callee__ inline void asc_loadunalign(vector_hifloat8_t dst, vector_load_unalign src0, __ubuf__ hifloat8_t *src1) __simd_callee__ inline void asc_loadunalign(vector_int4x2_t dst, vector_load_unalign src0, __ubuf__ int4b_t *src1)参数说明参数名输入/输出描述dst输出目的操作数矢量数据寄存器。src0输入/输出非对齐寄存器用于保存非对齐数据长度32B。src1输入源操作数矢量的起始地址。矢量数据寄存器和非对齐寄存器的详细说明请参见reg数据类型定义.md。返回值说明无流水类型PIPE_V约束说明该接口中的src1不需要32B对齐。调用该接口之前需要调用asc_loadunalign_pre进行非对齐搬入前的初始化。调用示例vector_load_unalign ureg; __ubuf__ half* src (__ubuf__ half*)asc_get_phy_buf_addr(0); uint32_t offset 5; asc_loadunalign_pre(ureg, src offset); vector_half dst; asc_loadunalign(dst, ureg, src offset);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻