
Atlas A2 vs A3 NPU 架构区别【免费下载链接】cann-outreach项目地址: https://gitcode.com/cann/cann-outreach架构映射代号SocVersionNpuArch芯片A2ASCEND910BDAV_2201Ascend910B1~B4, B2CA3ASCEND910B (含 Ascend910_93)DAV_2201Ascend910_93关键点A2 和 A3 共用同一 NpuArchDAV_2201__NPU_ARCH__2201指令集和微架构相同。实际差异A3Ascend910_93相对 A2 典型 SKU如 910B2的主要区别在SKU 级规格而非架构级规格A2 (910B2)A3 (910_93)Cube 核数24可能不同因 SKU 裁剪频率1.8 GHz可能不同L2192 MB可能不同Memory64 GB可能不同注意Ascend910_93运行时 SocVersion 映射到ASCEND910B非独立枚举值NpuArch 同为DAV_2201。对算子开发来说A2 和 A3无需条件编译分支运行时通过GetCoreNumAic()/GetCoreMemSize()获取实际参数即可。大架构跃迁A5DAV_3510真正的大架构跃迁发生在A5DAV_3510新增 FP8/MXFP4 数据格式、L0C 翻倍至 256KB、UB 增至 248KB、SIMT/Regbase 编程模型等。Buffer 容量对比BufferA2 (910B2, DAV_2201)A5 (950PR, DAV_3510)用途L1512 KB512 KBCube 输入缓存L0A64 KB64 KBCube 左矩阵操作数L0B64 KB64 KBCube 右矩阵操作数L0C128 KB256 KBCube 输出UB192 KB248 KBVector 工作区L2192 MB128 MB (Server) / 112 MB (PCIE)跨核共享缓存BT1 KB4 KBFixPipe Bias 表SSBuffer—256 KBDAV_3510 新增 AIC↔AIV 核间消息通路算力对比规格项Ascend910B2 (DAV_2201)Ascend950PR PCIE (DAV_3510)Ascend950PR Server (DAV_3510)CubeCore 核数242832频率 (GHz)1.81.651.65Cube 算力 BF16/FP16353T378T432TCube 算力 FP8/HiF8/MXFP8—757T865TCube 算力 MXFP4—1514T1730TVector 算力 FP1622T47T54TMemory 容量 (GB)64112128【免费下载链接】cann-outreach项目地址: https://gitcode.com/cann/cann-outreach创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考