VGGT模型昇腾推理适配-尧图网站设计

在昇腾Atlas A2/A3环境上适配VGGT模型的推理【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence本样例基于VGGT开源模型查看。此外本样例基于VGGT模型在NPU进行了性能优化目前VGGT模型在25张图片输入下推理时间下降至1.12秒。详细内容可至性能优化章节查看。本样例支持昇腾Atlas A2/A3环境的单机单卡推理与单机多卡序列并行推理。使用一站式平台的用户可直接跳转「一站式平台的快速启动」章节。执行样例CANN环境准备本样例的执行依赖CANN开发套件包cann-toolkit与CANN二进制算子包cann-kernels目前使用CANN软件版本为CANN.8.5.0。请从CANN软件包下载地址下载Ascend-cann-toolkit_${version}_linux-${arch}.run与Ascend-cann-${chip_type}-ops_linux-${arch}.run软件包并参考CANN安装文档进行安装。本样例依赖的torch以及torch_npu版本为2.7.1。请从Ascend Extension for PyTorch插件下载torch与torch_npu安装包本样例依赖的torch与torch_npu版本分别为2.7.1和2.7.1.post2。conda create -n vggt python3.11.13 conda activate vggt pip3 install torch2.7.1 pip3 install torch_npu2.7.1.post2网络模型代码准备本仓库依赖VGGT的开源仓库代码。进入VGGT的官方仓库下载VGGT模型网络结构代码git clone https://github.com/facebookresearch/vggt.git下载本仓库代码git clone https://gitcode.com/cann/cann-recipes-embodied-intelligence.gitVGGT 模型权重下载VGGT model checkpoint并将权重文件model.pt复制到ckpt目录下。pip install -U huggingface_hub export HF_ENDPOINThttps://hf-mirror.com hf download facebook/VGGT-1B --local-dir vggt将VGGT仓库的网络模型文件以非覆盖模式复制到本项目目录下。cp vggt/visual_util.py cann-recipes-embodied-intelligence/3d_vision/vggt/ cp -r vggt/examples cann-recipes-embodied-intelligence/3d_vision/vggt/ cp -rn vggt/vggt/dependency cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/dependency cp -rn vggt/vggt/heads cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/ cp -rn vggt/vggt/layers cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/ cp -rn vggt/vggt/utils cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/安装Python依赖cd cann-recipes-embodied-intelligence/3d_vision/vggt/ pip3 install -r requirements.txt模型权重与模型结构在文件目录中罗列如下VGGT --- examples --- demo_infer.py --- eval --- ckpt --- model.pt --- quant --- vggt --- dependency --- heads --- layers --- models --- utils --- sp快速启动本样例准备了单卡和多卡环境下的推理样例脚本。执行脚本前请参考Ascend社区中的CANN安装软件教程配置环境变量source /usr/local/Ascend/ascend-toolkit/set_env.sh推理bf16模型脚本单卡运行python demo_infer.py --ckpt ckpt/model.pt推理bf16模型脚本多卡运行bash infer_test.sh多卡推理的参数说明torchrun --nproc_per_node1 demo_infer.py \ --ckpt ${model_base} \ --images_path examples/kitchen/images \ --enable_sp \ --ulysses_degree 1 \ --ring_degree 1--nproc_per_nodetorchrun参数每个节点启动的进程数需要等于使用的NPU卡数--ckpt模型checkpoint文件路径--images_path输入图像序列所在目录--enable_sp:是否启用序列并行,默认值: False,前提条件为nproc_per_node 1--ulysses_degreeUlysses并行度,约束ulysses_degree × ring_degree nproc_per_nodenum_attention_heads 必须能被 ulysses_degree 整除--ring_degreeRing并行度,约束ulysses_degree × ring_degree nproc_per_node推理int8模型需要先生成int8模型(当前实现中只将VGGT模型中K4096的Linear层进行了8bit量化)python demo_infer.py --ckpt ckpt/model.pt --buildW8A8in8模型会生成在当前路径再使用该int8模型进行推理python demo_infer.py --ckpt VGGT_model_W8A8.pt --enableW8A8一站式平台的快速启动本章节面向使用一站式平台的用户平台已预置完整的 CANN 环境按以下步骤即可在单卡上完成 VGGT 的三维重建推理。使用一站式平台的用户请选择A2/A3上的python3.11相关的实例进行创建。修改文件中变量修改infer_platform_env_prepare.sh中WORKSPACE_DIR变量指代的路径如cann_recipes代码与权重准备运行下列命令一键拉起脚本进行代码与权重的准备cd cann-recipes-embodied-intelligence/3d_vision/vggt bash infer_platform_env_prepare.sh推理脚本运行推理bf16模型脚本单卡运行python demo_infer.py --ckpt ckpt/model.ptCitationinproceedings{wang2025vggt, title{VGGT: Visual Geometry Grounded Transformer}, author{Wang, Jianyuan and Chen, Minghao and Karaev, Nikita and Vedaldi, Andrea and Rupprecht, Christian and Novotny, David}, booktitle{Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition}, year{2025} }【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

VGGT模型昇腾推理适配

相关新闻

用 npm 安装 Claude Code CLI 并对接 DeepSeek API 经验分享

深度回声状态网络稀疏正则化优化及污水处理应用【附程序】

GPU内核优化：挑战与KernelFoundry框架实践

IDEA接入DeepSeek最新教程Proxy AI（codeGpt) [2025版]

独立开发者的奥卡姆剃刀：数据安全与极简异地备份的工程实践

水管漏水检测数据集基础信息表YOLO模型如何训练这个数据集

Python_40题详细解析

分布式时序数据库TimeLyre ：原生多模态、高性能计算、快速时序回放分析

VMware Workstation Pro 17：1000+许可证密钥与专业虚拟化环境搭建指南

算法数据结构面试必备

理解「数据网格」（Data Mesh）及其对数据平台架构的影响

Python 协程池实现方法

2026 最全AI编程软件安装与上手实测教程

进化博弈论解析AI代理欺骗行为与风险管控

深入解析P89LPC932A1 CCU模块：输入捕获与PWM实战指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源