HiFloat开源代码仓正式上线:量化框架/模型案例一键克隆,低比特AI开发一步到位!

发布时间:2026/6/10 18:03:05

HiFloat开源代码仓正式上线:量化框架/模型案例一键克隆,低比特AI开发一步到位! 昨日HiFloat社区官网带着白皮书、仿真工具和标准规范率先亮相。今天HiFloat开源代码仓正式上线一次性开放量化仿真工具、模型适配代码、开发框架和完整可复现方案。下文将详细介绍已上线的10个代码仓并附链接欢迎下载使用从“看懂技术”到“跑通代码”开源代码仓进一步补齐了从技术资料走向实际开发的关键环节。开发者不仅可以通过HiFloat社区网站了解HiFloat的设计思路还可以在开源代码仓直接查看代码、运行示例、开展模型量化实验并根据自己的业务场景探索新的适配方式。目前HiFloat开源代码仓包括以下三类资源面向HiF4和HiF8的基础量化仿真工具面向模型量化、导出、评测和推理部署的开发框架面向文生视频、图生视频和语言模型等场景的模型适配方案。无论你是第一次接触低位宽量化还是已经在开展大模型训练、推理优化和工程部署都可以在代码仓中找到适合的切入点。代码仓全解读从基础工具到模型实践基础工具快速体验HiFloat量化能力1、HiFloat4-Quantization_Library面向HiFloat4的基础量化库提供Float4量化与仿真能力支持开发者在不同硬件后端上开展低位宽实验。开发者可以通过伪量化方式观察模型使用HiF4数据格式后的表现变化并进一步分析精度、效率和模型效果之间的关系。仓库目前提供NVIDIA CUDA和华为昇腾NPU相关支持适合作为了解HiFloat4、开展W4A4等低位宽量化实验的起点。链接https://github.com/GCC-HiFloat/HiFloat4-Quantization_Library2、HiFloat8-Quantization_Library面向HiFloat8的基础量化库提供Float8量化和仿真场景支持在CUDA与昇腾NPU等环境中进行验证。对于希望研究W8A8量化训练、推理优化或不同数据格式精度表现的开发者快速建立基础实验环境。链接https://github.com/GCC-HiFloat/HiFloat8-Quantization_Library通用框架进一步探索模型量化与推理部署3、HiFP8HIFP8是面向HiFloa8的量化框架与基础量化仿真库相比HiFP8更关注完整的模型量化与部署流程。仓库支持BF16伪量化和uint8真量化两种模式并提供模型导出、标准评测、SmoothQuant、MoE模型支持以及vLLM推理部署相关能力。对于希望进一步把HiFloat8应用到真实大模型推理场景中的开发者HiFP8提供了更加完整的实践路径。链接https://github.com/GCC-HiFloat/HiFP8模型实践覆盖视频生成与语言模型等应用场景除了基础工具和通用框架HiFloat开源代码仓还汇聚了多项模型量化实践。展示了HiF4、HiF8在不同任务、不同模型和不同技术路线中的应用方式。4、HiSQRot4_Wan2.2面向Wan2.2文生视频模型提供基于HiFloat4的W4A4训练后量化方案。方案将SmoothQuant和Rotation等思路用于模型量化在尽可能保持原始生成流程的基础上对目标线性层进行低位宽替换。适合希望研究视频生成模型量化、低比特推理和效果保持能力的开发者参考。链接https://github.com/GCC-HiFloat/HiSQRot4_Wan2.25、PTQ_Wan2.2面向Wan2.2图生视频模型提供基于HiFloat4的训练后量化方案。仓库包含量化代码、运行示例、技术报告和模型资源链接为开发者提供较为完整的复现入口。如果开发者希望了解如何将HiFloat4用于图生视频任务可以通过该仓库快速查看量化流程和实验配置。链接https://github.com/GCC-HiFloat/PTQ_Wan2.26、Percentile_Wan2.2面向Wan2.2文生视频模型提供基于分位数校准的HiFloat4 W4A4训练后量化方案。仓库开放了推理代码、配置文件和复现说明重点展示如何通过校准方法改善低比特量化表现。对于关注量化校准策略、模型效果对比和可复现流程的开发者具有较强的参考价值。链接https://github.com/GCC-HiFloat/Percentile_Wan2.27、LLMC_Wan2.2提供了LLMC与Wan2.2相结合的一体化实践流程覆盖模型量化、视频生成以及VBench评测。适合希望了解完整实验链路和工程实践的开发者包括如何准备环境、执行量化、生成视频并完成效果评测。链接https://github.com/GCC-HiFloat/LLMC_Wan2.28、QAT_PTQ_Wan2.1该仓库面向Wan2.1文生视频模型展示了基于HiFloat8 W8A8的训练后量化和量化感知训练方案。其中PTQ即训练后量化适合在已有模型基础上进行快速量化QAT即量化感知训练在训练过程中考虑量化带来的影响以进一步改善模型效果。适合希望对比不同量化路线、研究视频生成模型W8A8训练与评测流程的开发者。链接https://github.com/GCC-HiFloat/QAT_PTQ_Wan2.19、QAT_Wan2.1围绕多模态模型训练和Wan2.1相关场景提供工程实践资源并包含HiF8相关模块、训练脚本、模型配置和评测文件。适合具备一定训练经验的开发者进一步探索多模态大模型训练、昇腾环境适配和量化训练流程。链接https://github.com/GCC-HiFloat/QAT_Wan2.110、QAT_Pangu面向OpenPangu-Embedded-1B模型展示了基于HiFloat8 W8A8的量化感知训练方案。包括模型评测、复现说明和量化模型权重入口适合希望了解HiFloat8在语言模型训练和量化部署中应用方式的开发者。链接https://github.com/GCC-HiFloat/QAT_Pangu不只是代码发布更是开放共建的开始HiFloat开源代码仓的上线不只是一次资源汇总也意味着社区建设进入了新的阶段。低比特计算是一项需要持续迭代的系统工程。它不仅涉及数据格式本身也涉及模型算法、训练框架、推理引擎、硬件适配、评测工具和实际应用场景。不同开发者可以从不同方向参与进来运行示例验证HiFloat在更多模型上的效果提交PR完善工具、文档和适配代码分享实验结果为其他开发者提供参考适配新的模型、算子和推理框架参与技术讨论共同探索低比特AI计算的更多可能性。开源自己的HiFloat项目并联系我们合入无论你是算法工程师、系统开发者、科研人员、高校学生还是关注AI 算力效率的产业伙伴都欢迎加入HiFloat开发工作。HiFloat 社区与开源代码仓将持续完善代码仓和技术文档推动更多模型适配、工具升级和实践案例开放为开发者提供更加清晰、易用、可复现的技术资源.让我们一起推动低比特AI计算技术从开放走向共建从实验走向应用。扫码访问HiFloat开源代码仓扫码进入GCC-HiFloat社区交流群

相关新闻