
深度研究代理DR-Venus-4B-SFT4B参数AI如何实现长时程工具使用【免费下载链接】DR-Venus-4B-SFT项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/DR-Venus-4B-SFTDR-Venus-4B-SFT是一款基于4B参数构建的深度研究代理通过在清理后的开放数据代理轨迹上对Qwen3-4B-Thinking-2507进行微调而获得。作为DR-Venus项目的监督初始化检查点它专门设计用于建立稳定的长时程代理行为包括推理、工具使用、证据收集和最终答案合成。 为什么选择DR-Venus-4B-SFT这款模型的核心优势在于仅使用4B参数量就实现了前沿级的长时程工具使用能力。与依赖专有轨迹数据的模型不同它完全基于开源的REDSearcher轨迹训练经过环境对齐、结构清理、正确性过滤和转向感知重采样等多重优化流程。 模型核心能力长时程工具使用支持search和visit两种核心工具能处理超过200K序列长度的研究任务开放域信息检索擅长通过工具获取外部知识并整合到推理过程中证据驱动回答强调基于搜索结果和访问内容生成有依据的回答轻量级部署4B参数设计使其在普通硬件上也能高效运行 性能表现超越同级别模型在多项深度研究基准测试中DR-Venus-4B-SFT建立了强大的4B参数基线超越了许多更大规模的模型模型BrowseCompBrowseComp-ZHGAIA (Text-Only)xBench-DS-2505DeepSearchQAWebExplorer-8B-RL15.732.050.053.717.8AgentCPM-Explore-4B24.129.163.970.032.8DR-Venus-4B-SFT26.835.765.469.037.7DR-Venus-4B-RL29.137.764.474.739.6特别值得注意的是DR-Venus-4B-SFT在中文基准BrowseComp-ZH上达到35.7分显著领先于同级别模型展示了其在多语言深度研究任务上的优势。️ 技术架构解析基础模型与训练框架基础模型Qwen/Qwen3-4B-Thinking-2507模型类型长上下文推理模型专为工具增强型深度研究设计训练框架verl火山引擎开源框架训练数据10,001条原始轨迹 → 9,365条正确性过滤轨迹 → 18,745条重采样后SFT训练实例关键参数配置根据config.json文件模型的核心配置包括隐藏层大小2560注意力头数32隐藏层数36最大位置嵌入262144支持超长上下文词表大小151936数据类型bfloat16这些参数的精心配置使4B参数量模型能够高效处理长时程研究任务。 数据处理流程DR-Venus-4B-SFT的训练数据经过严格处理确保高质量和高利用率格式转换将原始轨迹转换为DR-Venus推理管道使用的交互格式工具标准化统一search和visit工具调用协议数据清洗移除不允许的工具和重复的工具调用轮次正确性过滤保留结构有效且最终答案正确的轨迹重采样通过转向感知重采样提高长时程轨迹的权重 快速开始指南要使用DR-Venus-4B-SFT建议配合官方推理管道git clone https://gitcode.com/hf_mirrors/inclusionAI/DR-Venus-4B-SFT cd DR-Venus/Inference pip install -r requirements.txt # 配置模型路径到run_demo.sh或run_web_demo.sh bash run_demo.sh如果在官方代码库外使用此检查点请确保运行时环境匹配DR-Venus的工具模式和消息格式特别是search、visit、tool_call和tool_response的使用规范。 适用场景与限制最适合的场景长时程网络研究任务需要外部信息检索的开放域问题作为强化学习前的初始代理检查点部署在DR-Venus官方推理管道中不推荐的场景无工具使用的纯聊天通用指令跟随基准测试无外部检索的短上下文问答 许可证与引用使用前请确认与以下内容的许可证兼容性上游基础模型发布的训练数据下游设置中使用的外部工具和基准如果使用此检查点请引用DR-Venus项目article{venus2026drvenus, title{DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data}, author{Venus Team and Dai, Sunhao and Deng, Yong and Lin, Jinzhen and Song, Yusheng and Wang, Guoqing and Wu, Xiaofeng and Zhou, Yuqi and Yang, Shuo and Ying, Zhenzhe and Zhang, Zhanwei and Meng, Changhua and Wang, Weiqiang}, journal{arXiv preprint arXiv:2604.19859}, year{2026} } 后续发展DR-Venus-4B-SFT作为初始检查点已进一步优化为DR-Venus-4B-RL模型在各项基准测试中取得了更优异的成绩。项目团队将持续改进模型性能探索在有限数据和计算资源下实现前沿级深度研究代理的可能性。对于希望深入了解或参与项目的用户可以关注项目的SFT代码和推理代码实现探索更多定制化应用的可能性。【免费下载链接】DR-Venus-4B-SFT项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/DR-Venus-4B-SFT创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考