深度研究代理DR-Venus-4B-SFT：4B参数AI如何实现长时程工具使用-尧图网站设计

深度研究代理DR-Venus-4B-SFT4B参数AI如何实现长时程工具使用【免费下载链接】DR-Venus-4B-SFT项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/DR-Venus-4B-SFTDR-Venus-4B-SFT是一款基于4B参数构建的深度研究代理通过在清理后的开放数据代理轨迹上对Qwen3-4B-Thinking-2507进行微调而获得。作为DR-Venus项目的监督初始化检查点它专门设计用于建立稳定的长时程代理行为包括推理、工具使用、证据收集和最终答案合成。为什么选择DR-Venus-4B-SFT这款模型的核心优势在于仅使用4B参数量就实现了前沿级的长时程工具使用能力。与依赖专有轨迹数据的模型不同它完全基于开源的REDSearcher轨迹训练经过环境对齐、结构清理、正确性过滤和转向感知重采样等多重优化流程。模型核心能力长时程工具使用支持search和visit两种核心工具能处理超过200K序列长度的研究任务开放域信息检索擅长通过工具获取外部知识并整合到推理过程中证据驱动回答强调基于搜索结果和访问内容生成有依据的回答轻量级部署4B参数设计使其在普通硬件上也能高效运行性能表现超越同级别模型在多项深度研究基准测试中DR-Venus-4B-SFT建立了强大的4B参数基线超越了许多更大规模的模型模型BrowseCompBrowseComp-ZHGAIA (Text-Only)xBench-DS-2505DeepSearchQAWebExplorer-8B-RL15.732.050.053.717.8AgentCPM-Explore-4B24.129.163.970.032.8DR-Venus-4B-SFT26.835.765.469.037.7DR-Venus-4B-RL29.137.764.474.739.6特别值得注意的是DR-Venus-4B-SFT在中文基准BrowseComp-ZH上达到35.7分显著领先于同级别模型展示了其在多语言深度研究任务上的优势。️ 技术架构解析基础模型与训练框架基础模型Qwen/Qwen3-4B-Thinking-2507模型类型长上下文推理模型专为工具增强型深度研究设计训练框架verl火山引擎开源框架训练数据10,001条原始轨迹 → 9,365条正确性过滤轨迹 → 18,745条重采样后SFT训练实例关键参数配置根据config.json文件模型的核心配置包括隐藏层大小2560注意力头数32隐藏层数36最大位置嵌入262144支持超长上下文词表大小151936数据类型bfloat16这些参数的精心配置使4B参数量模型能够高效处理长时程研究任务。数据处理流程DR-Venus-4B-SFT的训练数据经过严格处理确保高质量和高利用率格式转换将原始轨迹转换为DR-Venus推理管道使用的交互格式工具标准化统一search和visit工具调用协议数据清洗移除不允许的工具和重复的工具调用轮次正确性过滤保留结构有效且最终答案正确的轨迹重采样通过转向感知重采样提高长时程轨迹的权重快速开始指南要使用DR-Venus-4B-SFT建议配合官方推理管道git clone https://gitcode.com/hf_mirrors/inclusionAI/DR-Venus-4B-SFT cd DR-Venus/Inference pip install -r requirements.txt # 配置模型路径到run_demo.sh或run_web_demo.sh bash run_demo.sh如果在官方代码库外使用此检查点请确保运行时环境匹配DR-Venus的工具模式和消息格式特别是search、visit、tool_call和tool_response的使用规范。适用场景与限制最适合的场景长时程网络研究任务需要外部信息检索的开放域问题作为强化学习前的初始代理检查点部署在DR-Venus官方推理管道中不推荐的场景无工具使用的纯聊天通用指令跟随基准测试无外部检索的短上下文问答许可证与引用使用前请确认与以下内容的许可证兼容性上游基础模型发布的训练数据下游设置中使用的外部工具和基准如果使用此检查点请引用DR-Venus项目article{venus2026drvenus, title{DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data}, author{Venus Team and Dai, Sunhao and Deng, Yong and Lin, Jinzhen and Song, Yusheng and Wang, Guoqing and Wu, Xiaofeng and Zhou, Yuqi and Yang, Shuo and Ying, Zhenzhe and Zhang, Zhanwei and Meng, Changhua and Wang, Weiqiang}, journal{arXiv preprint arXiv:2604.19859}, year{2026} } 后续发展DR-Venus-4B-SFT作为初始检查点已进一步优化为DR-Venus-4B-RL模型在各项基准测试中取得了更优异的成绩。项目团队将持续改进模型性能探索在有限数据和计算资源下实现前沿级深度研究代理的可能性。对于希望深入了解或参与项目的用户可以关注项目的SFT代码和推理代码实现探索更多定制化应用的可能性。【免费下载链接】DR-Venus-4B-SFT项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/DR-Venus-4B-SFT创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

深度研究代理DR-Venus-4B-SFT：4B参数AI如何实现长时程工具使用

相关新闻

BG3模组管理器终极指南：从新手到专家的完整模组管理解决方案

Gramps家谱软件完全指南：如何用免费工具轻松管理百年家族历史

告别测试报告流水账：用CAPL的TestStep函数写出清晰易懂的自动化测试日志

告别驱动精灵！手把手教你用DISM命令离线安装Win11的APPX驱动包

跨越网格与实体的鸿沟：stltostp如何将STL三角面片转换为STEP工程文件

Windows下Webots R2021a中文界面配置与Anaconda环境避坑全记录

把ESP32/ESP8266变成智能家居中枢：用ESPHome实现水位监测、WiFi信号感知与自动化联动

如何快速备份微信聊天记录？WeChatMsg完整使用指南

瑜伽馆平台|基于Spring Boot的瑜伽馆管理系统的设计与实现(源码+数据库+文档)

Windows内存管理优化方案：Mem Reduct深度解析与实践指南

分布式架构应用酒馆棋牌娱乐+扫码点餐系统技术方案

专业GTA5安全增强工具：YimMenu全面防护与功能扩展指南

让 AI 做代码 Review（CR）：测试如何提前在代码提交阶段发现 Bug？

问题不是要不要审，而是审查放在哪条路径

水纹真实度提升300%的关键技巧，深度拆解--style raw、--chaos 45与自定义tile texture协同机制

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程