Qwen3.7来了,全球排名第13,国内第一

发布时间:2026/5/21 12:26:18

Qwen3.7来了,全球排名第13,国内第一 5月18日Arena大模型竞技场官方账号突然公布了Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview的最新成绩。Qwen官方账号迅速跟进“我们已经迫不及待想发布Qwen3.7系列了”上一个版本还来不及讨论完下一个版本已经端上了桌。官微预告“来了来了TA要来了”。说的应该就是20日阿里云峰会将发布Qwen 3.7。从Arena公布的成绩来看两款预览版模型各有亮点。Qwen3.7-Max-Preview在文本领域整体排名第13是全球前十五名中唯一的中国模型这一成绩直接将阿里巴巴的实验室排名推升至第6位。排在它前面的分别是Claude Opus 4.6和4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.4-High等西方头部模型。而Qwen3.7-Plus-Preview在视觉领域拿下第16名让阿里实验室在视觉赛道的总排名攻入前五同样是该榜单上国产模型的最高名次。值得关注的是在细分赛道中Qwen3.7-Max-Preview展现出了强劲的技术深度数学赛道排名第7专家提示赛道排名第9软件/IT赛道排名第9Coding赛道排名第10均进入全球前十。模型不仅是综合能力的提升更是在数理推理、专业知识和代码生成等关键赛道上实现了突破性进步。模型发布节奏加速4月底阿里才刚刚发布了Qwen3.6-Max-Preview到了5月19日Qwen3.7预览版就已端上桌了。Qwen3.6-Max还处于预览版阶段Qwen3.7-Max预览版就紧随其后这种“两代超大杯并行迭代”的现象在业内极为罕见。回顾整个Qwen的迭代历史可以清晰地看到这种加速趋势。早期2023–2024年Qwen的发布节奏相对稳健大版本更新间隔4至6个月与行业主流节奏相当。转折点发生在Qwen3系列2025年发布的Qwen3包含Dense模型和MoE模型参数规模从0.6B到235B引入了Thinking模式和Non-Thinking模式的双模式设计。其中Thinking模式支持复杂推理、长链路决策和Agent任务Non-Thinking模式则偏向低延迟快速响应。这一设计思路极大地拓展了模型的应用边界。而进入2026年以后Qwen3及后续版本的迭代节奏明显提速大版本间隔缩短至2至3个月一次并且几乎每个月都有新动作。从Qwen3.5到Qwen3.6再到Qwen3.7版本号更新非常迅速。而且普遍节奏是预览版先上线社区先测试开发者先用然后正式版再跟进。这一策略既能让团队快速获取市场反馈也能在竞争中占据话语权是典型的“小步快跑”迭代策略。回顾2025年阿里在云栖大会上阿里云智能CTO周靖人在大会上宣布通义已成为全球第一开源模型开源300余模型全球下载超6亿次衍生模型17万个。2026年Qwen前负责人林俊昂离开时发布的那条推特“Qwen的兄弟们按原来安排继续干没问题的。”他离开时Qwen处于3.5时代与DeepSeek一样是国产开源界的标杆模型。不管是延续以往的作风还是在新负责人的带领下后续的Qwen3.5、3.7版本确实依然在一步一步更快也更好。国内大模型竞争白热化从2025年开始国内大模型竞争就已经从“技术竞赛”转向“生态竞争”阿里、字节、腾讯、百度四大厂各自站队形成了新的竞争格局。据统计2025年四巨头的整体资本开支增长了45%而结合调研数据和市场预期2026年预计还将增长30%。这意味着大模型赛道的竞争本质已经从“模型能力”转变为“生态控制力”之争。DeepSeek依然是国内大模型市场的一个重要变量。26年DeepSeek-V4正式上线梁文峰启动外部融资开始招聘Harness产品经理正式开启DeepSeek版的Claude Code进化之路。腾讯混元重组后近期刚发布的混元Hy3 Preview模型展现了强有力的竞争态势。OpenRouter的数据显示4月28日至5月11日连续三周登顶OpenRouter周榜总榜。而小米MiMo v2.5 Pro在专家竞技场排名第7。除了前文提到的几家头部大厂智谱、MiniMax、阶跃星辰、Kimi等玩家也在密集出牌各自寻找差异化路径试图在竞争激烈的市场中占据一席之地。智谱无疑是近期最引人注目的明星之一。2026年1月智谱以“全球大模型第一股”的身份登陆港交所此后股价一路飙升市值一度突破5000亿港元。在模型层面智谱今年先后发布GLM-5和GLM-5.1旗舰模型其中GLM-5.1在编程Agent场景中代表了国产大模型的SOTA水平。智谱一反过去价格战的逻辑率先打破“免费”叙事多次上调API价格将编码场景定价直逼Anthropic的Claude Sonnet 4.6。这一定价策略背后是技术底气的支撑2026年一季度智谱API调用定价虽提升83%调用量却增长了400%供不应求的局面让市场对这种“技术溢价”投下信任票。MiniMax同样势头强劲。3月MiniMax发布旗舰模型M2.7首次展示了“模型自我进化”路径。该模型通过Agent Harness框架深度参与自身训练优化在部分研发场景中可承担30%至50%的工作量内部评测集上实现约30%的效果提升。MiniMax还推出了新一代音乐生成模型Music 2.6首包延迟大幅降至20秒以内。在资本市场MiniMax与智谱共同构成了港股大模型概念的核心力量。Kimi背后的月之暗面则在融资和技术两端同时发力。4月20日月之暗面发布并开源Kimi K2.6模型采用1T参数MoE架构支持连续编码13小时、Agent可持续自主运行5天重登开源模型全球第一。在商业化层面Kimi的年度经常性收入在2026年4月突破2亿美元并完成新一轮约20亿美元融资投后估值突破200亿美元。除了以上其他玩家也并未停下脚步。阶跃星辰、商汤、蚂蚁等等都有自己强劲的模型陆续发布。纵观全局2026年中国大模型赛道的竞争焦点已全面转向商业化效率和生态控制力。接下来的比拼将更多取决于谁能率先跑通商业闭环在“开源生态、定价策略和客户黏性”的三角博弈中找到最优解。参考资料https://x.com/Alibaba_Qwen/status/2056403591464984753

相关新闻