Claude 1M正式上线,价格一分不涨,搭了半年RAG的人崩了。。。

发布时间:2026/6/8 3:17:19

Claude 1M正式上线,价格一分不涨,搭了半年RAG的人崩了。。。 你让AI帮你分析一份长合同。AI告诉你太长了装不下你分几次喂吧。你让AI帮你审一整个代码项目。AI告诉你只能看一部分你挑重要的给我。你想让AI同时参考你的需求文档、竞品报告、会议纪要。AI告诉你一次放不下这么多分四次聊吧。这些问题的根源都一样。AI一次能看的信息量有个上限行话叫 上下文窗口 。以前Claude的上限是200K Token。Token是AI的计费单位大约1.5个Token≈1个中文字200K大约能装15万中文字。听着不少但真用起来很快就满了。从今天开始这个上限翻了5倍。Claude Opus 4.6和Sonnet 4.6正式全面开放 1M上下文窗口 。不是内测不是等待名单直接能用。最关键的三个字 不涨价 。有人可能会说1M不是早就有了吗没错之前确实有。但那是 Beta 。需要在API请求里手动加特殊参数才能开启普通用户根本不知道怎么用。而且Beta期间有 长上下文溢价 ——超过200K的部分输入价格翻倍输出涨50%。等于你用1M的代价比用200K贵得多。这次的变化是两件事同时发生1、Beta转正所有用户直接可用不需要任何额外操作2、溢价全部取消1M和200K完全同价老金我看到这个消息第一反应是去翻了AnthropicClaude的母公司的定价页面。确认了三遍。Opus 4.6还是$5/$25每百万TokenSonnet 4.6还是$3/$15。不管你用200K还是塞满1M单价一分不变。之前Beta期间用1M要多花一倍的钱现在免费升级。这也太实在了吧。。。1M到底能装多少东西先说结论。1M Token ≈ 75万英文单词 ≈ 大约50万中文字 。什么概念一本《哈利·波特》全集大概110万英文单词。1M能装下大半套。换到你日常工作的场景就更好理解了。你是写书的一整本10万字书稿的素材、提纲、已写章节全部一次性丢进去让AI帮你找前后矛盾。以前得切好几段喂改完再拼接的时候前后语气对不上那种感觉只有写过长文的人才懂。你是做法务的一份200页合同加上所有相关条款解读一次性喂完让AI找风险点。以前得自己切段落AI看不到全貌经常断章取义你还得跟在后面一段段纠正。老金我自己是做产品的PRD技术方案会议纪要竞品分析以前分四次对话才能喂完每次开头都得重复一遍上下文。现在一次搞定这效率差距你自己体会。程序员就更爽了。一个中型代码仓库50万到80万Token整个扔进去。以前200K的窗口你得精挑细选喂哪些文件经常漏了关键依赖AI给你写出一堆莫名其妙的bug。以前200K像是给AI戴了个望远镜只能看到局部。1M相当于把望远镜换成了全景摄像头整个桌面一眼看清。具体升级了什么老金我把Anthropic官方文档翻了一遍核心参数拉出来给你们看。Claude Opus 4.6最强旗舰适合最复杂的任务上下文窗口200K默认→ 1MGA无溢价最大输出128K Token大约8万中文字API价格$5输入/ $25输出每百万Token之前状态Beta期间1M需要手动开启输入价格翻倍Claude Sonnet 4.6性价比之王日常首选上下文窗口200K默认→ 1MGA无溢价最大输出64K Token大约4万中文字API价格$3输入/ $15输出每百万Token之前状态Beta期间1M需要手动开启输入价格翻倍Claude Haiku 4.5轻量快速适合简单任务上下文窗口保持 200K 没动。这里面有几个细节容易搞混老金我帮你理一下。Beta转正才是重点。之前1M是Beta状态默认200K要手动加API参数才能用。现在直接GA所有人默认就是1M不需要任何额外操作。溢价取消才是最大福利。Beta期间用1M超过200K的部分输入价格翻倍2x输出涨50%1.5x。现在全部取消1M和200K完全同价。上下文扩大≠输出变长。能看的多了但一次说的量没变。Opus还是最多输出128KSonnet还是64K。这是两个独立参数。Haiku没升。说明1M对算力要求不低Haiku定位轻量快速暂时不需要塞这么大的上下文。而且这个图上可以看到Opus 4.6 在 MRCR v2 测试中取得了 78.3% 的分数。是同等上下文长度下前沿模型中的最高分。三家都是1M了但定价完全不一样这件事最大的意义不在技术参数。在定价。百万级上下文不是新鲜事。Gemini从1.5就有了GPT-5.4月初也跟上了。Claude是最后一个到的。但Claude做了一件别人没做的事。不涨价。不是基础价不涨是真的一分钱不涨1M和200K完全一个价。Gemini 3.1 Pro和GPT-5.4都有 长上下文溢价 。什么意思就像手机流量套餐月底超了之后每兆都更贵。你用的Token超过一定量单价翻倍。来看具体数据。Gemini 3.1 Pro输入≤200K Token$2/百万Token输入200K Token$4/百万Token直接翻倍输出≤200K Token$12/百万Token输出200K Token$18/百万Token涨50%GPT-5.4输入基础价$2.50/百万Token超过272K Token后价格翻倍Claude Opus 4.6 / Sonnet 4.6不管你用200K还是1M单价一分不变。老金我帮你算一笔实际的账。假设你要处理1M Token的输入比如喂一整个代码仓库或者一整本书的内容。看到没Claude Sonnet处理1M输入反而比Gemini 3.1 Pro便宜17%。之前很多人选Gemini就是因为长上下文又好又便宜。现在算一笔细账大量输入的场景下Claude Sonnet更便宜。这个定价策略才是这次升级最炸裂的地方。如果对你有帮助记得关注一波~怎么用上1M说了一堆参数落到怎么用上。其实没什么好教的。确保你用的模型是Opus 4.6或Sonnet 4.61M自动就有了。claude.ai网页版的Pro会员直接能用。打开对话的时候选对模型就行上下文自动1M没额外设置没额外费用。上传长文档、粘贴大段内容比以前能装多5倍。用API开发的更简单不需要改一行代码。model参数还是填 claude-sonnet-4-6 或 claude-opus-4-6上下文窗口自动从200K扩到1M定价不变调用方式不变。Cursor、Windsurf这些AI编程工具设置里模型切成Claude就完事了。搭了半年RAG的人怎么办标题里提到的RAG全称Retrieval-Augmented Generation。不懂没关系老金我用大白话解释。以前上下文不够用你想让AI参考一大堆文档怎么办得搭一套复杂的系统把文档切成小块→存到专门的数据库→用户提问时自动检索相关段落→拼接到AI能看的范围内。光这套系统就够折腾一两个月还需要懂技术。现在1M上下文很多简单场景直接喂全文就完事了。不需要切块、不需要数据库、不需要检索。但RAG不是完全没用了。文档量超过1M的比如企业知识库有几千份文档还是需要。需要实时更新数据的场景比如每天都有新内容进来也需要。只是说以前因为上下文装不下而被迫搭RAG的那些场景现在可以大幅简化。之前花一两个月搭的那些简单场景RAG确实白忙了。。。要注意什么好的说完了限制也得说清楚。第一不是每次都需要1M。上下文越长响应越慢花费越多。日常问个问题、写个短文案用不着塞这么多东西进去。别没事把1M塞满真的烧钱。。。第二长上下文有个中间遗忘的毛病。你让AI读一本书开头和结尾它记得很清楚但中间部分容易走神。学术上叫 Lost in the Middle中间丢失所有大模型都有这个通病。老金我自己试过把一份很长的文档丢进去结果中间一段关键数据它直接给漏了。所以关键信息尽量放在开头或结尾别埋在正中间。第三Haiku用户暂时没份。Haiku 4.5还是200K没动。你主要用Haiku的话这次升级跟你关系不大。老金我的建议在用Claude的直接试。把之前因为上下文限制做不了的事拉出来重新跑一遍长文档分析、代码审查、多文件对比看看哪些现在能一把搞定。还在纠结选哪家的别光看上下文了三家都是1M。重点看定价逻辑大量输入的场景Claude Sonnet反而最便宜上面那个表格你自己算。纯观望的也没事。短期你可能感知不到变化但建立在Claude上的工具都会因此变强。Claude Code、Cursor这些AI编程工具首当其冲。说到底200K到1M不只是参数翻了5倍。是从AI只能看一个文件到AI能看整个项目的质变。这才是真正有意义的升级。你们怎么看1M上下文你最想用在什么场景评论区聊聊。往期推荐开源知识库地址实时更新交流群https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFfClaude Code Openclaw 双顶流全中文从零开始的教程不懂代码照样造网站老金15万字Claude CodeOpenClaw教程免费开源我的小破站含我开源的项目https://www.aiking.dev/每次我都想提醒一下这不是凡尔赛是希望有想法的人勇敢冲。我不会代码我英语也不好但是我做出来了很多东西在文末的开源知识库可见。我真心希望能影响更多的人来尝试新的技巧迎接新的时代。谢谢你读我的文章。如果觉得不错随手点个赞、在看、转发三连吧如果想第一时间收到推送也可以给我个星标⭐谢谢你看我的文章。

相关新闻