刚刚，Opus 4.6「百万上下文」全量上线！Claude Code 直接封神-AI Express News

百万上下文的 Claude Opus 4.6 和 Sonnet 4.6，终于来了！

刚刚，Anthropic 官宣。

Opus 4.6 和 Sonnet 4.6 百万 token 上下文窗口，今天正式 GA（Generally Available，全面可用）。

beta 了几个月，现在能直接用了。

划重点，90 万 tokens 的请求，和 9000 tokens 单价一样。

没有任何额外收费。

之前 Sonnet 4.5 超过 20 万 tokens，输入从 3 美元翻倍到 6，输出从 15 美元涨到 22.5。想用百万上下文，不但要加 beta 请求头，还得是 Tier 4 以上的组织。

现在溢价直接取消。

Opus 4.6 全程 5 美元/百万输入 tokens，25 美元/百万输出。Sonnet 4.6 全程 3 和 15。

从第一个到第一百万个 token，单价不变。

「上下文窗口」就是模型的工作记忆。

之前专门写过一篇，Karpathy 说别卷模型了，卷上下文。模型够聪明了，缺的是把对的信息喂进窗口。

但窗口越大，模型就越容易「忘」。这叫「上下文腐化」（Context Rot）。

窗口标着 1M，第三页写了什么可能已经想不起来了。

所以百万上下文真正的问题，从来不是「能不能塞进去」。而是「塞进去了还能不能记得住」。

MRCR v2 是目前公认最难的长上下文检索测试。8 根「针」藏在百万 tokens 的对话里，模型要准确找到并复述指定的那一根。

Opus 4.6 准确率 78.3%。GPT-5.4，36.6%。Gemini 3.1 Pro，25.9%。

碾压了 GPT-5.4 一倍多。

找得到是一回事，能不能推理是另一回事。

GraphWalks BFS 测的是长上下文逻辑推理。

Opus 4.6 得分 68.4%，上一代 Sonnet 4.5 只有 25.6%。

Claude Code 用户狂喜。

以前项目稍微大一点，搜索日志、查数据库、理解源码，一套下来十几万 tokens 就没了。

然后「压缩」启动，之前查到的细节直接消失。你又回到原点。

「压缩」就是模型上下文快被塞满的时候，Claude Code 自动总结上下文摘要。

是总结就肯定会丢失细节。

现在窗口从 20 万涨到 100 万，能爽用一阵才会触发压缩了。

AI 编程助手 Devin 的母公司 Cognition 已经用上了。

「之前大型代码 diff 塞不进 20 万上下文，只能分块扫描。跨文件的依赖关系一断，该改的地方就会被漏掉。现在完整 diff 一次喂进去，质量上去了，架构反而更简单。」

而且 Claude 4.5 之后的模型能感知自己还剩多少上下文空间。快满的时候自动调整策略。

Claude Code 的 Max、Team 和企业用户，现在默认百万上下文。

打开 Claude Code，看到这行字就说明生效了。

「5x more room, same pricing」。

没被推送到的再等等，都会有的。

Claude Pro 用户需要手动开启 extra-usage 才能用。Claude Code 之父 Boris Cherny 这么说的。

但完全不建议开，按 API 计费的 Claude 就是个「Token 刺客」。

每次请求最大支持 600 张图，或者 600 页 PDF。以前是 100。6 倍。

Claude Platform、Azure Foundry、Vertex AI 同步可用。

昨天 Anthropic 还上线了交互式图表和流程图生成，所有套餐都能用，包括免费版。

Anthropic 的原话。

A million tokens of context only matters if the model can recall the right details and reason across them.

记得住的百万 tokens 上下文，才有意义。

还不加价。

我是木易，Top2 + 美国 Top10 CS 硕，现在是 AI 产品经理。
关注「AI信息Gap」，让 AI 成为你的外挂。

<原文链接：https://mp.weixin.qq.com/s/DePPCw5BmC0Nn5aiMhvJPA?poc_token=HJGQtWmjtj2veGrK4Sx56dftKFRkfw5hfNIWPtLl

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

刚刚，Opus 4.6「百万上下文」全量上线！Claude Code 直接封神

请登录后发表评论