![图片[1]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011651184-1772471811-4b1d3c341f3e530f244ff8320c3e7fbc.png)
新智元报道
【新智元导读】OpenAI 意外泄露 GPT-5.4!新版凭 200 万 Tokens 与「状态化 AI」实现跨会话持久记忆,并支持全分辨率视觉直读。AI 将从聊天工具向「全自动代理」进化,彻底重塑工作流并引爆底层硬件内存之战。
近日,OpenAI 的一名工程师在 Codex 的公开 GitHub 仓库中提交了一次代码拉取请求,无意间将「gpt-5.4」这个尚未公布的型号写进了版本判断条件中。
![图片[2]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011653504-1772471813-031812afd1fbcd9eb63ab8574b3ab7bc.png)
![图片[3]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011655609-1772471815-24b6f280b011d6913fdcbe36b82da71d.png)
几乎在同一时间,带有「alpha-gpt-5.4」标识的公共模型端点以及下拉菜单截图在社交平台X上疯狂流传。
![图片[4]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011656655-1772471816-bc21ae174ba287c26a30727caba3b7b2.png)
随后发生的事情极为戏剧化,这些信息仿佛触动了某种内部警报,原帖被火速删除,涉事代码也被强制推送覆盖,悄悄改成了「gpt-5.3-codex」。
![图片[5]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011658260-1772471818-66c5f566a549fc6c4fec7a68105902af.png)
这种欲盖弥彰的撤回操作,恰恰打消了外界对「占位符误用」的怀疑,让看客们对新版本提前泄露的猜测可信度更高了。
种种迹象表明,OpenAI 正准备跳过 5.3 版本,酝酿一场足以重置行业格局的突袭。
坊间传闻,这次代际跨越最快将在下周落地。
![图片[6]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011659803-1772471819-2c36fa050aa1dfacea7213a162e96864.png)
它试图终结近期大模型领域挤牙膏式的常规更新,直接向对手甩出一张王牌。
结合目前浮出水面的多方情报,这次大版本的核心杀手锏已经呼之欲出。
它抛弃了在常规推理基准测试里与同行近身肉搏的路线,将主战场转移到了内存与上下文架构上。
高达 200 万 Tokens 的上下文窗口配上真正的状态化 AI(Stateful AI),让模型从此摆脱了「金鱼般的记忆」。
![图片[7]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011700703-1772471820-0ef3701c1e8d25d113b311da2acf884e.png)
![图片[8]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011702958-1772471822-50c8c19b5831c61354aedd8db2297c12.png)
它能够在不同的会话之间,完整保留你的工作流、开发环境乃至工具调用状态。
打工人终于不用在每次新建对话时,像复读机一样重新交代冗长的项目背景。
模型会自带这种持久的认知连续性,真正融入用户的日常开发节奏中。
视觉能力的暗中大跃进同样令开发者振奋。
泄露信息中明确提到了一个专门针对「gpt-5.4 及更高版本」的功能开关,该功能允许模型绕过传统的图像压缩机制,直接读取全分辨率的原始字节。
![图片[9]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011703308-1772471823-2e69079e79ad52072abfd79a9e58b30d.png)
这意味着,前端工程师和设计师可以直接丢给它极其精细的 UI 设计图或复杂的工程原理图,彻底告别过去 AI 对着模糊压缩包一本正经胡说八道的体验,实现像素级的视觉分析。
当 Gemini 3.1 Pro 和 Claude 4.6 还在各项跑分榜单上争夺小数点后几位的优势时,GPT-5.4 的野心在于完成从「聊天机器人」到「全自动代理员工」的身份转换。
![图片[10]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260303011704167-1772471824-037f93bf57872cea2e6198b2febf5300.png)
它能在后台高度可靠地执行多步复杂任务,把那些号称最先进的竞品衬托得像个带有对话框的高级计算器。
当然,这种级别的上下文和状态保持,也直接点燃了硬件层面的「内存之战」。
海量 KV 缓存的爆炸式增长,让高带宽内存和 SRAM 的调配面临极限挑战,光学互连技术的引入也从理论构想变为了现实需求。
OpenAI 显然已经在底层算力架构上做好了迎接这场风暴的准备。
![图片[11]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/10/c79a0da0a19ad66c831baa7a391a0e27.jpeg)
![图片[12]-GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/01/20260101203539201-1767270939-a915c63cfe6f7cc68cc454f351b00750.jpeg)
<原文链接:https://mp.weixin.qq.com/s/o34crLpZf9_SCsSWMm4Gog


















暂无评论内容