Jay 发自 凹非寺
量子位 | 公众号 QbitAI
OpenAI的红色预警,还在发力。
憋了大半年的图像生成模型——GPT-Image-1.5,终于发布。
据官方表示,本次更新主要有四个亮点:
-
更严谨的指令遵循; -
精确编辑; -
细节保留; -
速度比以前快4倍。
感觉……这是要全面对标Nano Banana了啊。
目前的玩法也很类似。比如,将汽车颜色改为橙色。
![图片[1]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203837512-1765975117-eb87e03bce4be85988e56d6652ef6ca5.png)
拯救这个被烤焦的饼。
![图片[2]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203839175-1765975119-cfd97d4afdadc98a6ecbb95a811ab682.png)
根据奶昔架、芝士汉堡等元素,做一个复古风格的餐馆广告。
![图片[3]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203841691-1765975121-9561b79fc3ffe8e50c8d800e719baf35.png)
指令遵守和精确编辑方面,的确比之前强了不少。
而且今天就能用上了,GPT-Image-1.5将在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5推出。
OpenAI最强图像生成模型
被谷歌一轮正面「拷打」之后,OpenAI藏了大半年的GPT-Image-1.5,终于憋不住了。
这个旗舰级图像生成模型,主打精准编辑、细节保留,图像生成速度最高提升4倍。所有改进,都指向同一个产品理念——实用性。
编辑图像时,GPT-Image-1.5对指令的遵循更加严谨:光照、构图、人物外观等关键要素,能够在输入、输出及多轮编辑中保持高度一致。
例如:生成一张2000年代胶片相机风格的照片,画面中两名男子和一条狗出现在孩子的生日派对上,神情略显无聊。
![图片[4]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203843489-1765975123-d274d8b620896dcc9e0ebeb406c58d35.png)
在不改变原始画面结构的前提下,还可以「加戏」,邀请一群小朋友入镜捣蛋,整体风格与细节依然能保持一致。
![图片[5]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203844899-1765975124-863b51dd47747a320dd3398a34d7701d.png)
在图像风格层面,真实感也有了明显提升。比如下面这个Prompt:
拍摄一张20世纪70年代伦敦切尔西的场景照片,画面要逼真,所有景物清晰对焦,人群密集,还有一辆公交车,车身贴着「ImageGen 1.5」的广告,广告上印有OpenAI标志和「创造你的想象」的副标题。整体风格像业余摄影作品,iPhone快照画质……
左边是新模型,右边是旧模型,差距还是挺明显。
![图片[6]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203844717-1765975124-677534e70de49cc5cfadff6c9807ca72.png)
即便是更偏创意的任务,同样能够稳定保留关键信息与人物特征。
根据这两位男士的图片,制作一张名为《Codex》的好莱坞黄金时代电影海报。演员姓名改为Wojciech Zaremba(左)和Greg Brockman(右),由奥特曼执导,菲吉·西莫制片,AGI影业出品。
![图片[7]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203845399-1765975125-8196ceb4711a960993a82b9d19d2608f.png)
创作一张深海生物在不同深度的海报,采用垂直海洋剖面图,风格为精美细致的日式动漫风格。
![图片[8]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203847452-1765975127-c6c361ee382a12e9c3959981a8a3688e.png)
前段时间,Nano Banana在答题卡上写「小作文」的能力火爆全网。GPT也能实现了。
这次,GPT-Image-1.5在文本渲染上进步明显,能够处理更密集、更小字号的文字。甚至可以根据给定资料,直接把GPT-5.2的技术报告做出来了。
![图片[9]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203849248-1765975129-9fb4a8278c4e116d39f45ee0bfacc449.png)
除了模型能力的升级,产品形态也随之调整。
OpenAI在ChatGPT中新增了专门的图片板块,内置数十种滤镜与Prompt,可通过App侧边栏或官网直接访问。
来到Benchmark环节,自然少不了「秀肌肉」。
评测机构Artificial Analysis指出,GPT-Image-1.5在文本转图像和图像编辑方面中均位列第一,超过Nano Banana Pro。
![图片[10]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203850257-1765975130-0a81cc7d6e96205994a4b9cb52701da3.png)
不过,在更强调精细化图像编辑能力的GenAI Image Editing Showdown中,GPT-Image-1.5仍未能反超谷歌。
但值得注意的是,其指令遵守率高达90%,断层式领先。
![图片[11]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203851573-1765975131-157a291c48fde8329e0ec58b91130553.png)
按照OpenAI的说法,该模型将于今日起面向全球所有ChatGPT用户与API用户全面开放。
定价方面,GPT-Image-1.5的API相较上一代GPT Image 1,输入与输出成本整体下降20%。
具体价格因分辨率而异:
-
高质量图像约为每千张133美元; -
低质量图像约为每千张9美元。
不得不说,这波谷歌立大功。(doge)
世界理解,还得看香蕉?
「精细编辑+降价」,OpenAI这次,看来是铁了心要把图像功能推向生产力工具。
新模型发布后,曾任微软AI副总裁、现就职于OpenAI的Sebastien Bubeck也第一时间下场,为GPT-Image-1.5站台。
![图片[12]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203853367-1765975133-23491ae8905780e28a2ca7cdc127bccf.png)
但质疑也随之而来。
有网友指出,GPT-Image-1.5在「理解世界」这一层面,似乎仍不如Nano Banana:
问题太多了。左边球体中的「线」是由三个不相连的环组成,每个方程式都有错……像是在凭感觉做数学题?
![图片[13]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203854651-1765975134-72624224d6d367b70eb811443b5810b4.png)
对此,Sebastien Bubeck解释道:
这只是做着玩的,如果是正式海报,肯定会在此基础上迭代。
![图片[14]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203855589-1765975135-838edb8197eee4a731a3b06bb8e10f4f.png)
事实上,对GPT-Image-1.5世界理解能力的质疑,并非个例。
AI社区的知名「内部」人士,Jimmy Apples在评测后直言:
相比上一代提升很大,但不如香蕉聪明。
![图片[15]-反超Nano Banana!OpenAI旗舰图像生成模型上线-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251217203856112-1765975136-7dfbd996c1b1193f97ada3de6c39a4e5.png)
具体而言,他认为:如果只是创意性工作,影响不大;但如果是做PPT,GPT-Image-1.5给出的图片可能会有信息错误。
Nano Banana感觉更像一个世界模型。
参考链接:
[1]https://x.com/ArtificialAnlys/status/2001016199094948185?s=20
[2]https://x.com/SebastienBubeck/status/2001038641469194588?s=20
[3]https://x.com/apples_jimmy/status/2001053915278926228?s=20
[4]https://genai-showdown.specr.net/image-editing
[5]https://openai.com/index/new-chatgpt-images-is-here/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
🌟 点亮星标 🌟
原文链接:https://mp.weixin.qq.com/s/V-yDn-vVXrKNpefbdd1tow


















暂无评论内容