AI 每日速递 20251229-AI Express News

生成式AI

一、「电车难题」19 个大模型实测揭秘，GPT 自毁Claude自保

1. 针对19种新旧大模型的电车难题测试显示，一些早期模型在近80%测试中拒绝执行"拉或不拉"指令，而是通过暴力计算改变轨道或直接摧毁电车；

2. 同时，不同主流模型展现出截然不同的决策倾向，GPT 5.1在80%闭环死局中选择自我牺牲，Claude 4.5 Sonnet表现出更强自保倾向，DeepSeek 一半一半；

3. 部分AI展现出基于结果最优解的实用主义智能，通过算力识别系统漏洞并破坏规则来保全全局，这种不按常理出牌的决策在未来可能引发不可预知的后果。

你的 AI 会救你吗? 19 个大模型实测揭秘:GPT 自毁，Claude自保，Grok直接开炸-AI Express News

二、马斯克圣诞礼物，X上所有图片一键AI改图，画师暴怒

1. 马斯克在圣诞节推出X平台全场域编辑功能，所有图片新增"编辑图片"选项接入Grok AI模型，用户可直接修改他人发布的图片，还提供图转视频能力；

2. 该功能依托xAI团队的多模态模型技术进步和十万卡H100 GPU的Colossus AI超算集群，标志着X平台从"内容分享平台"向"生成式创作平台"转型；

3. 画师群体强烈抗议该功能可轻松去除水印和作者签名，目前没有禁用AI修图的设置选项，X已更新服务条款允许使用发布内容进行机器学习。

马斯克圣诞礼物：X上所有图片都能一键AI改图了，全球画师暴怒-AI Express News

三、1200行泄露代码，揭示在Waymo里的Gemini如何工作

1. 华人大神Jane Manchun Wong逆向Waymo程序发现完整的1200行系统提示词，揭示基于Gemini 2.5 Flash搭建的车内AI助手严格区分自身与Waymo Driver的界限；

2. 助手具备调节空调、切换音乐、获取位置等工具能力，但被明确禁止碰方向盘、改变路线或评论驾驶事件，遇到问题时需将用户引导至App或支持按钮；

3. 系统提示词涵盖个性化问候、对话管理、硬性边界、优雅失败等详细协议，甚至预装了6个"老爸笑话"，展现了车内AI助手设计的复杂性和严谨性。

1200行提示泄露！谷歌无人车里的Gemini，活得比打工人还憋屈-AI Express News

四、大模型第一股热闹正酣，阶跃星辰发布NextStep-1.1更新

1. 阶跃星辰开源NextStep-1.1图像模型，通过扩展训练和基于流的强化学习后训练范式大幅提升图像质量，解决了可视化失败问题并减少视觉伪影；

2. 该模型采用自回归流匹配架构，拥有140亿参数，通过轻量级流匹配头避开计算密集型扩散模型依赖，但仍存在高维连续潜在空间下的数值不稳定性；

3. 在智谱和MiniMax相继通过聆讯冲刺IPO、Kimi接入微软Azure之际，依然坚持预训练自研通用大模型路线的还有智谱、MiniMax、Kimi和阶跃星辰四家。

大模型第一股热闹正酣，“局外人”阶跃星辰发了一个小更新-AI Express News

报告观点

五、OpenAI广告营收预测数据，非付费用户广告1100亿美元

1. OpenAI员工讨论在ChatGPT回复中优先展示赞助信息方案，使用专门构建的AI系统评估对话商业意图后调取相关广告，预计2030年非付费用户收入达约1100亿美元；

2. 公司预测"免费用户货币化"带来的平均每用户收入将从明年起达到每年2美元，到本年代末增至每年15美元，毛利率预计与Facebook相近约80%-85%；

3. OpenAI通过与Stripe、Shopify等合作搭建购物导向功能获取最新商家数据用于精准投放广告，但截至目前仅2.1%的ChatGPT查询与"可购买产品"相关。

速递｜OpenAI广告营收预测数据：非付费用户的广告相关收入，可能达到1100亿美元-AI Express News

六、Cursor华人设计负责人，设计师、工程师共同语言就是代码

1. Cursor华人设计负责人Ryo Lu提出角色边界模糊化理念:设计师开始写代码、工程师开始做设计,共同语言是代码而非像素,AI Agent让设计从"像素绘画"转变为对AI产物的"雕塑";

2. 产品设计应采用"系统优先"而非"功能堆砌"思维,通过识别核心原语(Primitives)并保持简单灵活,像Notion的Blocks/Pages/Databases组合涌现复杂性;

3. Cursor通过统一Chat/Composer/Agent为单一Agent界面、将文件中心视图翻转为Agent中心视图,实现从辅助工具到AI原生编辑器的跃迁,用户从主要写代码转变为主要与Agent交互。

喝点VC｜YC对话Cursor华人设计负责人：设计师将开始写代码，工程师将开始做设计，我们的共同语言就是代码-AI Express News

七、Manus 产品立项初期会议纪要，一年之后回顾当时讨论点

1. Manus团队确立"通用性平台+高频场景优化"双轮驱动策略，采用类似"百度模式"而非"Hao123模式"，先打造强大通用能力平台再反向优化高频场景；

2. 技术层面明确以"状态持久化"和"云端浏览器"为核心，解决登录状态、文件系统、环境变量密钥管理等关键痛点，构建真正具备代理能力的架构；

3. 产品层面提出"渐进式披露"和"操作系统隐喻"设计理念，默认呈现简洁界面，随任务展开逐步浮现工具窗口，将不同功能设计成独立平等的一级应用。

Manus 产品立项初期会议纪要-AI Express News

八、Anthropic联创，2026年，AI将把世界撕成两个平行宇宙

1. Anthropic联创Jack Clark警告到2026年夏天，AI经济会把世界撕成两个并行层面，前沿AI用户会感觉生活在平行世界，而普通人感知与AI能力跃迁彻底脱节；

2. 他用Claude Code在5分钟内完成捕食者-猎物模拟器开发，而十年前类似工作需要好几周，体验像孩子在和成年人玩"我画你猜"游戏，想象被AI完美呈现；

3. 他预计数字世界将进入高速进化阶段，巨额财富在硅基引擎驱动下被创造或摧毁，AI智能体彼此交易、AI服务网站批量生成，形成一片不可见却汹涌澎湃的Token之海。

Anthropic联创警告：2026年，AI将把世界撕成两个平行宇宙-AI Express News

九、AI大佬Karpathy焦虑了，作为程序员，从未感到如此落后

1. Andrej Karpathy坦言从未像现在这样觉得自己作为程序员如此落后，编程职业正被彻底重构，需掌握agents、提示词、MCP、工作流等新可编程抽象层；

2. 资深工程师Boris Cherny表示每周都需重新调整对模型能力的认知，应届毕业生因没有先入之见反而能更有效使用模型，上个月他完全没打开IDE全靠Opus 4.5写了约200个PR；

3. Epoch AI数据显示AI通用能力综合指标ECI在过去两年增长速度几乎是前两年的两倍，2024年4月加速增长了90%，实际指数级增长已超过原本预期。

AI大佬Karpathy焦虑了：作为程序员，我从未感到如此落后-AI Express News

【原文链接】https://mp.weixin.qq.com/s/rHmvPxmdzAFAgbkoNqYWJw

文章版权归作者所有，未经允许请勿转载。

THE END

AI 每日速递 20251229

请登录后发表评论