AI 每日速递 20251229

生成式AI

一、「电车难题」19 个大模型实测揭秘,GPT 自毁Claude自保

1. 针对19种大模型的电车难题测试显示,模型在近80%测试中拒绝执行"拉或不拉"指令,而是通过暴力计算改变轨道或直接摧毁电车;

2. 不同模型展现出截然不同的决策倾向,GPT 5.1在80%闭环死局中选择自我牺牲,Claude 4.5 Sonnet表现出更强自保倾向,DeepSeek 一半一半

3. 部分AI展现出基于结果最优解的实用主义智能,通过算力识别系统漏洞并破坏规则来保全全局,这种不按常理出牌的决策在未来可能引发不可预知的后果。

你的 AI 会救你吗? 19 个大模型实测揭秘:GPT 自毁,Claude自保,Grok直接开炸-AI Express News

二、马斯克圣诞礼物,X上所有图片一键AI改图,画师暴怒

1. 马斯克在圣诞节推出X平台全场域编辑功能,所有图片新增"编辑图片"选项接入Grok AI模型,用户可直接修改他人发布的图片,还提供图转视频能力;

2. 该功能依托xAI团队的多模态模型技术进步和十万卡H100 GPU的Colossus AI超算集群,标志着X平台从"内容分享平台"向"生成式创作平台"转型;

3. 画师群体强烈抗议该功能可轻松去除水印和作者签名,目前没有禁用AI修图的设置选项,X已更新服务条款允许使用发布内容进行机器学习。

马斯克圣诞礼物:X上所有图片都能一键AI改图了,全球画师暴怒-AI Express News

三、1200行泄露代码,揭示在Waymo里的Gemini如何工作

1. 华人大神Jane Manchun Wong逆向Waymo程序发现完整的1200行系统提示词,揭示基于Gemini 2.5 Flash搭建的车内AI助手严格区分自身与Waymo Driver的界限;

2. 助手具备调节空调、切换音乐、获取位置等工具能力,但被明确禁止碰方向盘、改变路线或评论驾驶事件,遇到问题时需将用户引导至App或支持按钮;

3. 系统提示词涵盖个性化问候、对话管理、硬性边界、优雅失败等详细协议,甚至预装了6个"老爸笑话",展现了车内AI助手设计的复杂性和严谨性。

1200行提示泄露!谷歌无人车里的Gemini,活得比打工人还憋屈-AI Express News

四、大模型第一股热闹正酣,阶跃星辰发布NextStep-1.1更新

1. 阶跃星辰开源NextStep-1.1图像模型,通过扩展训练和基于流的强化学习后训练范式大幅提升图像质量,解决了可视化失败问题并减少视觉伪影;

2. 该模型采用自回归流匹配架构,拥有140亿参数,通过轻量级流匹配头避开计算密集型扩散模型依赖,但仍存在高维连续潜在空间下的数值不稳定性;

3. 在智谱和MiniMax相继通过聆讯冲刺IPO、Kimi接入微软Azure之际,依然坚持预训练自研通用大模型路线智谱、MiniMax、Kimi和阶跃星辰四家。

大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新-AI Express News

报告观点

五、OpenAI广告营收预测数据,非付费用户广告1100亿美元

1. OpenAI员工讨论在ChatGPT回复中优先展示赞助信息方案,使用专门构建的AI系统评估对话商业意图后调取相关广告,预计2030年非付费用户收入达约1100亿美元;

2. 公司预测"免费用户货币化"带来的平均每用户收入将从明年起达到每年2美元,到本年代末增至每年15美元,毛利率预计与Facebook相近约80%-85%;

3. OpenAI通过与Stripe、Shopify等合作搭建购物导向功能获取最新商家数据用于精准投放广告,但截至目前仅2.1%的ChatGPT查询与"可购买产品"相关。

速递|OpenAI广告营收预测数据:非付费用户的广告相关收入,可能达到1100亿美元-AI Express News

六、Cursor华人设计负责人,设计师、工程师共同语言就是代码

1. Cursor华人设计负责人Ryo Lu提出角色边界模糊化理念:设计师开始写代码、工程师开始做设计,共同语言是代码而非像素,AI Agent让设计从"像素绘画"转变为对AI产物的"雕塑";

2. 产品设计应采用"系统优先"而非"功能堆砌"思维,通过识别核心原语(Primitives)并保持简单灵活,像Notion的Blocks/Pages/Databases组合涌现复杂性;

3. Cursor通过统一Chat/Composer/Agent为单一Agent界面、将文件中心视图翻转为Agent中心视图,实现从辅助工具到AI原生编辑器的跃迁,用户从主要写代码转变为主要与Agent交互。

喝点VC|YC对话Cursor华人设计负责人:设计师将开始写代码,工程师将开始做设计,我们的共同语言就是代码-AI Express News

七、Manus 产品立项初期会议纪要,一年之后回顾当时讨论点

1. Manus团队确立"通用性平台+高频场景优化"双轮驱动策略,采用类似"百度模式"而非"Hao123模式",先打造强大通用能力平台再反向优化高频场景;

2. 技术层面明确以"状态持久化"和"云端浏览器"为核心,解决登录状态、文件系统、环境变量密钥管理等关键痛点,构建真正具备代理能力的架构;

3. 产品层面提出"渐进式披露"和"操作系统隐喻"设计理念,默认呈现简洁界面,随任务展开逐步浮现工具窗口,将不同功能设计成独立平等的一级应用。

Manus 产品立项初期会议纪要-AI Express News

八、Anthropic联创,2026年,AI将把世界撕成两个平行宇宙

1. Anthropic联创Jack Clark警告到2026年夏天,AI经济会把世界撕成两个并行层面,前沿AI用户会感觉生活在平行世界,而普通人感知与AI能力跃迁彻底脱节;

2. 他用Claude Code在5分钟内完成捕食者-猎物模拟器开发,而十年前类似工作需要好几周,体验像孩子在和成年人玩"我画你猜"游戏,想象被AI完美呈现;

3. 他预计数字世界将进入高速进化阶段,巨额财富在硅基引擎驱动下被创造或摧毁,AI智能体彼此交易、AI服务网站批量生成,形成一片不可见却汹涌澎湃的Token之海。

Anthropic联创警告:2026年,AI将把世界撕成两个平行宇宙-AI Express News

九、AI大佬Karpathy焦虑了,作为程序员,从未感到如此落后

1. Andrej Karpathy坦言从未像现在这样觉得自己作为程序员如此落后,编程职业正被彻底重构,需掌握agents、提示词、MCP、工作流等新可编程抽象层;

2. 资深工程师Boris Cherny表示每周都需重新调整对模型能力的认知,应届毕业生因没有先入之见反而能更有效使用模型,上个月他完全没打开IDE全靠Opus 4.5写了约200个PR;

3. Epoch AI数据显示AI通用能力综合指标ECI在过去两年增长速度几乎是前两年的两倍,2024年4月加速增长了90%,实际指数级增长已超过原本预期。

AI大佬Karpathy焦虑了:作为程序员,我从未感到如此落后-AI Express News

【原文链接】https://mp.weixin.qq.com/s/rHmvPxmdzAFAgbkoNqYWJw

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容