腾讯研究院AI速递 20260122-AI Express News

生成式AI

一、R1一周年，DeepSeek新模型 Model 1在 GitHub 悄然现身

1. DeepSeek-R1发布一周年之际，其FlashMLA代码库更新中出现神秘的Model1模型，可能是即将发布的新模型代号；

2. 代码分析显示Model1采用512维标准架构，全面支持英伟达Blackwell架构，并引入Token-level Sparse MLA稀疏注意力机制；

3. 引入VVPA数值向量位置感知和Engram机制等新特性，被推测为DeepSeek-V4的内部开发代号或工程版本。

R1一周年，DeepSeek Model 1悄然现身-AI Express News

二、Liquid AI开源 LFM2.5-1.2B-Thinking，非Transformer架构

1. Liquid AI发布开源推理模型LFM2.5-1.2B-Thinking，基于液态神经网络架构，手机端仅需900MB内存即可运行；

2. 该模型在MATH-500上达到88分，参数量比Qwen3-1.7B少40%却表现更优，推理速度和内存效率均超越Transformer模型；

3. 训练采用分层强化学习策略，通过n-gram重复惩罚将死循环生成比例从15.74%降至0.36%，证明Transformer并非唯一解。

非Transformer架构的新突破，液态神经网络的推理小模型只用900M内存-AI Express News

三、工程师抢着给 AI 当牛马，还说「真香」；AI也可以prompt人类

1. Midjourney工程师展示Claude反向指挥人类工作的视频爆火，AI布置任务让人类去TestFlight发包、写文案、跑测试；

2. Claude Code具备自主执行能力，可运行Bash命令、创建文件、自动修Bug形成闭环，Cowork等工具让用户下达模糊指令后AI自主规划执行；

3. Node.js之父Ryan Dahl宣称人类编写代码的时代已结束，Linux之父也开始Vibe Coding，程序员角色正从编写代码转向审查代码。

破防了，工程师抢着给 AI 当牛马，还说「真香」-AI Express News

四、xAI工程师Sulaiman Ghori播客聊太嗨，马斯克解雇了他

1. xAI工程师在播客上透露MacroHard项目核心机密，包括内部已将AI包装成"同事"进行测试，有人去工位找同事发现是空桌；

2. xAI押注小模型路线追求极致速度，MacroHard已达人类8倍速度，并考虑租用北美约400万辆特斯拉闲置算力进行部署；

3. 该工程师还曝光xAI扁平化文化和极致执行力，Colossus 1利用"临时用地租约"122天建成，随后被马斯克解雇。

xAI工程师播客聊太嗨，马斯克解雇了他-AI Express News

五、谷歌新发现，DeepSeek比你更懂反思，智能内部社会化对话

1. 谷歌等机构研究发现DeepSeek-R1等推理模型会在内部自发形成多角色辩论机制，通过提问、质疑、冲突和和解推导答案；

2. 研究者发现模型内部存在稳定的虚拟人格分工，高神经质人格负责纠错，高开放性人格提供新视角，这种"思维社会"机制让准确率翻倍；

3. 通过干预模型内部的"觉察特征"，在倒计时数学游戏中准确率从27.1%飙升至54.8%，证明社会化对话是推理能力的动力源泉。

DeepSeek比你更懂反思！谷歌重磅发现，智能的本质竟是一场社会化对话-AI Express News

前沿科技

六、Medical SAM3：首个「纯文本提示」驱动医学全能分割模型

1. 中佛罗里达大学等机构发布Medical SAM3，无需手动画框仅凭文本指令即可在CT、MRI等10种模态实现专家级分割；

2. 采用全参数微调和分层学习率衰减策略，在33个医学数据集上将零样本场景平均准确率从11.9%提升至73.9%；

3. 在内镜息肉分割等极端案例中从0.0%跃升至87.9%，团队计划未来构建Medical SAM3 Agent实现智能体驱动的临床工作流。

告别「手动画框」！Medical SAM3：首个真正「纯文本提示」驱动的医学全能分割模型-AI Express News

报告观点

七、Anthropic CEO：AI将全面取代软件工程师，最快只需6个月！

1. Anthropic CEO在达沃斯论坛预测AI端到端接管软件工程师工作仅剩6-12个月，Anthropic内部工程师已基本不手写代码；

2. Dario Amodei预言2026-2027年将诞生"诺奖级"AI模型，未来1-5年内50%初级白领工作将消失；

3. DeepMind CEO Hassabis预测2030年前有50%概率实现AGI，双方均认为"AI建AI"闭环一旦跑通将迎来指数级加速。

码农只剩6个月？Anthropic CEO断言AI接管一切代码，爆冲诺奖级智能！-AI Express News

八、红杉xbench 最新报告：104 项日常任务，Agent 可处理 60+%

1. 红杉中国xbench团队发布AgentIF-OneDay评测，测试Agent处理真实日常任务能力，头部Agent（Manus、Genspark、ChatGPT-Agent）得分约62-65%；

2. 评测覆盖104道任务、15种以上文件格式、767个评分点，发现不同框架难以拉开差距，基础Agent能力已商品化；

3. 隐式条件推断是Agent普遍最薄弱能力，xbench正着手构建OneWeek评测集，认为优先转起数据飞轮的公司将率先实现Agent的FSD时刻。

九、OpenAI CFO与著名投资人的最新播客：聊2026年的AI趋势

1. OpenAI CFO与Khosla Ventures创始人对谈指出2026年多智能体系统将成熟，AI泡沫应以API调用量而非股价衡量；

2. OpenAI算力投资与收入强相关，三年收入从1亿增至100亿美元，目前需求受算力限制，采用AI的前沿企业生产力提升27-33%；

3. 双方预测机器人产业规模将超越汽车产业，未来十年末将出现大规模通缩经济，劳动力和专业知识边际成本趋近于零。

OpenAI CFO 与 Khosla Ventures 创始人：AI没有泡沫，收入增长和算力投资强相关，消费者普及带动企业应用-AI Express News

<原文链接：https://mp.weixin.qq.com/s/H6xnhn7FsF5DHvvDDvq9Vg

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

腾讯研究院AI速递 20260122

请登录后发表评论