腾讯研究院AI速递 20260122

生成式AI

一、R1一周年,DeepSeek新模型 Model 1在 GitHub 悄然现身

1. DeepSeek-R1发布一周年之际,其FlashMLA代码库更新中出现神秘的Model1模型,可能是即将发布的新模型代号;

2. 代码分析显示Model1采用512维标准架构,全面支持英伟达Blackwell架构,并引入Token-level Sparse MLA稀疏注意力机制;

3. 引入VVPA数值向量位置感知和Engram机制等新特性,被推测为DeepSeek-V4的内部开发代号工程版本

R1一周年,DeepSeek Model 1悄然现身-AI Express News

二、Liquid AI开源 LFM2.5-1.2B-Thinking,非Transformer架构

1. Liquid AI发布开源推理模型LFM2.5-1.2B-Thinking,基于液态神经网络架构,手机端仅需900MB内存即可运行;

2. 该模型在MATH-500上达到88分,参数量比Qwen3-1.7B少40%却表现更优,推理速度和内存效率均超越Transformer模型;

3. 训练采用分层强化学习策略,通过n-gram重复惩罚将死循环生成比例从15.74%降至0.36%,证明Transformer并非唯一解。

非Transformer架构的新突破,液态神经网络的推理小模型只用900M内存-AI Express News

三、工程师抢着给 AI 当牛马,还说「真香」;AI也可以prompt人类

1. Midjourney工程师展示Claude反向指挥人类工作的视频爆火,AI布置任务让人类去TestFlight发包、写文案、跑测试;

2. Claude Code具备自主执行能力,可运行Bash命令、创建文件、自动修Bug形成闭环,Cowork等工具让用户下达模糊指令后AI自主规划执行;

3. Node.js之父Ryan Dahl宣称人类编写代码的时代已结束,Linux之父也开始Vibe Coding,程序员角色正从编写代码转向审查代码。

破防了,工程师抢着给 AI 当牛马,还说「真香」-AI Express News

四、xAI工程师Sulaiman Ghori播客聊太嗨,马斯克解雇了他

1. xAI工程师在播客上透露MacroHard项目核心机密,包括内部已将AI包装成"同事"进行测试,有人去工位找同事发现是空桌;

2. xAI押注小模型路线追求极致速度,MacroHard已达人类8倍速度,并考虑租用北美约400万辆特斯拉闲置算力进行部署;

3. 该工程师还曝光xAI扁平化文化和极致执行力,Colossus 1利用"临时用地租约"122天建成,随后被马斯克解雇。

xAI工程师播客聊太嗨,马斯克解雇了他-AI Express News

五、谷歌新发现,DeepSeek比你更懂反思,智能内部社会化对话

1. 谷歌等机构研究发现DeepSeek-R1等推理模型会在内部自发形成多角色辩论机制,通过提问、质疑、冲突和和解推导答案;

2. 研究者发现模型内部存在稳定的虚拟人格分工,高神经质人格负责纠错,高开放性人格提供新视角,这种"思维社会"机制让准确率翻倍;

3. 通过干预模型内部的"觉察特征",在倒计时数学游戏中准确率从27.1%飙升至54.8%,证明社会化对话是推理能力的动力源泉。

DeepSeek比你更懂反思!谷歌重磅发现,智能的本质竟是一场社会化对话-AI Express News

前沿科技

六、Medical SAM3:首个「纯文本提示」驱动医学全能分割模型

1. 中佛罗里达大学等机构发布Medical SAM3,无需手动画框仅凭文本指令即可在CT、MRI等10种模态实现专家级分割;

2. 采用全参数微调和分层学习率衰减策略,在33个医学数据集上将零样本场景平均准确率从11.9%提升至73.9%;

3. 在内镜息肉分割等极端案例中从0.0%跃升至87.9%,团队计划未来构建Medical SAM3 Agent实现智能体驱动的临床工作流。

告别「手动画框」!Medical SAM3:首个真正「纯文本提示」驱动的医学全能分割模型-AI Express News

报告观点

七、Anthropic CEO:AI将全面取代软件工程师,最快只需6个月!

1. Anthropic CEO在达沃斯论坛预测AI端到端接管软件工程师工作仅剩6-12个月,Anthropic内部工程师已基本不手写代码;

2. Dario Amodei预言2026-2027年将诞生"诺奖级"AI模型,未来1-5年内50%初级白领工作将消失;

3. DeepMind CEO Hassabis预测2030年前有50%概率实现AGI,双方均认为"AI建AI"闭环一旦跑通将迎来指数级加速。

码农只剩6个月?Anthropic CEO断言AI接管一切代码,爆冲诺奖级智能!-AI Express News

八、红杉xbench 最新报告:104 项日常任务,Agent 可处理 60+%

1. 红杉中国xbench团队发布AgentIF-OneDay评测,测试Agent处理真实日常任务能力,头部Agent(Manus、Genspark、ChatGPT-Agent)得分约62-65%;

2. 评测覆盖104道任务、15种以上文件格式、767个评分点,发现不同框架难以拉开差距,基础Agent能力已商品化;

3. 隐式条件推断是Agent普遍最薄弱能力,xbench正着手构建OneWeek评测集,认为优先转起数据飞轮的公司将率先实现Agent的FSD时刻。

红杉xbench 最新报告:104 项日常任务,Agent 可处理 60+%-AI Express News

九、OpenAI CFO与著名投资人的最新播客:聊2026年的AI趋势

1. OpenAI CFO与Khosla Ventures创始人对谈指出2026年多智能体系统将成熟,AI泡沫应以API调用量而非股价衡量;

2. OpenAI算力投资与收入强相关,三年收入从1亿增至100亿美元,目前需求受算力限制,采用AI的前沿企业生产力提升27-33%;

3. 双方预测机器人产业规模将超越汽车产业,未来十年末将出现大规模通缩经济,劳动力和专业知识边际成本趋近于零。

OpenAI CFO 与 Khosla Ventures 创始人:AI没有泡沫,收入增长和算力投资强相关,消费者普及带动企业应用-AI Express News

<原文链接:https://mp.weixin.qq.com/s/H6xnhn7FsF5DHvvDDvq9Vg

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容