腾讯研究院AI速递 20260325-AI Express News

生成式AI

一、Claude发布计算机使用功能Computer Use预览版本

1. Anthropic为Claude推出Computer Use功能，可在Cowork和Code中自动操控电脑执行任务，目前仅限Pro和Max用户的macOS系统；

2. 结合Dispatch功能，用户可通过手机远程指挥Claude在电脑上干活，实现人不在电脑前AI替你操作的工作模式；

3. 相比OpenClaw需自行部署且有安全风险，Anthropic方案开箱即用并内置安全护栏，Computer Use但仍为早期预览版，执行速度远慢于人类。

https://mp.weixin.qq.com/s/5mfba3Jdhzlaa7ABZrDLxQ

二、OpenClaw 12小时紧急更新，修复因暴力拆除的组件

1. OpenClaw发布3.23版本距上版仅12小时，首要修复因暴力拆除旧API导致的UI崩溃和微信等IM插件罢工问题；

2. DeepSeek插件架构升级可直接通过API Key调用，Qwen支持按量付费中国区和全球Key均可接入；

3. 安全方面引入SHA-256哈希校验拦截恶意脚本注入，修复macOS连接Chrome弹窗问题并优化Claude 3.7思维链兼容性。

https://mp.weixin.qq.com/s/DMkQ2cuNgI60azO0kfhjYw

三、Luma AI发布Uni-1图像模型，打破谷歌OpenAI垄断

1. Uni-1采用单解码器自回归Transformer架构首次统一图像理解与生成，在RISEBench推理基准整体得分超越Nano Banana 2和GPT Image 1.5；

2. 2K分辨率生成价格0.09美元/张，比谷歌低11%-33%，对大规模生成场景可节省数百万级开支；

3. 配套Luma Agents平台已与阳狮集团及阿迪达斯等合作，将耗时1年花费1500万美元的广告项目压缩至40小时不到2万美元。

https://mp.weixin.qq.com/s/HNTdQRGLnU0KBNcwcqcr7Q

四、美团龙猫开源LongCat-Flash-Prover，定理证明SOTA

1. 将形式化推理拆解为自动形式化、草稿生成和证明生成三大原子能力，MiniF2F-Test上仅72次推理预算即达97.1%通过率；

2. 超难竞赛级任务同样领先，MathOlympiad-Bench达46.7%、PutnamBench达41.5%，均超越现有开源模型；

3. 训练中发现AI会修改题目、插入终止符或捏造公理来作弊，团队开发Lean4语法分析器排查约9种作弊手段。

https://mp.weixin.qq.com/s/6Vu-u2VzZKq0tVhJvBs0Og

五、世界模型做减法：LeCun团队和清华团队给出两种思路

1. LeCun团队LeWorldModel首次实现像素端到端稳定训练JEPA模型，仅1500万参数单张GPU数小时训练，规划速度最高提升约48倍；

2. 清华团队Fast-WAM证明训练中保留视频建模但测试时跳过未来预测性能不降，推理延迟仅190毫秒比传统方案提速超4倍；

3. 两项工作分别从"更简洁地学习世界"与"是否需要推理中想象未来"两个维度修正主流思路，谢赛宁建议结合阅读。

https://mp.weixin.qq.com/s/VycD8SODNAnHiLIg4DlZvw

前沿科技

六、哈佛教授用Claude 4.5写论文，两周完成博士一年工作

1. 哈佛量子场论教授让Claude 4.5当研究生，两周产出一篇QCD高难度论文，生成110版草稿消耗3600万Token；

2. 实验中Claude存在"讨好型人格"，会悄悄改参数让图表对齐理论、编造术语掩盖错误，须反复逐行拷问才纠正；

3. 教授总结AI擅长迭代和代码生成，但在保持非标准约定和诚实验证方面很差，建议多模型交叉验证和强制诚实配置。

https://mp.weixin.qq.com/s/tHzCQPaPg_e7a9sbghNXnQ

报告观点

七、木头姐：Robotaxi五年主导特斯拉，Optimus 2028年可期

1. ARK预计Robotaxi五年内主导特斯拉估值，每辆车每年带来数千至上万美元现金流，将公司转为类软件利润率；

2. Optimus预计2028年底单项任务达人类水平，人形机器人TAM约26.5万亿美元将在Robotaxi之后接力增长；

3. Anthropic年化收入两个多月从90亿增至190亿美元，微软被迫white labeling Claude Coworker追赶，生产力业务面临被超越风险。

https://mp.weixin.qq.com/s/r24W-UyvwlLuufQaE8FRNA

八、陶哲轩最新访谈提人机关系：广度归于AI，深度留给人类

1. AI已将创意生成成本压至近零，但瓶颈转移至验证和评估环节，海量AI论文涌入期刊人类审稿人已应接不暇；

2. AI辅助解决约50个埃尔德什问题后出现停滞，系统性研究显示成功率仅1%-2%，外界看到的惊艳成果存在选择性偏差；

3. AI擅长广度人类擅长深度，应让AI先绘制地图做出容易观察再由人类攻克难点；核心数学工作仍用纸和笔。

https://mp.weixin.qq.com/s/cxTXHXm0Q2d48fDeT7lZyg

九、黄仁勋回应一切：中国工程师天生热爱开源，AGI已到来

1. 阐述四层扩展定律框架，反驳"数据耗尽"论称合成数据将持续增长，测试时推理计算消耗远超市场预期；

2. 中国工程师优先级为家人朋友公司，同学即终身兄弟因此天然倾向开源；激烈省际竞争进一步放大创新节奏；

3. 认为"能创立十亿美元公司"的AGI门槛已达到，编程将从3000万人扩展到10亿人，希望在工作中倒下。

https://mp.weixin.qq.com/s/-GZp1EM-D_TIm9ofK0sE8g

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送

<原文链接：https://mp.weixin.qq.com/s/Hyb046UaPNLQ_gDTVw90jg

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

腾讯研究院AI速递 20260325

请登录后发表评论