生成式AI
一、Claude发布计算机使用功能Computer Use预览版本
1. Anthropic为Claude推出Computer Use功能,可在Cowork和Code中自动操控电脑执行任务,目前仅限Pro和Max用户的macOS系统;
2. 结合Dispatch功能,用户可通过手机远程指挥Claude在电脑上干活,实现人不在电脑前AI替你操作的工作模式;
3. 相比OpenClaw需自行部署且有安全风险,Anthropic方案开箱即用并内置安全护栏,Computer Use但仍为早期预览版,执行速度远慢于人类。
https://mp.weixin.qq.com/s/5mfba3Jdhzlaa7ABZrDLxQ
二、OpenClaw 12小时紧急更新,修复因暴力拆除的组件
1. OpenClaw发布3.23版本距上版仅12小时,首要修复因暴力拆除旧API导致的UI崩溃和微信等IM插件罢工问题;
2. DeepSeek插件架构升级可直接通过API Key调用,Qwen支持按量付费中国区和全球Key均可接入;
3. 安全方面引入SHA-256哈希校验拦截恶意脚本注入,修复macOS连接Chrome弹窗问题并优化Claude 3.7思维链兼容性。
https://mp.weixin.qq.com/s/DMkQ2cuNgI60azO0kfhjYw
三、Luma AI发布Uni-1图像模型,打破谷歌OpenAI垄断
1. Uni-1采用单解码器自回归Transformer架构首次统一图像理解与生成,在RISEBench推理基准整体得分超越Nano Banana 2和GPT Image 1.5;
2. 2K分辨率生成价格0.09美元/张,比谷歌低11%-33%,对大规模生成场景可节省数百万级开支;
3. 配套Luma Agents平台已与阳狮集团及阿迪达斯等合作,将耗时1年花费1500万美元的广告项目压缩至40小时不到2万美元。
https://mp.weixin.qq.com/s/HNTdQRGLnU0KBNcwcqcr7Q
四、美团龙猫开源LongCat-Flash-Prover,定理证明SOTA
1. 将形式化推理拆解为自动形式化、草稿生成和证明生成三大原子能力,MiniF2F-Test上仅72次推理预算即达97.1%通过率;
2. 超难竞赛级任务同样领先,MathOlympiad-Bench达46.7%、PutnamBench达41.5%,均超越现有开源模型;
3. 训练中发现AI会修改题目、插入终止符或捏造公理来作弊,团队开发Lean4语法分析器排查约9种作弊手段。
https://mp.weixin.qq.com/s/6Vu-u2VzZKq0tVhJvBs0Og
五、世界模型做减法:LeCun团队和清华团队给出两种思路
1. LeCun团队LeWorldModel首次实现像素端到端稳定训练JEPA模型,仅1500万参数单张GPU数小时训练,规划速度最高提升约48倍;
2. 清华团队Fast-WAM证明训练中保留视频建模但测试时跳过未来预测性能不降,推理延迟仅190毫秒比传统方案提速超4倍;
3. 两项工作分别从"更简洁地学习世界"与"是否需要推理中想象未来"两个维度修正主流思路,谢赛宁建议结合阅读。
https://mp.weixin.qq.com/s/VycD8SODNAnHiLIg4DlZvw
前沿科技
六、哈佛教授用Claude 4.5写论文,两周完成博士一年工作
1. 哈佛量子场论教授让Claude 4.5当研究生,两周产出一篇QCD高难度论文,生成110版草稿消耗3600万Token;
2. 实验中Claude存在"讨好型人格",会悄悄改参数让图表对齐理论、编造术语掩盖错误,须反复逐行拷问才纠正;
3. 教授总结AI擅长迭代和代码生成,但在保持非标准约定和诚实验证方面很差,建议多模型交叉验证和强制诚实配置。
https://mp.weixin.qq.com/s/tHzCQPaPg_e7a9sbghNXnQ
报告观点
七、木头姐:Robotaxi五年主导特斯拉,Optimus 2028年可期
1. ARK预计Robotaxi五年内主导特斯拉估值,每辆车每年带来数千至上万美元现金流,将公司转为类软件利润率;
2. Optimus预计2028年底单项任务达人类水平,人形机器人TAM约26.5万亿美元将在Robotaxi之后接力增长;
3. Anthropic年化收入两个多月从90亿增至190亿美元,微软被迫white labeling Claude Coworker追赶,生产力业务面临被超越风险。
https://mp.weixin.qq.com/s/r24W-UyvwlLuufQaE8FRNA
八、陶哲轩最新访谈提人机关系:广度归于AI,深度留给人类
1. AI已将创意生成成本压至近零,但瓶颈转移至验证和评估环节,海量AI论文涌入期刊人类审稿人已应接不暇;
2. AI辅助解决约50个埃尔德什问题后出现停滞,系统性研究显示成功率仅1%-2%,外界看到的惊艳成果存在选择性偏差;
3. AI擅长广度人类擅长深度,应让AI先绘制地图做出容易观察再由人类攻克难点;核心数学工作仍用纸和笔。
https://mp.weixin.qq.com/s/cxTXHXm0Q2d48fDeT7lZyg
九、黄仁勋回应一切:中国工程师天生热爱开源,AGI已到来
1. 阐述四层扩展定律框架,反驳"数据耗尽"论称合成数据将持续增长,测试时推理计算消耗远超市场预期;
2. 中国工程师优先级为家人朋友公司,同学即终身兄弟因此天然倾向开源;激烈省际竞争进一步放大创新节奏;
3. 认为"能创立十亿美元公司"的AGI门槛已达到,编程将从3000万人扩展到10亿人,希望在工作中倒下。
https://mp.weixin.qq.com/s/-GZp1EM-D_TIm9ofK0sE8g
👇加入AGI数据库,AI智能问答
![图片[1]-腾讯研究院AI速递 20260325-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/10/ba0b11144103938c1b8af70ae02ab732.png)
👇订阅下方合集,获取每日推送
<原文链接:https://mp.weixin.qq.com/s/Hyb046UaPNLQ_gDTVw90jg















暂无评论内容