AI 快递 2025/11/25

41次阅读
没有评论

共计 2563 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、谷歌发布《Attention Is All You Need》V2 版「嵌套学习」

1. 谷歌发布嵌套学习(Nested Learning)新机器学习范式,将模型视为一组嵌套的优化问题,每个子问题拥有独立工作流程,可减轻甚至避免 "灾难性遗忘";

2. 该方法通过关联记忆、更新频率分层和优化器即记忆模块三大创新,实现 “早期层高频刷,后期层低频整合” 训练 框架;

3. 基于此推出的 HOPE 模型在语言建模困惑度和常识推理准确率上均表现最优,在长上下文大海捞针任务中展现出卓越的内存管理能力。

https://mp.weixin.qq.com/s/RpbcYiA3WlWe9pUYsILO7Q

二、奥特曼承认谷歌威胁,或即将推出新模型「Shallotpeat」

1. The Information 曝光 OpenAI 内部备忘录显示,奥特曼上月向员工承认谷歌最近在 AI 方面的进展可能给公司带来暂时的经济阻力;

2. OpenAI 研究员 已知晓谷歌开发了超越 OpenAI 的 Gemini 3 模型,奥特曼间接承认开始落后谷歌,预计外界会有一阵子气氛很糟;

3. OpenAI 将在未来几个月推出代号 "Shallotpeat" 的新模型,专门修复其在预训练过程中遇到的错误,以追赶谷歌在预训练方面的突破。

https://mp.weixin.qq.com/s/oVhKXJ1yplyw4p1_aI-QHw

三、Lovart 设计师 Agent,已经正式接入 Nano Banana Pro

1. 设计 Agent Lovart 正式接入 Nano Banana Pro,支持一次性处理 14 张图片元素,可生成专业级设计成品和视频;

2. Lovart 独家推出 Touch Edit 功能,通过简单点击动作即可精准修改细节,无需复杂 Prompt 描述,还支持 "编辑元素" 功能将图片分层可编辑;

3. 11 月 30 日前订阅 Basic 及以上用户可获得会员期间连续 365 天 Nano Banana Pro 无限量 0 积分使用体验。

https://mp.weixin.qq.com/s/UuwG4A5vp1f2lcV3DTaCPQ

四、MCP 社区正式提出了 MCP Apps 提案,告别纯文本交互

1. MCP 社区由 OpenAI 和 Anthropic 核心维护者联手推出 MCP Apps 提案(SEP-1865),规范对交互式用户界面的支持;

2. 该提案引入拼接轨迹图、状态转移场和预先声明的资源等技术,使 MCP 服务器能直接向主机提供可视化操作界面;

3. MCP Apps 基于 MCP-UI 和 OpenAI Apps SDK,已被 Postman、Shopify、Hugging Face 等公司采用,极有可能成为未来行业通用范式。

https://mp.weixin.qq.com/s/X3ljj6gRZOXM_xWmqAu2ig

五、一人干翻一个剧组!北大哲学博士造出 AI 神器 Elser.AI

1. 北大哲学博士刘耕创办 Elser.AI,一款 AI 短剧生成 Agent,在完全没有宣传情况下积累了 20 万全球活跃用户;

2. Elser.AI 支持从剧本到分镜到成片的全流程创作,用户可控制角色形象、构图景深、运镜动作等所有细节,实现 "创作平权";

3. 海外版将于 12 月 1 日上线,全线接入 Nano Banana Pro,所有在 Waitlist 登记的用户都将收到首波邀请。

https://mp.weixin.qq.com/s/1w9zEOEXIZmnYEhBXhmuGA

六、陶哲轩亲测:Gemini 十分钟搞定了困扰学界多年的难题

1. 陶哲轩使用 Gemini Deep Think 十分钟完成了 Erdős #367 号问题的证明补全,该问题涉及连续整数结构的乘法数论;

2. 随后 Boris Alexeev 使用 Harmonic 的 Aristotle 工具用 2 - 3 小时完成了该证明的 Lean 形式化,至此该问题在 AI 与人类协同下得以解决;

3. 近期 Erdős 问题网站上陆续有 6 个困扰数学界多年的难题通过 AI 辅助方法得以解决,许多研究者正系统性使用 AI 工具进行文献查询。

https://mp.weixin.qq.com/s/GPT0rUUCta1DsHJVqpakKQ

前沿科技

七、Android 的 Quick Share 快速分享将兼容苹果的 AirDrop

1. Google 宣布 Pixel 10 系列正式支持原生 AirDrop 能力,可直接向 iPhone 隔空投送照片及文件,反之亦然;

2. 该功能实现 要感谢欧盟《数字市场法》,要求苹果在 iOS 26 支持 Wi-Fi Aware 标准,Google 借此实现了 AirDrop 兼容;

3. 使用需满足 Android 设备为 Pixel 10 系列、iPhone/iPad 升级至 iOS 26 且 AirDrop 开启 "所有人",Google 承诺将扩展至更多 Android 设备。

https://mp.weixin.qq.com/s/ckxYZ-DeaqfRVErQNXTKhQ

八、1 米 3 宇树 G1 完美上篮!港科大解锁篮球机器人 Demo

1. 香港科技大学团队实现全球首个能在真实场景中完成篮球动作的机器人 demo,使用宇树 G1 完成三步上篮等技能;

2. 该成果基于 SkillMimic-V2 技术,通过拼接轨迹图、状态转移场和自适应轨迹采样等创新,在低质量数据条件下训练出鲁棒的复杂交互策略;

3. 从 2023 年 PhysHOI 在仿真环境小试牛刀,到这次在真实环境中打球,得益于机器人本体发展,技术落地速度显著加快。

https://mp.weixin.qq.com/s/QGAGiq6OHHLC_KvEHq4sHQ

报告观点

九、DeepMind 掌门人谈 Gemini 3:谷歌 AI 反击战、泡沫论

1. DeepMind CEO Demis Hassabis 表示谷歌 AI 叙事正从 "奋力追赶" 转变为 "处于领先地位",Gemini 3 在 "人类终极考试" 得分从 21.6% 飙升至 37.5%;

2. 他预测通往 AGI 还需 5 -10 年及一两个重大突破(如世界模型、物理智能),目前扩展定律仍有效但存在边际效用递减;

3. 关于 AI 泡沫他认为是过于二元化的问题,种子轮投资可能存在泡沫,但在应用层和前沿科技领域(如药物发现、机器人)蕴含巨大真实价值。

https://mp.weixin.qq.com/s/hpTH1fYprwrer7ecqXn4Hw

正文完
 0
评论(没有评论)