生成式AI
一、谷歌发布《Attention Is All You Need》V2版「嵌套学习」
1. 谷歌发布嵌套学习(Nested Learning)新机器学习范式,将模型视为一组嵌套的优化问题,每个子问题拥有独立工作流程,可减轻甚至避免"灾难性遗忘";
2. 该方法通过关联记忆、更新频率分层和优化器即记忆模块三大创新,实现“早期层高频刷,后期层低频整合”的新训练框架;
3. 基于此推出的HOPE模型在语言建模困惑度和常识推理准确率上均表现最优,在长上下文大海捞针任务中展现出卓越的内存管理能力。
https://mp.weixin.qq.com/s/RpbcYiA3WlWe9pUYsILO7Q
二、奥特曼承认谷歌威胁,或即将推出新模型「Shallotpeat」
1. The Information曝光OpenAI内部备忘录显示,奥特曼上月向员工承认谷歌最近在AI方面的进展可能给公司带来暂时的经济阻力;
2. OpenAI研究员早已知晓谷歌开发了超越OpenAI的Gemini 3模型,奥特曼间接承认开始落后谷歌,预计外界会有一阵子气氛很糟;
3. OpenAI或将在未来几个月推出代号"Shallotpeat"的新模型,专门修复其在预训练过程中遇到的错误,以追赶谷歌在预训练方面的突破。
https://mp.weixin.qq.com/s/oVhKXJ1yplyw4p1_aI-QHw
三、Lovart设计师Agent,已经正式接入Nano Banana Pro
1. 设计Agent Lovart正式接入Nano Banana Pro,支持一次性处理14张图片元素,可生成专业级设计成品和视频;
2. Lovart独家推出Touch Edit功能,通过简单点击动作即可精准修改细节,无需复杂Prompt描述,还支持"编辑元素"功能将图片分层可编辑;
3. 11月30日前订阅Basic及以上用户可获得会员期间连续365天Nano Banana Pro无限量0积分使用体验。
https://mp.weixin.qq.com/s/UuwG4A5vp1f2lcV3DTaCPQ
四、MCP 社区正式提出了 MCP Apps 提案,告别纯文本交互
1. MCP社区由OpenAI和Anthropic核心维护者联手推出MCP Apps提案(SEP-1865),规范对交互式用户界面的支持;
2. 该提案引入拼接轨迹图、状态转移场和预先声明的资源等技术,使MCP服务器能直接向主机提供可视化操作界面;
3. MCP Apps基于MCP-UI和OpenAI Apps SDK,已被Postman、Shopify、Hugging Face等公司采用,极有可能成为未来行业通用范式。
https://mp.weixin.qq.com/s/X3ljj6gRZOXM_xWmqAu2ig
五、一人干翻一个剧组!北大哲学博士造出AI神器Elser.AI
1. 北大哲学博士刘耕创办Elser.AI,一款AI短剧生成Agent,在完全没有宣传情况下积累了20万全球活跃用户;
2. Elser.AI支持从剧本到分镜到成片的全流程创作,用户可控制角色形象、构图景深、运镜动作等所有细节,实现"创作平权";
3. 海外版将于12月1日上线,全线接入Nano Banana Pro,所有在Waitlist登记的用户都将收到首波邀请。
https://mp.weixin.qq.com/s/1w9zEOEXIZmnYEhBXhmuGA
六、陶哲轩亲测:Gemini十分钟搞定了困扰学界多年的难题
1. 陶哲轩使用Gemini Deep Think十分钟完成了Erdős #367号问题的证明补全,该问题涉及连续整数结构的乘法数论;
2. 随后Boris Alexeev使用Harmonic的Aristotle工具用2-3小时完成了该证明的Lean形式化,至此该问题在AI与人类协同下得以解决;
3. 近期Erdős问题网站上陆续有6个困扰数学界多年的难题通过AI辅助方法得以解决,许多研究者正系统性使用AI工具进行文献查询。
https://mp.weixin.qq.com/s/GPT0rUUCta1DsHJVqpakKQ
前沿科技
七、Android的Quick Share快速分享将兼容苹果的AirDrop
1. Google宣布Pixel 10系列正式支持原生AirDrop能力,可直接向iPhone隔空投送照片及文件,反之亦然;
2. 该功能实现或要感谢欧盟《数字市场法》,要求苹果在iOS 26支持Wi-Fi Aware标准,Google借此实现了AirDrop兼容;
3. 使用需满足Android设备为Pixel 10系列、iPhone/iPad升级至iOS 26且AirDrop开启"所有人",Google承诺将扩展至更多Android设备。
https://mp.weixin.qq.com/s/ckxYZ-DeaqfRVErQNXTKhQ
八、1米3宇树G1完美上篮!港科大解锁篮球机器人Demo
1. 香港科技大学团队实现全球首个能在真实场景中完成篮球动作的机器人demo,使用宇树G1完成三步上篮等技能;
2. 该成果基于SkillMimic-V2技术,通过拼接轨迹图、状态转移场和自适应轨迹采样等创新,在低质量数据条件下训练出鲁棒的复杂交互策略;
3. 从2023年PhysHOI在仿真环境小试牛刀,到这次在真实环境中打球,得益于机器人本体发展,技术落地速度显著加快。
https://mp.weixin.qq.com/s/QGAGiq6OHHLC_KvEHq4sHQ
报告观点
九、DeepMind掌门人谈Gemini 3:谷歌 AI 反击战、泡沫论
1. DeepMind CEO Demis Hassabis表示谷歌AI叙事正从"奋力追赶"转变为"处于领先地位",Gemini 3在"人类终极考试"得分从21.6%飙升至37.5%;
2. 他预测通往AGI还需5-10年及一两个重大突破(如世界模型、物理智能),目前扩展定律仍有效但存在边际效用递减;
3. 关于AI泡沫他认为是过于二元化的问题,种子轮投资可能存在泡沫,但在应用层和前沿科技领域(如药物发现、机器人)蕴含巨大真实价值。












暂无评论内容