共计 2938 个字符,预计需要花费 8 分钟才能阅读完成。
生成式 AI
一、Grok 4 深夜大升级:200 万上下文、五倍 GPT- 5 脑容量?
1. Grok 4 Fast 上下文窗口提升至 200 万 token,相当于 Gemini 2.5 Pro 的 2 倍、GPT- 5 的 5 倍,推理模式完成率从 77.5% 跃升至 94.1%;
2. Grok Imagine 升级后生成质量达到真假难辨程度,能精准生成西方古典文学场景,x.ai 在 OpenRouter 上 API 调用份额达 26.4%;
3. 200 万 token 上下文能力意味着可一次性处理相当于 150 万英文单词或 6000 页文本,相当于两部《战争与和平》。
https://mp.weixin.qq.com/s/PkHA-2aXsCg03xpoQOMXLA
二、GPT-5-Codex mini 紧凑版发布,性能相当速率提高 4 倍
1. OpenAI 发布 GPT-5-Codex-Mini 紧凑版,使用量是 GPT-5-Codex 的约 4 倍,ChatGPT Plus 等用户速率限制提高 50%;
2. 代码中发现 GPT-5.1 系列三个新模型痕迹,包括旗舰模型 GPT-5.1、推理模型 GPT-5.1 Reasoning 和研究级 GPT-5.1 Pro;
3. 新模型 或于 11 月 底发布,其中一个模型可能已以 Polaris Alpha 名字在 OpenRouter 等平台测试,在创意写作和基准测试中表现出色。
https://mp.weixin.qq.com/s/er3zhiYfsyGKqchQuRYl0Q
三、谷歌二代 Nano Banana 爆出!一键推演微积分终结 PS
1. 谷歌 Nano Banana 2 预览版在第三方平台 Media IO 现身,支持原生 2K 可选 4K 超分,复杂场景生成仅需 10 秒;
2. 该模型可在黑板上一键推导微积分,基于纯文本直出 Windows 桌面 +YouTube 主页等复杂 UI 界面,文字渲染和世界知识表现出色;
3. 二次元生成、人物角色、监控录像等场景表现逼真,能保持高度角色一致性,预计 11 月中下旬正式发布。
https://mp.weixin.qq.com/s/9PSAenw5ne-tk7xZZ6MrEA
四、Utopai 联手 LG、中东主权基金加码韩娱,颠覆 AI 视频格局
1. AI 原生影视工作室 Utopai Studios 与 SFR 成立资本规模达数十亿美元合资公司 Utopai East,LG 集团继承人和阿联酋主权基金推动者参与;
2. Utopai 采用 "规划与渲染解耦" 架构,自回归模型负责规划、扩散模型负责渲染,通过统一状态空间耦合,解决传统模型长程一致性崩塌问题;
3. 该架构能实现跨数十个镜头稳定保持角色身份和场景一致性,将创意迭代周期从数周缩短至几天,推动 AI 从短片生成到长片制作的工业级跨越。
https://mp.weixin.qq.com/s/ACTi_DYghRP2rFKSungTeQ
五、Google Finance 重磅升级,深度搜索打造 AI 金融分析师
1. 新版 Google Finance 整合 Gemini 多模态 AI 模型的 "深度搜索" 功能,可在几分钟内扫描数百份资料生成综合性分析报告;
2. 首次将预测市场数据(如 Kalshi 和 Polymarket)整合进主流金融工具,为投资者提供前所未有的 "市场情绪晴雨表";
3. 新设计的 "财报季体验" 界面支持实时文字转录、AI 生成新闻摘要和历史数据对比,目前已通过 google.com/finance/beta 开放体验。
https://mp.weixin.qq.com/s/0iTU5nVAqb_dRfkuQHe2Rg
前沿科技
六、Nature:AI 快速生成全新抗体设计图,可精确打击病毒要害
1. 诺贝尔奖得主大卫·贝克团队开发 AI 蛋白质结构生成模型 RFdiffusion,可根据指定病毒表位从头设计抗体结构,达到接近原子级精度;
2. 该模型已成功设计出针对流感、艰难梭菌毒素、新冠病毒和 RSV 病毒的抗体,冷冻电镜验证设计与实际结合方式几乎完全一致;
3. RFdiffusion 几小时可 "画" 出全新抗体设计图,可精确指定攻击病毒特定部位,有望改变人类应对传染病方式,团队已联合创办 Xaira Therapeutics 公司。
https://mp.weixin.qq.com/s/ynoIwDfE-gs2nMvI3i14jw
七、美国为重返月球简化登月舱,中国登月火箭即将验证飞行
1. 美国简化阿尔忒弥斯登月计划登月舱方案,取消大量机载设备改用一次性燃料箱,加油发射次数从 15-30 次削减到不足 10 次;
2. 中国航天集团宣布新一代载人运载火箭关键技术已突破即将开展演示验证飞行,为载人登月任务提供支撑;
3. 中国长征十号火箭总长 92.5 米起飞推力约 2678 吨,地月转移轨道运载能力不小于 27 吨,梦舟一号飞船将于 2026 年首飞对接空间站。
https://mp.weixin.qq.com/s/pWFjh4HfwpUtKJ0AGTArkg
报告观点
八、AI 六巨头同台!李飞飞激辩 LeCun,黄仁勋:你们都错了
1. Yann LeCun、李飞飞、黄仁勋、Geoffrey Hinton、Bill Dally 和 Yoshua Bengio 六位 AI 巨头因共获伊丽莎白女王工程奖齐聚激辩 AI 革命真实性;
2. 黄仁勋认为 AI 是 "生产力" 本身而非泡沫,需数千亿美元 AI 工厂服务数万亿美元新产业;LeCun 指出当前大语言模型范式无法通向人类级智能需根本性突破;
3. 关于 "人类级 AI" 还有多远,Geoffrey Hinton 预测 20 年内实现,李飞飞强调还有广阔空间智能等前沿领域待开拓,Bengio 警惕指数级加速不确定性。
https://mp.weixin.qq.com/s/X1pgiXbWNsrYIavrj3PFfg
九、Artificial Analysis 评测出炉:Kimi K2 thinking 位居世界第二
1. Kimi K2 Thinking 在 Artificial Analysis 智能指数中获得 67 分,领先所有开源模型,在智能体应用场景排名第二仅次于 GPT-5;
2. 该模型在 τ²-Bench Telecom 基准测试中取得 93% 成绩,创开源模型历史新高,在代码指数中超越 DeepSeek V3.2 成为新晋开源冠军;
3. 模型总参数量 1 万亿激活参数 320 亿,原生以 INT4 精度发布,但在完成评测时使用了 1.4 亿 token,约为 DeepSeek V3.2 的 2.5 倍,表现 "话痨"。
https://mp.weixin.qq.com/s/o77T30ZGaFQuKxXc7AWmxA
十、HuggingFace 200 页实战指南「手把手」教你训练大模型
1. HuggingFace 发布超 200 页技术博客,系统分享训练先进 LLM 的端到端经验,基于 384 块 H100 GPU 训练 3B 参数模型 SmolLM3 的实战过程;
2. 博客涵盖从决策到落地全流程,包括训练罗盘(Why-What-How)、消融实验设计、模型架构、数据管理、后训练和基础设施等核心内容;
3. 强调 "数据质量影响远超架构选择",训练 LLM 是 "边训练边学" 过程,预训练团队初期 2 - 3 人足矣,关键是配备足够算力并保持快速迭代。