生成式AI
一、摩尔线程技术路线图全面公开,一连亮出「10张王牌」
1. 摩尔线程发布新一代全功能GPU架构"花港",算力密度提升50%,能效提升10倍,支持FP4到FP64全精度计算,可支撑十万卡以上智算集群;
2. 即将发布"华山"AI训推一体芯片和"庐山"高性能图形渲染GPU,夸娥万卡智算集群算力达10EFLOPS,S5000单卡推理刷新国产GPU性能纪录;
3. 发布搭载"长江"SoC芯片的AI算力本MTT AIBOOK,提供50TOPS异构AI算力,可本地运行最高30B端侧大模型,今日起在京东预售。
https://mp.weixin.qq.com/s/ALEmvhklJVsjERus-OFq2Q
二、OpenAI代码模型GPT-5.2-Codex上线,为软工而生
1. OpenAI发布GPT-5.2-Codex,或是迄今最先进的智能体编码模型,在SWE-Bench Pro和Terminal-Bench 2.0基准测试中取得SOTA性能;
2. 相比GPT-5.2提升了指令遵循能力、长上下文理解和网络安全能力,在Windows环境下性能更优,词元效率在中高推理水平下显著提升;
3. 已面向付费ChatGPT用户在所有Codex平台开放,计划未来几周向API用户开放,并为防御性网络安全专业人士提供更宽松访问权限。
https://mp.weixin.qq.com/s/dkOTZYIj5bmIdVQYfgvEeQ
三、谷歌两门Gemma「小钢炮」开源!2.7亿参数赢SOTA
1. 谷歌开源T5Gemma 2和FunctionGemma两款Gemma 3家族小模型,T5Gemma 2是首个多模态长上下文编码器-解码器模型,提供270M-270M、1B-1B和4B-4B三种规模;
2. FunctionGemma专为函数调用优化,仅2.7亿参数可在手机、浏览器等设备运行,支持精准输出结构化数据调用外部API,适合端侧AI Agent应用;
3. T5Gemma 2回归经典Encoder-Decoder架构,在多模态性能、代码推理和长上下文能力上超越同规模Gemma 3,FunctionGemma通过量化可降至135MB运行。
https://mp.weixin.qq.com/s/X4QsqVj4mApILEVI1GMyYA
四、英伟达开源基础模型 NitroGen,能打遍几乎所有游戏
1. 英伟达开源NitroGen基础模型,训练目标是玩1000款以上游戏,直接以游戏视频帧作为输入输出真实手柄操作信号,支持后训练快速适配新游戏;
2. 模型基于GR00T N1.5架构,采用5亿参数,通过从4万小时公开游戏视频中自动提取动作标签训练,覆盖RPG、平台跳跃、竞速等多种类型;
3. 在未微调情况下可完成非平凡任务,相比从零训练的模型任务成功率最高提升52%,已开源数据集、评测套件和模型权重。
https://mp.weixin.qq.com/s/J0OgAnGDM1VAsDfYNnzXnA
五、OpenAI正式宣布Codex工具全面支持Agent Skills
1. OpenAI正式宣布Codex全面支持Agent Skills,接入Anthropic主导的全行业标准规范,Skills包含markdown指令和可选脚本资源;
2. 支持显式调用(通过/skills命令或$选择)和隐式调用(根据任务自动匹配描述),Skills存储位置按优先级从当前工作目录到用户个人目录;
3. 提供内置$skill-creator和$skill-installer工具,可自动生成技能框架或从GitHub等第三方仓库安装技能,OpenAI已发布官方应用Skill库。
https://mp.weixin.qq.com/s/1infIM7-Fc0qzI8pw5J6Kw
六、Luma AI 发布 Ray3 Modify,真人先行、AI跟随制作方式
1. Luma AI发布Ray3 Modify功能,主打"真人先行、AI跟随"的视频制作方式,演员表演、摄影机运动成为AI处理基础输入,AI围绕真人表演延展世界;
2. 支持关键帧控制(起始帧与结束帧)、角色参考能力和表演完整保留,可在不重拍情况下将同一段表演放进不同场景用于不同版本内容制作;
3. 已集成进Dream Machine平台,明确面向影视制作、广告创意和后期流程,让创作者既不用放弃控制权也不用反复重拍。
https://mp.weixin.qq.com/s/Btun70Wn0U7wG7HDH7y_6w
前沿科技
七、马斯克转发! 宇树炸场王力宏演唱会,大秀空翻热舞
1. 12月18日王力宏成都演唱会上,六台宇树G1人形机器人随《火力全开》登台表演,完成高难度"韦伯斯特"空翻动作,视频在外网获4000万网友围观;
2. G1机器人零售价9.9万元起,身高132厘米体重35公斤,小跑速度超2m/s,拥有23至43个关节,最大关节扭矩120N·m,续航约2小时;
3. 马斯克转发视频并评论"Impressive",人形机器人租赁市场2024年全球收入规模112.2亿元,预计2031年达171.2亿元,年复合增长率6.1%。
https://mp.weixin.qq.com/s/qosdBLCJLyqM7lboOoSNIw
报告观点
八、METR最新:Claude Opus 4.5已可持续编码5小时不崩
1. METR报告称Claude Opus 4.5的50%任务完成时间跨度约4小时49分钟,是迄今公布的最长时间跨度,超越GPT-5.1-Codex-Max的2小时53分钟;
2. AI编码智能体任务时长呈指数级增长且加速提升,2019-2024年每7个月翻倍,2024-2025年每4个月翻倍,预计2026年4月AI能完成完整工作日任务;
3. 业界认为长期记忆是通往AGI的最后难题,当前模型依赖检索工具和上下文压缩,缺乏真正的自我学习和持久记忆能力。
https://mp.weixin.qq.com/s/PxTn1uTOFrKGUfh9a2dwOA
九、Karpathy 2025 年度总结刷屏:AI 的这 6 个转折最关键
1. Karpathy年度总结提出2025年六大转折:RLVR让AI像做奥数题一样思考、幽灵vs动物揭示AI的"参差不齐智能"、Cursor成为应用层"包工头";
2. 以及,Claude Code作为"赛博幽灵"住在本地电脑里、Vibe Coding让编程门槛消失代码变得廉价一次性、Nano Banana预示基于大模型的GUI时代到来;
3. 他强调LLM是新操作系统,同时比预期聪明得多也笨得多,即使以目前能力行业还没挖掘出其潜力的10%,但前方仍有大量艰苦工作要做。
https://mp.weixin.qq.com/s/aFh_ubwiepwbPpPSaA_d7Q
十、谷歌AI逆袭背后的头号功臣究竟是谁?以及其传奇故事
1. 谷歌AI产品负责人Josh Woodward通过Nano Banana功能让Gemini应用月活从3月3.5亿飙升至10月6.5亿,一度超越ChatGPT登顶App Store榜首;
2. 他42岁来自奥克拉荷马州,2009年通过实习进入谷歌,曾参与Chromebook开发、创立NBU计划、主导Google Pay拓展,2025年4月接任Gemini应用负责人;
3. 他推动NotebookLM项目打破谷歌惯例使用Discord社区、设立"Block"工单机制排除体制障碍、发起"Papercuts"计划修复细节问题,强调AI创新与社会责任并重。












暂无评论内容