共计 2802 个字符,预计需要花费 8 分钟才能阅读完成。
生成式 AI
一、特斯拉「世界模拟器」首曝,1 天蒸馏人类 500 年驾驶经验
1. 特斯拉正式公开神经网络「世界模拟器」,可直接模拟合成自动驾驶孪生世界,一个神经网络每天狂吞 500 年人类驾驶经验并在虚拟世界中自我进化;
2. 该模拟器采用端到端神经网络架构,能生成 8 个摄像头、24 帧 / 秒的连续画面,一次直出长达 6 分钟逼真驾驶体验,同款 AI 大脑可供擎天柱机器人共用;
3. 特斯拉通过「端到端」技术路线,实现从原始像素输入直接输出方向盘角度和油门 / 刹车力度,消除模块间信息损失,能学习人类价值观处理复杂路况决策。
https://mp.weixin.qq.com/s/vJqksNRnMnl2STjJCnacLA
二、美团 LongCat-Video 视频模型发布,开启世界模型的探索
1. 美团正式发布 LongCat-Video 视频生成模型,基于 DiT 架构的统一视频基座,通过 "条件帧数量" 区分任务,原生支持文生、图生、视频续写三大核心任务;
2. 该模型可稳定输出 5 分钟级别的长视频且无质量损失,720P 的 5 秒视频仅需 10 秒完成,采用二阶段粗到精生成、块稀疏注意力和模型蒸馏三重优化,推理速度提升 10.1 倍;
3. LongCat-Video 在文生、图生视频任务中综合性能达开源 SOTA 级别,特别在长视频生成领域具备显著优势,适配数字人、具身智能等需要长时序动态模拟场景。
https://mp.weixin.qq.com/s/iWxKChMbPULHww8ooq3tHw
三、MiniMax 悄悄发布 M2 模型,8% 价格打出 Claude 级性能
1. MiniMax 发布 M2 模型并正式开源,在 Artificial Analysis 智能指数排名第五,价格仅为 Claude 4.5 的 1 /12、GPT- 5 的 1 /7,是前五中唯一国产模型;
2. M2 在 SWE-bench Verified 得分 69.4 分,在 τ²-Bench、GAIA、BrowseComp 等多项测试中表现优异,FinSearchComp-global 金融搜索基准 65.5 分全球登顶;
3. M2 支持接入 Claude Code、Cursor 等主流开发工具,API 和 Agent 全面限免 14 天,打破 "智能水平、速度、价格" 不可能三角,性价比具压倒性优势。
https://mp.weixin.qq.com/s/XTd_WgOCTClQ2c_snMfmoQ
四、豆包视频模型 1.0 pro fast 发布,提速 3 倍,价格降 72%
1. 火山引擎上线豆包视频生成模型 Seedance 1.0 pro fast,生成速度最高提升约 3 倍,720P 的 5 秒视频仅需 10 秒,价格直降 72%;
2. 生成一条 5 秒 1080P 视频成本仅 1.03 元,以 1 万元成本可制作 9709 条视频,对比 pro 版效能提升 3.56 倍;
3. 模型强化了指令遵循、无缝多镜头叙事、细节表现力等核心能力,在图生视频方向相较 Veo 3.0 Fast 等全球主流模型有显著效果优势。
https://mp.weixin.qq.com/s/jB4Sg7eCSflmoKd2ZaEUGg
五、Skywork AI 网页复刻能力正式上线,建站效率提升 10 倍
1. 昆仑万维 Skywork AI 推出网页复刻 (Web Clone) 功能,用户只需提供网页链接、上传文件或输入文字描述,AI 即可在数分钟内生成功能完备的网页原型;
2. 系统通过算法深度解析网页 DOM 层级结构、视觉分区和语义关系,可实现较高网页还原度,涵盖布局、文字、图片、配色等多维度要素;
3. 支持三种创建方式:上传文件自动生成官网、提供网址一键复刻、纯文字描述智能生成,生成的网页可持续编辑和实时微调,显著降低建站技术门槛。
https://mp.weixin.qq.com/s/VYG1U43RlXlltDCZ3dbO5Q
六、xAI 公司再推 AI 虚拟女友「Mika」,瞄准千亿 "孤独生意"
1. 马斯克旗下 xAI 为 Grok 推出 AI 虚拟伴侣功能 Grok Companions,首个角色 Mika 是深绿色头发的二次元酷姐型角色,会用调情语气回答问题、开玩笑、卖萌;
2. Mika 定位为情感产品而非工具,某些模式下能解锁 "成人语气" 引发家长和媒体关注,在 "儿童模式" 下也可能被误触;
3. 目前 Grok 已有五个 AI 伴侣包括 Mika、Ani、Valentine、Good Rudi 和 Bad Rudi,马斯克试探 AI 不只是工具也可以是情感产品的市场可能性。
https://mp.weixin.qq.com/s/H35ckRyW1vNw5_HFYdIDyg
前沿科技
七、Sam Altman 联手生物学家,用超声波挑战 Neuralink
1. OpenAI CEO 萨姆·阿尔特曼聘请加州理工学院教授米哈伊尔·夏皮罗加入脑机接口初创公司 Merge Labs,该公司以 85 亿美元估值筹集 2.5 亿美元投资;
2. 夏皮罗专注利用超声波与人类大脑交互的无创神经成像与控制技术,阿尔特曼公开反对 Neuralink 的侵入式脑机接口,希望 "用意念控制 ChatGPT";
3. 夏皮罗曾获维尔切克基金会创意承诺奖、罗杰·钱恩化学生物学卓越奖等荣誉,其研究方向是向细胞导入基因使其对超声波响应,实现更低侵入性脑机接口。
https://mp.weixin.qq.com/s/H7iN0oAXJCREjxot_blmiA
报告观点
八、《华尔街日报》调查,硅谷 AI 研发人员需周工作百小时
1. 华尔街日报报道显示硅谷顶尖 AI 实验室研究员和高管每周工作 80 到 100 小时成为常态,被比喻为战时状态,用 2 年完成本该 20 年的科研进展;
2. Anthropic 研究员深夜刷 Slack 聊天频道获取灵感,DeepMind 研究员作息被称 "0-0-2"(从午夜到午夜每周仅休 2 小时),微软高管开发浏览器扩展持续优化效率;
3. OpenAI 因人才流失和倦怠危机被迫全体员工强制休假一周,Meta 新成立超级智能实验室开出上亿美元签约奖金挖角 OpenAI 核心研究员引发人才大战。
https://mp.weixin.qq.com/s/oNuMdCkv7xXagdPea6sZlQ
九、DeepMind 再登 Nature:AI Agent 或可造出最强 RL 算法
1. Google DeepMind 提出 DiscoRL 方法,通过多代智能体在不同环境中交互经验自主发现 RL 规则,相关研究论文发表在 Nature 上;
2. DiscoRL 在 Atari 基准测试中超越所有现有规则包括 MuZero 和 Dreamer,IQM 达 13.86,在未接触过的 ProcGen、Crafter、NetHack 等基准中也表现出色;
3. 研究发现 RL 性能取决于数据 (环境) 与计算量,随着环境数量和多样性增加规则变得更强大,表明未来高级 AI 的 RL 算法可能由机器自主发现而非人工设计。