AI 每日速递 20251119

43次阅读
没有评论

共计 2784 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、马斯克 Grok 4.1 一夜之间登顶 LMArena,情商智商在线

1. xAI 发布 Grok 4.1 双版本模型,Thinking 版以 1483 Elo 登顶 LMArena,非推理版本 1465 Elo 排名第二,超越 Gemini 2.5 Pro;

2. 该模型在 EQ-Bench 情商测试中以 1586 Elo 成绩登顶,创意写作比上代提升 600 分,幻觉率暴降 3 倍,强调情商智商双在线;

3. xAI 将后训练阶段 RL 规模扩大一个数量级,利用前沿 AI 智能体推理模型作为奖励模型自动优化回答质量,对所有人免费开放。

https://mp.weixin.qq.com/s/Y9LiMMk-qvxPvVpbPWfRVQ

二、贝佐斯创业物理 AI!亲任 CEO,首轮获投 62 亿美元融资

1. 61 岁贝佐斯创立 Project Prometheus 亲任联席 CEO,首轮获 62 亿美元融资约合人民币 440 亿,员工规模达上百人;

2. 公司研究项目包括将 AI 应用于机器人、药物设计和科学发现等物理任务,重点放在计算机、汽车、航空航天等高科技领域;

3. 另一联席 CEO 是物理学家兼化学家 Vik Bajaj,曾在谷歌 X 研究机构与谢尔盖·布林紧密合作,创立并领导多家科技创新企业。

https://mp.weixin.qq.com/s/a13d5jfrwuXzaKz-tFVj6g

三、谷歌 AI 科学家内测,锦标赛制 "炼" 想法,一次跑 40 分钟

1. 谷歌为 Gemini Enterprise 开发多智能体系统,可扮演联席科学家角色,通过锦标赛式评估生成并排序约 100 个想法;

2. 该系统可让 Gemini 单个问题持续运行约 40 分钟,代表 L3 级 AI 能力,每个想法附带完整评审报告和锦标赛表现分析;

3. 系统包含 "想法生成" 和 "联席科学家" 两款核心智能体,用户需审查并批准计划摘要后才能启动任务,确保巨大算力投入的合理性。

https://mp.weixin.qq.com/s/D0C-oyo3ZaXv-GiDAvmv4Q

、Physical Intelligence 发布了最新机器人基础模型 π*0.6

1. Physical Intelligence 发布最新机器人基础模型 π *0.6,采用 Recap 方法结合演示训练、纠错指导和自主经验强化学习,大幅提升具身智能成功率和处理效率;

2. 该模型在制作咖啡、折叠衣物和组装纸箱等复杂任务上成功率达 90% 以上,吞吐量提高 2 倍以上,失败率降低 2 倍或更多;

3. π*0.6 基于 π0.6 改进而来,通过价值函数解决信用分配难题,完全使用真实世界数据训练,能够在新环境中灵活执行未知任务。

https://mp.weixin.qq.com/s/EVxkL1yX41fEUv0dBzFYeg

、MiniMax M2 推出 9.9 元编程套餐,OpenRouter Top5

4. MiniMax M2 推出编程套餐首月仅 9.9 元,在 OpenRouter 平台 token 调用量冲至全球 Top5,成为调用量最大的国产模型;

5. 该模型性能位列全球榜单第五,价格仅为 Claude 的 8%,TPS 稳定在 100+,响应速度快且代码质量与 Claude Sonnet 4.5 基本持平;

6. M2 支持 Anthropic 和 OpenAI 两种标准格式,可无缝接入 Claude Code、Cursor 等主流编程工具,5 分钟即可完成配置。

https://mp.weixin.qq.com/s/NSSTLQhKzjnlSX-ZTl6Pfg

六、PixVerse 上线升级版:V5 Fast 及「Modify」精修功能

7. PixVerse 发布 V5 Fast 和 Modify 精修功能,视频生成速度提升超 30%,5 秒高清视频 1 分钟内完成,支持端到端视频编辑;

8. Modify 功能支持元素替换、风格修改、材质调整、光线色调和人物编辑,可对生成视频进行多维度精细化修改而无需重新生成;

9. V5 Fast 通过推理结构轻量化和帧间计算依赖缩短实现加速,爱诗科技已完成 1 亿元 B + 轮融资,平台累计服务超一亿用户。

https://mp.weixin.qq.com/s/el1VE1_1JBd3dXiiEw0q4Q

七、蚂蚁推出的全模态通用 AI 助手「灵光」,快速生成应用

1. 蚂蚁集团推出全模态通用 AI 助手「灵光」,支持自然语言 30 秒生成小应用, 全代码生成多模态内容;

2. 该助手支持 3D 数字模型、音频、图标、动画、地图等全模态信息输出,让对话更生动交流更高效;

3. 「灵光」首批上线 "灵光对话"、"灵光闪应用"、"灵光开眼" 三大功能,已同步登陆安卓与苹果应用商店。

https://mp.weixin.qq.com/s/71fn2gAkz6Huymr6siM3tg

八、全球首个「氛围游戏」Agent 来了,一句话生成完整游戏

1. Gambo AI 推出全球首个专为游戏开发打造的 "氛围编程"Agent,输入一句话 5 -10 分钟即可生成可商业化发布的完整游戏;

2. 平台贯穿美术资源生成、动画制作、音乐作曲、关卡设计、商业变现全自动流水线,零代码零美术基础纯自然语言驱动;

3. 集成变现功能可自动在游戏中嵌入广告点位实现 "发布即盈利",但目前仅支持 2D 平台跳跃类型游戏,复杂关卡可能需手动微调。

https://mp.weixin.qq.com/s/5imR6hkvaTFNBn8dR9zq7w

前沿科技

九、DeepMind 推出新 WeahterNext 2,分辨率可达 1 小时

1. 谷歌 DeepMind 推出 WeatherNext 2 气候预测模型,以 8 倍速度生成预报,分辨率最高可达 1 小时,单次预测在单个 TPU 上不到一分钟;

2. 该模型采用功能生成网络 FGN 新方法,可从单个起点预测数百种可能的天气结果,在 99.9% 的变量和预测时间上超越前代模型;

3. 预报数据已在 Earth Engine 和 BigQuery 中可获取,谷歌云 Vertex AI 平台推出定制模型推断抢先体验项目,已升级搜索、Gemini 等产品。

https://mp.weixin.qq.com/s/Mfr2r4TwzuNdvYwesYm9cA

报告观点

十、CB Insights 报告:Voice AI 引爆,6 大趋势定义 AI 新战场

1. CB Insights 报告显示 2024 年 AI Agent 创业公司融资总额达 38 亿美元是 2023 年三倍,Voice AI 成增长最快赛道 2025 年已融资 4 亿美元;

2. Coding AI Agents 领跑全场 Cursor 以 500M 美元 ARR 居首,Customer service AI 估值倍数高达 219x 远超 80x 平均水平;

3. Reasoning models 使输出 Token 量激增 20 倍导致成本倒挂,2025 年已发生超 35 起收购案,Agent 监控工具成企业级新刚需。

https://mp.weixin.qq.com/s/F3B9XfcEZn_f8zlDl9QtbA

正文完
 0
评论(没有评论)