AI 每日速递 2025/11/26

42次阅读
没有评论

共计 2770 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、智能体 & 编程新王 Claude Opus 4.5 更新登场,定价大降 2 /3

1. Anthropic 正式发布 Claude Opus 4.5,在编程、智能体及计算机操作方面表现卓越,真实世界软件工程测试达行业 SOTA,超越 GPT-5.1-Codex-Max 和 Gemini 3 Pro;

2. API 定价为每百万 Token 5/25 美元(输入 / 输出),相比上代 Opus 4.1 降低 2 /3,在 SWE-bench Verified 中等 effort 设定下输出 token 使用量减少 76%;

3. 模型在居家测试中得分超过所有人类候选人,在抵御提示注入攻击方面显著增强,是目前最不容易被欺骗的前沿模型之一。

https://mp.weixin.qq.com/s/cTD-vqtuQXiC6AxBmnYOzQ

二、OpenAI 推出新入口,让 ChatGPT 直接替我们做「购物研究」

1. OpenAI 向所有登录用户开放 "购物研究" 功能,由经过强化学习训练的 GPT-5 mini 版本支持,准确率达 64%,改变传统搜索逻辑让 AI 替用户做购物功课;

2. 该功能通过追问预算、用途、期待功能等问题生成深度买家指南,支持图片搜索、优惠查找和横向对比,可调取 Memory 功能中的聊天记录实现个性化推荐;

3. 已有商家加入 Instant Checkout 功能可实现边挑选边下单,OpenAI 声明不收费推荐且不与零售商分享用户聊天记录,但国内市场数据缺失严重。

https://mp.weixin.qq.com/s/E1_5uO5F8ifKq9BBdRYF9A

三、混元 OCR 模型宣布开源,参数仅 1B,多项核心能力 SOTA

1. 腾讯混元推出开源模型 HunyuanOCR,参数仅 1B,在复杂文档解析 OmniDocBench 测评中获 94.1 分最高分,超过谷歌 Gemini3-pro 等领先模型;

2. 模型依托混元原生多模态架构采用端到端训练和推理范式,在 OCRBench 榜单总得分 860 分,取得 3B 以下参数 SOTA 成绩,支持 14 种高频小语种翻译;

3. 精通多语种复杂文档解析、文字检测识别,在票据字段抽取、视频字幕识别、拍照翻译等场景广泛应用,获 ICDAR2025 文档翻译比赛小模型赛道冠军。

https://mp.weixin.qq.com/s/0eT7x7cLpJ3AT_XqeDwelw

四、特朗普正式签署「创世纪计划」,加速利用 AI 推动科学突破

1. 特朗普签署 "创世纪计划" 行政命令,被称为 AI 版 "曼哈顿计划",由美国能源部主导构建 "美国科学与安全平台" 整合超算资源和联邦数据;

2. 明确锁定先进制造、生物技术、关键材料、核裂变与核聚变、量子信息科学、半导体微电子六大优先领域,要求 60 天内提出 20 项国家挑战;

3. 设定极速推进时间表 270 天内展示平台初步运行能力,英伟达、OpenAI、Anthropic 等成为潜在供应商,强调数据安全和出口管制要求。

https://mp.weixin.qq.com/s/OGYebbTsMgmvWlHG4QAEOA

五、小米开源自驾 + 机器人跨领域基座模型 MiMo-Embodied

1. 小米汽车陈龙团队开源全球首个打通自驾与具身智能的跨领域基座模型 MiMo-Embodied,基于 MiMo-VL 架构通过四阶段训练策略有效打破领域鸿沟;

2. 模型在自动驾驶与具身智能共 29 个 Benchmark 上超越现有专用模型及通用模型,实现 SOTA 性能,涵盖环境感知、规划到机器人拿取、导航全场景;

3. 采用渐进式训练包含具身 AI 监督微调、自动驾驶监督微调、思维链推理微调和强化学习微调四阶段,在具身导航和操作任务中展现强大能力。

https://mp.weixin.qq.com/s/ATfIHi9hXfYfGH2JHrH4Rg

六、马斯克开始用 Grok 替代 X 推特员工了,最惨部门裁员 90%

1. 马斯克解雇 X 公司负责打击垃圾邮件和信任安全问题工程团队一半成员,该团队从 2022 年超 100 人缩减至不足 10 人,裁员幅度达 90%;

2. 马斯克计划彻底移除 X 启发式推荐算法由 Grok 接手,通过阅读全部内容自动匹配用户兴趣,xAI 双胞胎兄弟 Dima 和 Ievgin Soboliev 成顶级工程师 执行改造;

3. 马斯克推进 "巨硬 Macrohard 计划" 用 AI 重做微软产品,但裁员影响了 X Money 支付服务等关键项目,AI 改造在砍向成本的同时也砍伤平台安全根基。

https://mp.weixin.qq.com/s/hUPo_1dPnB2g-uLeK2Znzg

七、OpenAI 首款 AI 硬件两年内问世,Altman 称想舔一舔原型

1. OpenAI 联合创始人阿尔特曼和苹果前首席设计官艾维透露 AI 硬件已有首批原型,将在不到两年时间内面世,目标成为继 iPhone、MacBook 后第三大核心设备;

2. 该设备是无屏幕 AI 手机,大小与 iPod Shuffle 相仿可挂脖子上,配备麦克风和摄像头能感知用户生活情景,深度理解场景长时间接管任务过滤无关信息;

3. 艾维强调设计理念是美观精巧易用不令人望而生畏,想尝试发源于中国的陶瓷材料,OpenAI 今年 5 月斥资 65 亿美元收购艾维创办的 AI 硬件公司 io。

https://mp.weixin.qq.com/s/jgwpwjltlLqrSyIq03yJvg

前沿科技

八、用 AI 发明下一代巧克力?老牌食品公司与 NotCo 技术联盟

1. 瑞士巧克力巨头 Barry Callebaut 与植物基食品科技公司 NotCo 合作,使用 AI 引擎 Giuseppe 开发下一代巧克力,应对全球可可价格三十年最大涨幅;

2. Giuseppe 基于十年高保真数据训练,可扫描成千上万种成分分析特性模拟替代方案,将成分化学、配方、感官读数综合成决策引擎加速产品开发周期;

3. Barry Callebaut 正积极尝试开发无可可巧克力,但消费者仍需考虑口感变化与配方安全性,AI 数据库无法覆盖全世界广度 需要时间考量。

https://mp.weixin.qq.com/s/0w9qU-wDS0Q6Qa7hSkgMUA

报告观点

九、李飞飞:不要让 AI 把你变愚蠢,必须守住 "人" 的主导权

1. 斯坦福大学教授李飞飞强调 AI 是文明级技术但未曾预料规模如此庞大,技术应走向普惠开放让每个人平等负责任地参与使用,必须确保发展始终处于人类引导控制之下;

2. 她提出 "空间智能" 是 AI 进化下一关键阶段,赋予机器在三维空间中理解感知推理与交互能力,其创办的 World Labs 估值已达十亿美元正探索这一前沿;

3. 李飞飞认为超级智能挑战根源不在技术而在人类治理能力,教育应培养孩子好奇心批判性思维和责任感,最根本原则是不要让工具使你变愚蠢。

https://mp.weixin.qq.com/s/1eH5_aVuevCK4jDBRSILXw

正文完
 0
评论(没有评论)