AI 每日速递 2025/11/26

生成式AI

一、智能体&编程新王Claude Opus 4.5更新登场,定价大降2/3

1. Anthropic正式发布Claude Opus 4.5,在编程、智能体及计算机操作方面表现卓越,真实世界软件工程测试达行业SOTA,超越GPT-5.1-Codex-Max和Gemini 3 Pro;

2. API定价为每百万Token 5/25美元(输入/输出),相比上代Opus 4.1降低2/3,在SWE-bench Verified中等effort设定下输出token使用量减少76%;

3. 模型在居家测试中得分超过所有人类候选人,在抵御提示注入攻击方面显著增强,是目前最不容易被欺骗的前沿模型之一。

https://mp.weixin.qq.com/s/cTD-vqtuQXiC6AxBmnYOzQ

二、OpenAI 推出新入口,让 ChatGPT 直接替我们做「购物研究」

1. OpenAI向所有登录用户开放"购物研究"功能,由经过强化学习训练的GPT-5 mini版本支持,准确率达64%,改变传统搜索逻辑让AI替用户做购物功课;

2. 该功能通过追问预算、用途、期待功能等问题生成深度买家指南,支持图片搜索、优惠查找和横向对比,可调取Memory功能中的聊天记录实现个性化推荐;

3. 已有商家加入Instant Checkout功能可实现边挑选边下单,OpenAI声明不收费推荐且不与零售商分享用户聊天记录,但国内市场数据缺失严重。

https://mp.weixin.qq.com/s/E1_5uO5F8ifKq9BBdRYF9A

三、混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA

1. 腾讯混元推出开源模型HunyuanOCR,参数仅1B,在复杂文档解析OmniDocBench测评中获94.1分最高分,超过谷歌Gemini3-pro等领先模型;

2. 模型依托混元原生多模态架构采用端到端训练和推理范式,在OCRBench榜单总得分860分,取得3B以下参数SOTA成绩,支持14种高频小语种翻译;

3. 精通多语种复杂文档解析、文字检测识别,在票据字段抽取、视频字幕识别、拍照翻译等场景广泛应用,获ICDAR2025文档翻译比赛小模型赛道冠军。

https://mp.weixin.qq.com/s/0eT7x7cLpJ3AT_XqeDwelw

四、特朗普正式签署「创世纪计划」,加速利用AI推动科学突破

1. 特朗普签署"创世纪计划"行政命令,被称为AI版"曼哈顿计划",由美国能源部主导构建"美国科学与安全平台"整合超算资源和联邦数据;

2. 明确锁定先进制造、生物技术、关键材料、核裂变与核聚变、量子信息科学、半导体微电子六大优先领域,要求60天内提出20项国家挑战;

3. 设定极速推进时间表270天内展示平台初步运行能力,英伟达、OpenAI、Anthropic等成为潜在供应商,强调数据安全和出口管制要求。

https://mp.weixin.qq.com/s/OGYebbTsMgmvWlHG4QAEOA

五、小米开源自驾+机器人跨领域基座模型MiMo-Embodied

1. 小米汽车陈龙团队开源全球首个打通自驾与具身智能的跨领域基座模型MiMo-Embodied,基于MiMo-VL架构通过四阶段训练策略有效打破领域鸿沟;

2. 模型在自动驾驶与具身智能共29个Benchmark上超越现有专用模型及通用模型,实现SOTA性能,涵盖环境感知、规划到机器人拿取、导航全场景;

3. 采用渐进式训练包含具身AI监督微调、自动驾驶监督微调、思维链推理微调和强化学习微调四阶段,在具身导航和操作任务中展现强大能力。

https://mp.weixin.qq.com/s/ATfIHi9hXfYfGH2JHrH4Rg

六、马斯克开始用Grok替代X推特员工了,最惨部门裁员90%

1. 马斯克解雇X公司负责打击垃圾邮件和信任安全问题工程团队一半成员,该团队从2022年超100人缩减至不足10人,裁员幅度达90%;

2. 马斯克计划彻底移除X启发式推荐算法由Grok接手,通过阅读全部内容自动匹配用户兴趣,xAI双胞胎兄弟Dima和Ievgin Soboliev成顶级工程师执行改造;

3. 马斯克推进"巨硬Macrohard计划"用AI重做微软产品,但裁员影响了X Money支付服务等关键项目,AI改造在砍向成本的同时也砍伤平台安全根基。

https://mp.weixin.qq.com/s/hUPo_1dPnB2g-uLeK2Znzg

七、OpenAI首款AI硬件两年内问世,Altman称想舔一舔原型

1. OpenAI联合创始人阿尔特曼和苹果前首席设计官艾维透露AI硬件已有首批原型,将在不到两年时间内面世,目标成为继iPhone、MacBook后第三大核心设备;

2. 该设备是无屏幕AI手机,大小与iPod Shuffle相仿可挂脖子上,配备麦克风和摄像头能感知用户生活情景,深度理解场景长时间接管任务过滤无关信息;

3. 艾维强调设计理念是美观精巧易用不令人望而生畏,想尝试发源于中国的陶瓷材料,OpenAI今年5月斥资65亿美元收购艾维创办的AI硬件公司io。

https://mp.weixin.qq.com/s/jgwpwjltlLqrSyIq03yJvg

前沿科技

八、用 AI 发明下一代巧克力?老牌食品公司与 NotCo 技术联盟

1. 瑞士巧克力巨头Barry Callebaut与植物基食品科技公司NotCo合作,使用AI引擎Giuseppe开发下一代巧克力,应对全球可可价格三十年最大涨幅;

2. Giuseppe基于十年高保真数据训练,可扫描成千上万种成分分析特性模拟替代方案,将成分化学、配方、感官读数综合成决策引擎加速产品开发周期;

3. Barry Callebaut正积极尝试开发无可可巧克力,但消费者仍需考虑口感变化与配方安全性,AI数据库无法覆盖全世界广度需要时间考量。

https://mp.weixin.qq.com/s/0w9qU-wDS0Q6Qa7hSkgMUA

报告观点

九、李飞飞:不要让AI把你变愚蠢,必须守住"人"的主导权

1. 斯坦福大学教授李飞飞强调AI是文明级技术但未曾预料规模如此庞大,技术应走向普惠开放让每个人平等负责任地参与使用,必须确保发展始终处于人类引导控制之下;

2. 她提出"空间智能"是AI进化下一关键阶段,赋予机器在三维空间中理解感知推理与交互能力,其创办的World Labs估值已达十亿美元正探索这一前沿;

3. 李飞飞认为超级智能挑战根源不在技术而在人类治理能力,教育应培养孩子好奇心批判性思维和责任感,最根本原则是不要让工具使你变愚蠢。

https://mp.weixin.qq.com/s/1eH5_aVuevCK4jDBRSILXw

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容