生成式AI
一、抽成25%!美国批准AI芯片对华供应,点名H200、MI325X
1. 特朗普签署新公告对英伟达H200、AMD MI325X等先进AI芯片征收25%关税,同时美国商务部将对华出口许可审查从"推定拒绝"改为"逐案审查";
2. 新规要求对华芯片数量不得超过美国客户总量的一半,且符合一定安全标准,关税覆盖TPP在14000-21100、DRAM带宽4500-6200GB/s范围的芯片;
3. 美国众议院通过《远程访问安全法案》限制中国通过云计算服务远程获取AI芯片,特朗普要求商务部7月前提供数据中心芯片市场最新情况。
https://mp.weixin.qq.com/s/vOZ-yOAG0s3sg4SuwOmucQ
二、谷歌发布由Gemini3模型驱动的Personal Intelligence功能
1. 谷歌正式发布由Gemini3模型驱动的Personal Intelligence功能,底层打通Gmail、Photos、YouTube和Search四大应用,AI可跨应用调取数据实现私有上下文理解;
2. 该功能内置自然语言纠错机制,用户可直接在对话框指出AI的错误推断,系统实时修正认知记录,降低数据模型管理门槛;
3. 目前处于Beta测试阶段,优先向Google AI Pro和AI Ultra等付费用户开放,支持Web、Android和iOS全平台,未来将覆盖免费版用户。
https://mp.weixin.qq.com/s/j14bSuap-tqR7SIZTKGe1Q
三、比FSD更安全?英伟达在奔驰CLA的智能驾驶实测曝光
1. 英伟达搭载全新L2++级辅助驾驶系统的奔驰CLA在旧金山完成近40分钟测试,表现流畅且无碰撞,展示出与特斯拉FSD相当的能力,且雷达提供冗余感知被认为更安全;
2. 英伟达计划2026年上半年推出L2级高速与城市驾驶功能,2026年底覆盖全美,2027年推进Robotaxi部署,2028年实现L3级高速公路驾驶;
3. 英伟达仅用1年实现城市自动驾驶功能追平特斯拉8年成果,采用Drive AGX Thor芯片(约3500美元),基于强化学习系统随经验积累持续改进。
https://mp.weixin.qq.com/s/FCRPzgAdNFAHc683udrFnA
四、千问App上线AI购物,正式从聊天对话迈入"AI办事时代"
1. 千问App上线400多项办事功能,接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,首次实现点外卖、买东西、订机票、订酒店等AI购物功能;
2. 新增功能包括AI点外卖(支付环节在对话界面内完成无需跳转)、AI购物、AI打电话订餐厅、50项政务服务直达办理入口、智能旅行规划等;
3. 上线"任务助理"功能提供应用开发、office办公、咨询调研、生活办事等能力,得益于AI Coding、全模态理解、超长上下文处理底层技术突破。
https://mp.weixin.qq.com/s/X6EcUa2FStamXd9InxUaxQ
五、滴滴给我发了个赛博助理,名字叫小滴,专管出行的那种
1. 滴滴上线Agent"小滴",用户通过一句话即可选择油电动力、空气清新、车型甚至车色,识别模糊需求如"带大件行李"自动推荐后备箱大的车;
2. 小滴具备需求优先级排序能力,分为"必要"、"优先安排"、"最好能有"、"尽量满足"等多个等级,优先满足排序靠前的需求,像产品经理一样思考;
3. 上线3个多月迭代后,AI激活了滴滴精细化运营积累,技术和运营壁垒转化为用户体验壁垒,机器人记住用户习惯提供个性化服务。
https://mp.weixin.qq.com/s/norFlpaY6M_YgJZn_QGIpA
六、阶跃Step-Audio-R1更新1.1版本,刷新权威大模型评测榜单
1. 阶跃星辰原生语音推理模型Step-Audio-R1.1登顶Artificial Analysis Speech Reasoning榜单,以96.4%准确率超越Grok、Gemini、GPT-Realtime等主流模型;
2. Step-Audio-R1是全球首个开源原生语音推理模型,可端到端理解语音内容实现深度语音推理、实时响应和音频领域可扩展CoT,无需增加额外时延;
3. Step-Audio-R1.1兼顾更强实时对话和复杂语音推理能力,完整实时语音API将于2月上线,目前chat模式已支持边想边说的流式推理。
https://mp.weixin.qq.com/s/UqVjKZCrneK0fkIX0oC3UQ
七、GPT-5.2连肝7天,300万行代码造出Chrome级浏览器
1. Cursor CEO让GPT-5.2连续运行整整一周(168小时),写下300万行代码、数千个文件,从零构建出包含HTML解析、CSS布局、文本渲染和JavaScript虚拟机的完整浏览器;
2. 采用多智能体系统分层架构,规划者负责探索代码库和高层决策,执行者专注完成具体任务,评审判断每轮迭代是否合格,实现上百个Agent协同工作数周几乎无冲突;
3. 实验显示GPT-5.2能长时间自主工作遵循指令精准保持专注,而Claude Opus 4.5倾向尽早结束频繁交还控制权,GPT-5.1-Codex规划能力较弱容易中断。
https://mp.weixin.qq.com/s/ncT5MUAnw32bJ2uBA0P1XA
前沿科技
八、智元搞的新公司单独融资,全球首个机器人租赁平台「擎天租」
1. 全球首个机器人租赁平台"擎天租"完成种子轮融资,高瓴创投领投,复星创富、慕华科创、大丰基金及张江集团旗下具身智能公司跟投;
2. 平台上线三周注册用户突破20万,日均租赁订单稳定在200单以上,连接50个核心城市600多家服务商,汇聚1000多台不同品牌机器人设备;
3. 采用共享租赁+平台化调度模式,租金从长租200元/天到日租上千元梯度定价,与中国人保财险合作推出损伤险和责任险,承诺"只换不修"。
https://mp.weixin.qq.com/s/RHh9RpUhB9S3w2DE408CpA
九、人脸机器人登Science Robotics封面:用AI学「开口说话」
1. 美国哥伦比亚大学研究登上Science Robotics封面,展示具备仿生面部结构的人形机器人,通过深度学习实现与语音和歌曲同步的真实唇部运动;
2. 机器人面孔在柔性硅胶皮肤下隐藏20余个微型电机,通过"视觉-动作"自监督学习构建Facial Action Transformer(FAT)模型,观察自己面部变化学会控制表情;
3. 机器人可将声音信号直接转化为连续自然的唇部运动,测试显示在多种语言、不同语音环境甚至歌曲中均能完成连贯的唇部同步,跨语言泛化能力稳健。
https://mp.weixin.qq.com/s/BySG2N_jsBf8XsB7v4-SOg
【原文链接】https://mp.weixin.qq.com/s/hV061ZcAhnfy_WK27Aj9hw












暂无评论内容