生成式AI
一、谷歌TurboQuant压缩算法,KV缓存降至3-bit内存省6倍
1. 谷歌发布TurboQuant算法,通过极坐标变换与1-bit误差校验两步法,将KV缓存压缩至3-bit,内存占用降低6倍,推理速度提升8倍;
2. 该算法无需重训或校准数据,在五大长上下文基准测试中性能接近全精度模型,"大海捞针"测试在10万Token下完美通关;
3. 消息引发存储芯片板块集体重挫,美光、西数等巨头股价全线下跌,但业界认为杰文斯悖论将使实际内存需求不降反升。
https://mp.weixin.qq.com/s/OWjQaBvHun4j9sI08-w98g
二、OpenAI关停Sora次日,谷歌发布AI音乐模型Lyria 3 Pro
1. 谷歌发布Lyria 3 Pro,可生成最长3分钟完整歌曲,支持前奏、主歌、副歌等结构化编排,用户可精确控制节奏与歌词时间轴;
2. AI Studio新增Composer模式支持分段调节,拍照谱曲功能升级,并通过Gemini App、API、Google Vids等多入口全面开放;
3. OpenAI因成本压力关停Sora,半年仅赚210万美元且迪士尼10亿合作泡汤,谷歌则选择将生成能力嵌入已有产品生态。
https://mp.weixin.qq.com/s/p-xIqSK7GN97wxyz2IeNTA
三、英伟达AVO自主进化7天,注意力内核性能超越人类专家
1. 英伟达提出智能体式变异算子AVO,用自主编码智能体替代传统进化搜索中的人工设计方法,在Blackwell B200 GPU上连续自主运行7天无需人工干预;
2. AVO生成的注意力内核在BF16精度下达1668 TFLOPS,超越英伟达官方cuDNN最高3.5%,超越FlashAttention-4最高10.5%;
3. 该优化可迁移至分组查询注意力,仅需30分钟自主适配即获显著性能提升,研究者称"盲编程是软件工程的未来"。
https://mp.weixin.qq.com/s/JGqF9Z1up9nRq_owePisbQ
四、Meta提出超级智能体HYPERAGENTS,AI自我迭代进化
1. Meta团队将哥德尔机思想与达尔文开放算法结合,提出达尔文哥德尔机,Agent不仅能完成任务还能优化"改进自身"的底层逻辑,实现元学习;
2. 在SWE-bench上性能从20%自动提升至50%,且针对特定模型优化的智能体在切换到其他模型时仍能提升性能,具有跨领域迁移能力;
3. 论文进一步提出超级智能体DGM-H,将任务智能体与元智能体整合为可编辑程序,实现元认知自我修改,已被ICLR 2026接收。
https://mp.weixin.qq.com/s/jpFmFkCmFn8lgVCOPn9QiQ
前沿科技
五、华为等873机构受NeurIPS新规限制,中国学界发起抵制
1. NeurIPS新增条款禁止美国OFAC制裁名单上的机构投稿和参与审稿,涉及华为、商汤、中芯国际、海康威视等873条中国相关名单条目;
2. 多位学者公开拒绝担任领域主席和审稿人,中国计算机学会发布声明倡议暂停投稿与审稿,必要时将NeurIPS移出推荐目录;
3. 中国学者已成NeurIPS核心力量,清华大学以390篇论文位列NeurIPS 2025全球第一,此举被批评为将学术交流政治化。
https://mp.weixin.qq.com/s/8V6zan06bZI2ZeuS1S74BA
六、AI科学家 AI Scientist登上Nature,实现端到端自动化科研
1. Sakana AI等团队提出的AI Scientist系统首次实现科研全流程自动化,能自主生成研究思路、编写代码、运行实验、撰写论文并进行同行评审;
2. 系统生成的一篇论文获得ICLR 2025研讨会6.33分评审成绩,若非因"AI生成"预定协议撤回,极大概率会被接收;
3. 研究显示系统产出质量随基础模型能力和计算资源投入提升而明显上升,但仍存在创意浅显、代码错误和引用幻觉等局限。
https://mp.weixin.qq.com/s/OJRgiOtuvl_he1HPntwpEw
报告观点
七、林俊旸从Qwen离职首发长文,从"想得更久"到"为行动而想"
1. 林俊旸判断AI下一阶段方向是智能体式思考,核心从"让模型想得更久"转向"让模型边做边想",通过与环境的闭环交互持续推进任务;
2. 他指出思考模式与指令模式的数据分布天然互斥,Qwen3尝试混合模式后2507版本最终回归独立发布,而Anthropic走集成路线更为成功;
3. 智能体时代的竞争优势将从RL算法转向环境质量、训练推理紧耦合和harness工程能力,reward hacking是最大技术挑战。
https://mp.weixin.qq.com/s/omLaxHMxqH8mApSgowGQ1Q
八、Harness is the New Dataset,智能体系统工程成为新焦点
1. AI工程方法经历了从Prompt Engineering到Context Engineering再到Harness Engineering的三次演进,模型能力过线后瓶颈外移至系统层;
2. Harness包含记忆管理、工具技能、编排协调、基础设施、评估验证和追踪观测六大组件,核心原则是精准信息披露、工具精简和上下文利用率控制在60%以下;
3. DeepMind工程师提出"Harness即数据集",模型公司与应用公司的竞争已从模型层转向"模型+harness"整体,下一代范式可能是多智能体协调工程。
https://mp.weixin.qq.com/s/9qI83Ne-Ac_R9y-yJ6SVnQ
九、Gartner发布中国AI趋势预测:国产AI芯片、AI安全测试
1. Gartner预测到2030年中国80%本地AI基础设施将采用国产AI芯片,目前仅为20%,出口限制推动了自主研发进程和本土市场保护;
2. 到2028年跨区域合规与AI偏见问题将占AI数据管理量的50%,企业需通过数据属地化等方式应对多区域模型混用带来的合规风险;
3. 到2029年70%的中国企业将落地正式AI安全测试,AI智能体将承担大型企业超40%的IT运营任务,"智能体化企业"是下一阶段方向。
https://mp.weixin.qq.com/s/LRJWQcLoWaOfhCQSDvuUqQ
👇加入AGI数据库,AI智能问答
![图片[1]-腾讯研究院AI速递 20260327-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/10/ba0b11144103938c1b8af70ae02ab732.png)
👇订阅下方合集,获取每日推送
<原文链接:https://mp.weixin.qq.com/s/kZPAP6HQEbLCJBexalpJBw















暂无评论内容