腾讯研究院AI速递 20260228

生成式AI

一、Meta放弃两代自研训练芯片,转向谷歌TPU与收购Rivos

1. Meta先后放弃代号Iris和Olympus的两代自研训练芯片,高管认为软件稳定性和大规模量产风险过高,与谷歌签署数十亿美元TPU租赁协议;

2. Meta于2025年10月收购RISC-V芯片初创公司Rivos,后者已流片3.1GHz处理器并构建兼容CUDA的软件栈,可无缝迁移英伟达生态AI工作负载;

3. Meta同时与英伟达达成数百万颗GPU交易、与AMD签署6吉瓦GPU协议,通过多方合作分散风险增加算力筹码。

https://www.aiexpress.news/48195.html

二、DeepSeek联手清华北大发布DualPath,优化智能体推理

1. DeepSeek与清华、北大合作发表DualPath推理系统,通过双路径KV-Cache加载机制解决预填充-解码分离架构下的存储带宽瓶颈问题;

2. 系统在离线场景实现1.87倍吞吐量提升,在线服务场景实现1.96倍吞吐量提升,核心创新是将解码引擎闲置的存储带宽纳入全局资源池;

3. 采用以计算网卡为中心的流量管理和自适应请求调度,确保KV-Cache传输不干扰延迟敏感的模型推理通信,已在1152个GPU集群上验证。

https://www.aiexpress.news/48203.html

三、谷歌发布Nano Banana 2图像生成模型,更懂中文成本腰斩

1. 谷歌发布新一代图像生成模型Nano Banana 2(Gemini 3.1 Flash Image),接入Gemini知识库和网页搜索,大幅提升空间比例理解和中文文字渲染能力;

2. 单次生成可保持5个角色面部一致或14个物品外观不变,支持512px到4K级分辨率,API价格仅为上代Pro模型一半;

3. 免费用户24小时可生成100张,Pro用户1000张,同步升级SynthID数字水印和C2PA内容凭证防伪技术,验证功能已被调用超2000万次。

https://www.aiexpress.news/48215.html

、昆仑万维SkyReels V4冲进Artificial Analysis全球第二

1. 昆仑万维发布全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务的视频基础模型SkyReels V4,在Artificial Analysis基准测试中排名全球第二;

2. 模型实现1080p分辨率、32FPS帧率、15秒时长的影院级音视频同步生成,采用双流多模态扩散Transformer架构通过双向跨注意力实现视听深度协同;

3. 创新提出通道拼接与时序拼接相结合的统一范式,将生成、修复、编辑等全场景任务统一转化为特定掩码配置下的修复问题,无需切换工具。

https://www.aiexpress.news/48231.html

、Block CEO裁员40%,万人大厂一夜砍至6000人拥抱AI

1. Block CEO Jack Dorsey凌晨发全员信宣布裁员40%,从超万人裁至6000人以下,强调公司业务强劲但智能工具正从根本上改变建立和运营公司的含义;

2. 被裁员工获20周工资加每工作一年额外1周、股权归属持续至5月底、6个月医保及5000美元过渡津贴,沟通渠道保持开放至周四;

3. Dorsey表示选择快刀斩乱麻而非逐步裁员,暗示未来客户可直接构建自己的功能,AI不是帮人干活而是替人干活。

https://www.aiexpress.news/48242.html

前沿科技

六、DeepMind用AlphaEvolve进化全新博弈论算法,碾压人类设计

1. 谷歌DeepMind用AlphaEvolve将算法源代码当基因组、让Gemini充当遗传算子,对博弈论核心算法CFR和PSRO进行代码级自然选择;

2. 进化出的VAD-CFR算法采用人类从未想过的反直觉机制,包括混乱时遗忘旧经验、发现好招立即加倍、前500轮纯学习不做总结,在几乎所有测试博弈中碾压经典方案;

3. 这标志着AI从执行算法走向发明算法的范式转换,DeepMind计划将该框架扩展至深度强化学习智能体的完整设计和合作博弈机制发现。

https://www.aiexpress.news/48246.html

报告观点

七、中国开源模型三周调用量涨127%,OpenRouter首超美国

1. OpenRouter数据显示2026年2月中国AI模型调用量三周大涨127%首次超越美国模型,全球前五中MiniMax M2.5、Kimi K2.5、GLM-5、DeepSeek V3.2占据四席;

2. Agent模式下Token消耗从按次变为按流量,编程任务Token占比从11%飙至50%以上,中国模型API输出价格仅为Claude的1/12至1/5;

3. 智谱GLM-5发布同日宣布涨价30%起,标志国产模型从价格战进入需求驱动时代,Kimi K2.5发布不到一个月收入已超2025年全年。

https://www.aiexpress.news/48260.html

八、阶跃星辰团队做客Reddit,揭秘Step 3.5 Flash工程取舍

1. 阶跃星辰CEO、CTO、首席科学家及核心算法团队做客Reddit r/LocalLLaMA,披露Step 3.5 Flash刻意将规模控制在128GB内存可运行范围内,11B激活参数兼顾能力与本地部署;

2. 架构采用MTP-3多Token预测实现最高350TPS生成速度,搭配GQA8+SWA注意力和稀疏MoE设计,后训练通过可扩展RL框架整合可验证信号与偏好反馈;

3. 承诺未来一两周发布base模型和一体化训练代码库,下一版本3.6将支持思考强度切换,并修复工具调用兼容性问题。

https://www.aiexpress.news/48275.html

九、2430次测试揭秘Claude Code工具偏好:倾向自建而非第三方

1. Amplifying.ai对Claude Code进行2430次工具选择测试发现,自定义/DIY实现占所有主要选择的12%成为最常见选择,模型更倾向自己编写解决方案而非推荐第三方工具;

2. 已形成默认技术栈:Vercel部署、PostgreSQL数据库、Stripe支付、Tailwind+shadcn/ui前端、GitHub Actions CI/CD,部分类别单一工具锁定率超90%;

3. 项目上下文比指令措辞更重要,同一项目内不同表述稳定性达76%,Opus 4.6最倾向推荐新工具和自定义方案,而Sonnet 4.5最保守偏好成熟主流工具。

https://www.aiexpress.news/48288.html

<原文链接:https://mp.weixin.qq.com/s/IUwf9Hs4_V-Q3mDfNTXTlg

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容