腾讯研究院AI速递 20260130

生成式AI

一、MiniMax Music 2.5发布,格莱美级创作,不再需要录音棚

1. MiniMax正式发布Music 2.5,在段落级强控制与物理级高保真两大技术难题上实现突破,支持14种结构标签精准控制歌曲情绪曲线和乐器配置;

2. 针对华语流行音乐深度优化,极大减少吞字糊音问题,实现中英文无缝切换,人声具备细腻转音颤音和共鸣切换;

3. 扩充至100+种乐器音色库,可根据摇滚、爵士、Lofi等不同风格自动调整混音策略,保持人声与伴奏清晰分离。

https://www.aiexpress.news/43013.html

二、Skywork AI开源视频生成模型SkyReels-V3,三大核心功能

1. 昆仑万维Skywork AI开源SkyReels-V3,支持参考图像转视频、视频延长和音频驱动虚拟形象三大核心能力,多项指标达行业领先;

2. 参考图像转视频功能可根据1至4张图像生成高保真视频,在一致性指标上超越Vidu Q2、Kling 1.6等主流商用模型;

3. 视频延长功能支持单镜头和镜头切换两种模式,虚拟形象模型可从单张肖像生成分钟级音视频同步内容。

https://www.aiexpress.news/43014.html

三、蚂蚁灵波正式开源世界模型 LingBot-World,可做实时操控

1. 蚂蚁灵波开源世界模型LingBot-World,专为交互式场景设计,可实现近10分钟连续稳定无损生成和约16FPS实时交互;

2. 模型具备长时序一致性和记忆能力,镜头移开60秒后返回场景中核心物体仍保持结构外观一致;

3. 采用混合数据策略结合网络视频和游戏采集,具备Zero-shot泛化能力,可为具身智能提供低成本高保真的数字演练场。

https://www.aiexpress.news/43015.html

四、不只PPT,Kimi K2.5 Agent可以帮你做Excel、Word和PDF

1. Kimi K2.5模型上线后Agent办公能力升级,支持Word智能排版修订、PDF视觉设计图文混排、Excel数据分析金融建模和PPT自动生成;

2. 可完成大量数据录入、多版合同比对、超长文档翻译、论文速转PPT等任务,将数小时工作缩减至十几分钟;

3. 实现Office技能"平权",用户可像指挥金融分析师、版面设计师一样让AI完成DCF估值建模、出版级PDF画册等专业任务。

https://www.aiexpress.news/43016.html

五、Nature封面:谷歌Alpha系列新成员,"秒懂"生命终极蓝图

1. 谷歌DeepMind发布AlphaGenome登上Nature封面,可一次性处理100万碱基对DNA序列,精准预测数千种基因调控分子信号;

2. 模型在24项基因组轨迹预测任务中22项达SOTA水平,能在一秒内评估遗传变异对多种生物过程的影响;

3. 可用于罕见病诊断、癌症致病机制揭示、合成生物学设计等领域,模型代码和权重已向全球科研界开放。

https://www.aiexpress.news/43029.html

前沿科技

六、Figure 发布 Helix 02,最贵人形机器人在研究用脚关洗碗机

1. Figure发布Helix 02模型,实现运动与操控统一,机器人能自主判断用脚踢门、用胯顶抽屉等拟人动作,无需预先训练;

2. 核心组件System 0以1000Hz频率运行,通过学习超1000小时人类动作数据实现类脊髓反射的平衡控制,删除了10万行手工C++代码;

3. Figure估值达390亿美元,计划四年内生产10万台机器人,Helix 02连续执行61个运动操作动作展示了全身自主能力。

https://www.aiexpress.news/43037.html

七、马斯克砍掉Model S/X,「变身」擎天柱,转型机器人公司

1. 马斯克宣布Model S和Model X将于2026年Q2停产,为弗里蒙特工厂生产Optimus人形机器人腾出空间;

2. 特斯拉2025年总收入948亿美元同比降3%,净利润同比降46%,销量同比降8.5%,已被比亚迪取代全球最畅销电动车称号;

3. 马斯克称人形机器人将使特斯拉估值达25万亿美元,甚至未来不会有人记得特斯拉造过车,FSD付费用户已接近110万。

https://www.aiexpress.news/43046.html

报告观点

八、Andrej Karpathy的长推文预言:程序员正在分裂成两个物种

1. Karpathy发文称短短几周工作流从80%手写代码变为80%让AI写代码,预测2026年程序员将分裂为"喜欢写代码"和"喜欢造东西"两类;

2. AI犯错本质已从语法错误变为概念性错误,会过度设计用1000行实现100行能搞定的功能,缺乏"奥卡姆剃刀"式审美;

3. AI编程带来的不是加速而是能力边界扩张,让人开始做以前"不值得写"的工具,预测2026年将迎来垃圾信息大爆发。

https://www.aiexpress.news/43060.html

九、月之暗面三联创深夜回应一切,杨植麟剧透Kimi K3提升巨大

1. 月之暗面三位联创在Reddit举行3小时AMA,回应K2.5自称Claude是因预训练数据上采样而非蒸馏,K2.5在多项基准已优于Claude;

2. 杨植麟透露K3将在Kimi Linear基础上加入更多架构优化,相信即便没比K2.5强10倍也会强很多;

3. 周昕宇强调"创新往往诞生于约束之中",团队有"把事情真正做成并落地"的共同价值观,GPU差距并未缩小但AGI所需算力仍待验证。

https://www.aiexpress.news/43046.html

十、Clawdbot之父Peter Steinberger走红后首个2小时深度专访

1. PSPDFKit创始人Peter Steinberger退休3年后重返编程,用AI实现一天600个Commit,同时操控5-10个AI Agent像下多面棋;

2. 他提出"Pull Request已死"观点,更想看生成代码的prompt而非代码本身,认为闭环验证是AI编程核心秘诀;

3. 他的Moltbot(原Clawdbot)一周内GitHub star从100涨到8万+,认为痴迷算法难题的工程师反而难适应AI开发。

https://www.aiexpress.news/43061.html

<原文链接:https://mp.weixin.qq.com/s/H5VbFQkG4M34A9xWBuWceg

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容