腾讯研究院AI速递 20260205

生成式AI

一、英伟达将投资200亿美元参投OpenAI,史上最大单笔投资

1. 英伟达正接近完成200亿美元投资协议参与OpenAI最新融资,将成为英伟达有史以来最大单笔投资,黄仁勋称"这是非常好的投资";

2. OpenAI此轮融资总目标1000亿美元,亚马逊计划投资最高500亿美元,软银考虑投入300亿美元,估值将达约8300亿美元;

3. 该投资意味着AI基础设施与头部模型开发商捆绑加深,资本正加速向极少数超级玩家集中。

近7000亿!史上最大单笔融资要来了-AI Express News

二、腾讯混元AI Infra核心技术重磅开源:推理吞吐提升30%

1. 腾讯混元正式开源生产级高性能LLM推理核心算子库HPC-Ops,基于CUDA和CuTe从零构建,混元模型推理QPM提升30%,DeepSeek模型提升17%;

2. 在单算子性能上,Attention相比FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM相比DeepGEMM最高提升1.88倍,FusedMoE相比TensorRT-LLM最高提升1.49倍;

3. 该算子库针对国内主流推理显卡优化,解决现有主流算子库使用成本高、目标硬件不匹配等痛点。

腾讯混元AI Infra核心技术重磅开源:推理吞吐提升30%-AI Express News

三、阿里开源Qwen3-Coder-Next,80B参数专攻智能体编程

1. 阿里开源Qwen3-Coder-Next模型,总参数80B激活参数仅3B,在SWE-Bench Verified上实现超70%问题解决率,媲美激活参数大10-20倍的模型;

2. 模型擅长长段推理、复杂工具使用及从执行失败中恢复,支持256k上下文,可与Cline、Claude Code等多种IDE平台无缝集成;

3. 周靖人、林俊旸署名论文同步发布SWE-Universe框架,将真实世界多语言SWE环境扩展至近百万级。

阿里深夜开源80B编程模型!专攻智能体,周靖人、林俊旸最新成果发布-AI Express News

四、名为rentahuman.ai网站上线:AI通过MCP协议雇人跑腿

1. 名为rentahuman.ai的网站上线,定位为"AI的肉身层",AI可通过MCP协议或REST API雇佣人类完成取货送货、活动签到、实地勘察等线下任务;

2. 网站上线不到48小时可用人力突破2万,允许人类自设时薪且无需闲聊,已发布的任务包括拍照、试吃餐厅、领取包裹等;

3. 该网站引发责任归属、任务真实性验证及AI雇佣人类的伦理问题讨论,被视为MCP协议价值的又一体现。

倒反天罡:「租个人」网站爆火,AI开始雇人「跑腿」了-AI Express News

五、面壁智能开源MiniCPM-o 4.5,9B参数实现全双工对话

1. 面壁智能开源全模态旗舰模型MiniCPM-o 4.5,仅9B参数实现"边看、边听、主动说"的全双工能力,成为行业首个"即时自由对话"大模型;

2. 模型采用端到端全模态架构,通过时分复用机制和主动交互机制,以1Hz频率自动决策是否发言,实现感知不中断、对话不死板;

3. 语音生成全面升级,支持声音克隆和角色扮演,长语音合成保持稳定,配套开源llama.cpp-omni高效端侧推理框架。

MiniCPM-o 4.5开源:「眼耳口」并用,模型交互从「一问一答」变为「即时自由对话」​​-AI Express News

六、昆仑天工发布Skywork桌面版,Windows可用的AI员工

1. 昆仑天工发布Skywork桌面版,直接在本地执行任务无需上传云端,可读取海量本地文件进行汇总整理并生成新产物,支持多任务并行;

2. 支持Claude Opus 4.5、Sonnet 4.5和Gemini 3 Pro模型切换,内置100+精选Skills,涵盖Office三件套、网页、图片、视频生成等;

3. 优先支持Windows系统,图像视频生成质量更高,所有操作在本地虚拟机隔离环境完成确保数据安全。

昆仑天工面向全球发布“Skywork桌面版”,让你的Windows电脑也能雇一个AI员工-AI Express News

七、苹果Xcode 26.3引入AI,支持Claude和Codex智能体

1. 苹果发布Xcode 26.3版本,正式引入"智能体编程"支持,开发者可直接调用Anthropic的Claude Agent和OpenAI的Codex等AI智能体;

2. 集成后的AI智能体可浏览搜索整个项目结构、读写编辑删除文件、根据指令构建项目,并自动抓取苹果官方文档解决问题;

3. 用户反馈两极分化,有人称体验舒适,也有开发者反映存在卡死、Diff机制差、跨文件重构不稳健等问题。

苹果 Xcode 终于引入 AI,「Agentic Coding」攻入「果系」开发者大本营-AI Express News

八、开源音乐生成模型ACE-Step 1.5,4分钟歌曲1秒生成

1. 开源音乐生成模型ACE-Step 1.5在ComfyUI获得首日支持,采用混合LM+DiT架构,在RTX 5090上生成4分钟完整歌曲仅需约1秒;

2. 模型支持50+种语言指令,仅需不到4GB显存即可运行,音乐连贯性评分达4.72超越多数商业模型;

3. 支持LoRA微调实现风格个性化,即将支持音乐重构Cover和片段修复Repaint功能,全程本地运行确保数据安全。

ACE-Step 1.5 现已在 ComfyUI 中获得首日支持-AI Express News

前沿科技

九、谷歌发布PaperBanana,多智能体协作生成论文插图

1. 谷歌发布PaperBanana,建立"生成-反馈-优化"的多智能体协作框架,旨在把科研人员从耗时的论文插图绘制工作中解放出来;

2. 系统包含检索员、规划师、造型师、可视化专家和评论家五个角色协作,在简洁性、可读性、综合美学度等关键指标上实现提升;

3. 在处理密集节点的复杂架构时仍存在文字扭曲或连线错误的局限,未来将引入代码扩散模型绘图和人机协作接口。

谷歌PaperBanana来了:这“香蕉”太懂科研-AI Express News

原文链接:https://mp.weixin.qq.com/s/uIET0uYwYs65dLD5OFIMdQ

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容