腾讯研究院AI速递 20260128

生成式AI

一、微软原定2025年发布的AI芯片Maia 200,终于在今天问世

1. 微软发布自研AI芯片Maia 200,采用台积电3nm工艺,单芯片超1400亿晶体管,FP4性能超10 PetaFLOPS,是第三代Amazon Trainium的三倍;

2. 该芯片专为AI推理打造,配备216GB HBM3e内存和7TB/s带宽,每美元性能比当前最新硬件提升30%;

3. Maia 200将为OpenAI GPT-5.2等大模型提供支持,已部署在美国中部数据中心,SDK预览版同步开放。

刚刚,微软全新一代自研AI芯片Maia 200问世-AI Express News

二、Claude升级「交互式功能」,将Slack、Figma装进对话框

1. Anthropic为Claude新增MCP服务,整合Figma、GitHub、Canva等生产力工具,用户可在对话中直接调用第三方服务功能;

2. 该功能让Claude从被动聊天机器人转变为主动调度外部资源的智能体平台,用户可用自然语言指挥完成跨应用工作流;

3. MCP协议开源,旨在争夺AI时代"操作系统"定义权,Anthropic通过深度集成而非开放市场的方式保障初期用户体验。

OpenAI 的最强对手,离「AI Windows」又近了一步-AI Express News

三、DeepSeek-OCR 2开源,VLM架构新突破,AI像人一样读图

1. DeepSeek开源OCR专用模型DeepSeek-OCR 2,采用新型解码器让模型按结构顺序阅读而非机械扫描,更好理解复杂布局和表格;

2. 模型在OmniDocBench v1.5测试中达91.09%得分,较前代提升3.73%,阅读顺序编辑距离从0.085降至0.057;

3. 该架构具备演变为统一全模态编码器的潜力,可在同一参数空间内处理文本、语音和视觉内容。

DeepSeek最新王炸模型:VLM架构重磅突破,AI像人一样读图-AI Express News

四、Kimi K2.5模型开源,全新视觉理解、代码和Agent集群能力

1. 月之暗面发布并开源Kimi K2.5,是目前最智能全能的模型,原生支持视觉与文本输入、思考与非思考模式、对话与Agent任务;

2. K2.5首次引入Agent集群能力,可自主创建最多100个分身并行处理1500个步骤,实际运行时间最高缩短4.5倍;

3. 同步发布编程工具Kimi Code,支持终端运行和主流编辑器集成,可输入图片视频进行编程辅助,Agent SDK将开源。

Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力-AI Express News

五、千问Qwen3-Max-Thinking正式发布,自主调工具的思考模型

1. 阿里发布千问系列旗舰推理模型Qwen3-Max-Thinking,在19项基准测试中对标GPT-5.2-Thinking、Claude-Opus-4.5;

2. 模型具备自适应工具调用能力,可按需自动调用搜索引擎和代码解释器,无需用户手动选择;

3. 采用经验累积式测试时扩展策略,将计算资源集中于更聪明的推理过程而非堆并行路径,实现更准更省的推理效果。

憋了4个月,阿里最大最强模型正式版发布!附一手实测-AI Express News

六、腾讯搜狗输入法亿级规模应用宣布全面AI化,升级三大模型

1. 腾讯搜狗输入法发布第20个大版本,全面接入混元大模型,AI用户规模破亿,日均语音使用近20亿次;

2. AI语音大模型实现识别流畅性提升40%、准确率达98%,方言识别提升30%,20分贝以下轻声场景准确率仍达97%;

3. AI翻译接入腾讯混元翻译模型支持30多种语言即译,AI打字模型词库量指数级提升,本地生活词扩充至5000万以上。

接入混元大模型,腾讯这个亿级规模应用宣布全面AI化-AI Express News

七、3D生成平台Hyper3D发布Rodin Gen-2 Edit,支持局部编辑

1. Hyper3D发布Rodin Gen-2 Edit,推出基于自然语言的3D模型局部编辑功能,是业内首个将3D生成与编辑整合为完整工作流的商用产品;

2. 支持框选区域输入文字指令完成局部调整,可导入任意现有模型包括第三方AI生成模型进行编辑,修改区域与原模型衔接自然;

3. 3D生成从"抽卡"进入可迭代工作流时代,平台已打通Blender、Maya、Unity等主流工作流。

3D版Nano Banana来了!AI修模成为现实,3D生成进入可编辑时代-AI Express News

前沿科技

八、蚂蚁具身研究首亮相,解决机器人「看」透明玻璃这些难题

1. 蚂蚁灵波科技开源高精度空间感知模型LingBot-Depth,无需更换硬件即可显著提升透明、反光等复杂材质场景的深度输出质量;

2. 模型采用掩码深度建模方法,利用传感器自然缺失的深度作为学习信号而非噪声剔除,在深度精度和像素覆盖率上优于顶级深度相机;

3. 实测中灵巧手可成功抓取透明玻璃杯和反光不锈钢杯,模型已完成轻量化,完全开源并做好落地准备。

蚂蚁具身研究首次亮相!就解决了机器人「看」透明玻璃这些难题,还开源了-AI Express News

报告观点

九、Anthropic CEO两万字长文:最早2027年出现诺奖级别的AI

1. Dario Amodei发布长文预警,称2027年人类将迎来"技术成年礼",届时AI可能形成拥有5000万"国民"的"数据中心天才国家";

2. 文章剖析五大危机:AI自主性风险、生物武器滥用、极权控制、经济颠覆及存在主义危机,警告AI将打破"能力"与"动机"的平衡;

3. Anthropic坚持以"宪法AI"和合理监管构建防线,尽管被视为行业异类,过去一年估值仍翻6倍,呼吁人类以勇气通过文明考验。

Anthropic CEO两万字长文:2027,人类命运的十字路口-AI Express News

<原文链接:https://mp.weixin.qq.com/s/0_WLclJx-lwmgCwvN4uTyA

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容