腾讯研究院AI速递 20260212

生成式AI

一、谷歌Chrome发布WebMCP协议,AI智能体可直连网站内核

1. 谷歌Chrome团队发布WebMCP(Web模型上下文协议),让AI智能体可跳过人类用户界面,通过navigator.modelContext API直接与网站内核交互;

2. WebMCP解决了传统Agent截屏识别的高成本、低稳定性问题,实现从"视觉模拟"到"逻辑直连"的跃迁,被称为"UI里的API";

3. 该标准由谷歌、微软联手推进,未来互联网或分化为人类用UI层和Agent用工具层,预示着"Agentic UI"时代到来。

https://www.aiexpress.news/45670.html

二、Runway获3.15亿美元融资,英伟达AMD联手押注世界模型

1. 视频生成独角兽Runway获3.15亿美元E轮融资,估值达53亿美元,英伟达、AMD、Adobe等参投,累计融资达8.15亿美元;

2. Runway的Gen-4.5在AI文生视频排行榜位列第三,超越谷歌Veo 3、OpenAI Sora 2 Pro等模型;

3. 新融资将用于训练下一代世界模型,已推出通用世界模型GWM-1,涵盖可探索环境、对话角色和机器人操作三个变体。

https://www.aiexpress.news/45688.html

三、xAI再失两位联合创始人,12人创始团队已有6人离场

1. xAI联合创始人Jimmy Ba和吴宇怀在48小时内相继宣布离职,12人创始团队已有6人离开,其中5人在过去一年内离职;

2. 离职前两人职责被拆分交由其他联合创始人负责,SpaceX对xAI的收购已完成,IPO计划在未来几个月推进;

3. xAI旗舰产品Grok近来频现怪异行为,图像生成工具调整导致深度伪造色情内容泛滥,人才流失对即将到来的IPO构成挑战。

https://www.aiexpress.news/45695.html

四、DeepSeek或已悄上新模型,支持1M超长上下文窗口

1. DeepSeek悄悄上线最新模型,支持1M token超长上下文窗口,知识截止到2025年5月,可一次性处理《三体》三部曲体量的内容;

2. 该模型仍为纯文本模型,不能直接看图但可读取图片和文档中的文字,Agentic Coding能力有所提升;

3. 行业风向从LLM推理转向Agentic推理,Anthropic和OpenAI最新模型预示着人类将作为总架构师指挥AI团队构建软件。

来了,DeepSeek悄悄上新模型,实测保真~-AI Express News

五、智谱确认Pony Alpha为GLM-5,编程能力开源SOTA

1. 智谱确认OpenRouter热度榜首的神秘模型"Pony Alpha"为其新模型GLM-5,在Coding与Agent能力上取得开源SOTA表现;

2. GLM-5在真实编程场景的使用体感逼近Claude Opus4.5,擅长复杂系统工程与长程Agent任务,工具调用准确率极高;

3. 社区实测显示开发者使用该模型配合Claude Code运行项目约2小时生成170KB纯JavaScript代码已在chat.z.ai平台上线

智谱深夜发布新模型-AI Express News

六、蚂蚁开源全模态模型,首创人声配乐场景音效一次生成

1. 蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,业界首个实现在同一音轨中同时生成语音、环境音效与音乐的全场景音频统一生成模型;

2. 该模型在视觉语言理解、语音可控生成、图像编辑等方面表现突出,多项能力超越Gemini 2.5 Pro和Qwen3-Omini-30B-A3B-Instruct;

3. 模型采用统一架构实现多模态深度融合,支持零样本语音克隆和精细属性控制,已在HuggingFace等平台开源。

https://www.aiexpress.news/45710.html

七、讯飞发布星火X2大模型,基于全国产算力训练前沿

1. 科大讯飞发布基于全国产算力训练的星火X2大模型,整体能力对标国际顶尖水平,数学、推理、智能体等能力媲美国际最优;

2. 星火X2采用293B MoE稀疏架构,推理性能比X1.5提升50%,130+多语言能力持续提升,拉美、东盟重点语种保持业界领先;

3. 行业应用全面升级,医疗能力率先通过权威评测,教育实现错因贯穿个性化学习,汽车座舱模糊意图交互从不可用提升至基本好用。

讯飞星火X2来了,API同步上线-AI Express News

八、美团龙猫发布深度研究智能体,量身定制吃喝玩乐攻略

1. 美团龙猫LongCat发布"深度研究"功能,在BrowseComp评测中达73.1分逼近顶级闭源模型,支持最多400轮交互与256K上下文;

2. 依托美团本地生活原生能力构建真实训练环境,通过Rubrics-as-Reward机制解决AI幻觉问题,确保每条建议有据可查;

3. 采用多智能体专业化分工,实现从信息收集到研究分析再到可视化呈现的全程自动化,可输出餐厅推荐、旅行规划等专业报告。

LongCat 发布原生「深度研究」智能体,为你量身定制更可靠的吃喝玩乐攻略-AI Express News

前沿科技

九、字节发布Protenix-v1,对标AlphaFold 3的开源模型

1. 字节 Seed团队发布Protenix-v1,在严格限制训练数据和模型规模条件下性能对标AlphaFold 3的完全开源模型;

2. 该模型成功解锁推理时Scaling能力,抗体-抗原复合物预测成功率从单seed的36%提升至80 seeds时的47.68%;

3. 团队采用双版本策略,标准版对齐学术基准,扩展版使用2025年6月数据服务实际药物发现应用,并推出PXMeter评估工具集。

https://www.aiexpress.news/45771.html

<原文链接:https://mp.weixin.qq.com/s/ndjYQH1Cif6acBNJ7faOlQ

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容