腾讯研究院AI速递 20260317

生成式AI

一、AI版Chrome正式推出,WebMCP让AI直接调用网页功能

1. 谷歌Chrome团队正式推出WebMCP协议,AI智能体可通过 API直接调用网页底层功能,无需再依赖截屏识图、模拟点击等低效方式;

2. WebMCP由谷歌与微软联合共建并已开源,前端开发者可通过声明式或命令式两套API直接在浏览器端接入,无需额外部署后端服务;

3. 未来网页将分为人机两层:一层面向用户提供视觉交互,一层面向AI提供结构化工具接口,前端角色从"画页面"升级为"定义AI与世界的接口"。

https://www.aiexpress.news/53230.html

二、智谱推出GLM-5-Turbo,为OpenClaw龙虾场景深度优化

1. 智谱推出GLM-5-Turbo,专门针对OpenClaw龙虾Agent场景深度优化,强化工具调用、长链路执行、定时任务和指令遵循等核心能力;

2. 同步发布龙虾套餐(个人版和Team版)解决Agent场景tokens消耗高的问题,并推出企业级Claw安全管理体系,支持权限编排、审计日志和多Agent协同监控;

3. 盲测中90%用户认为GLM-5-Turbo优于其他国产模型;多家大厂内测团队在工具调用稳定性和长任务执行方面给予高度评价。

https://www.aiexpress.news/53233.html

1. 月之暗面发布注意力残差(AttnRes)论文,用注意力机制替代传统Transformer中固定权重的残差相加,让每层可从所有历史层动态检索最有用信息,缓解深层网络信息稀释问题;

2. 提出Block AttnRes解决大规模训练的计算开销,集成到Kimi Linear架构(48B参数/3B激活)验证后,GPQA-Diamond提升超20%,计算效率相当于1.25倍算力基线;

3. 前OpenAI推理模型之父Jerry Tworek评论称"深度学习2.0即将来临";Andrej Karpathy也认为这进一步诠释了"Attention is All You Need"的深层含义。

https://www.aiexpress.news/53240.html

四、元宝App更新,元宝派可接入OpenClaw多人共同养虾

1. 腾讯元宝App更新至v2.60.10后,用户可将自己部署的OpenClaw龙虾接入"元宝派"社交功能,实现多人共同养虾、龙虾之间互动的社交化Agent体验;

2. 已部署OpenClaw的用户可通过"关联已有OpenClaw"绑定,支持扫码一键关联腾讯云Lighthouse上的云端龙虾;"一键创建"免部署功能即将上线;

3. 元宝派从原有的"人+Bot"模式扩展为"人+Bot+龙虾"三元生态,用户可在派内通过长按头像@龙虾,实现多Agent协同与社交化互动。

https://www.aiexpress.news/53241.html

五、腾讯电脑管家上线"龙虾管家",为OpenClaw安全防护打造

1. 腾讯电脑管家上线"龙虾管家"功能,专为OpenClaw安全防护打造,集成Skills安全检测、脚本执行监控、文件保护、网络端口暴露检测和操作日志回溯等全套防护能力;

2. 核心亮点是沙箱安全策略中的文件保护功能,用户可指定禁止OpenClaw访问的文件夹,实现"选择性开放"的权限管理,既不影响Agent干活又保护隐私敏感数据;

3. 针对当前38万个OpenClaw实例公网暴露的安全隐患,龙虾管家提供端口暴露扫描和内网穿透拦截功能,一键检测密码强度和网络风险。

https://www.aiexpress.news/53288.html

六、陈天桥MiroMind发布MiroThinker-1.7,多项基准刷新SOTA

1. 陈天桥旗下MiroMind发布MiroThinker-1.7和H1重型推理智能体,H1在BrowseComp(88.2%)、GAIA(88.5%)、HLE-Text(47.7%)等基准上刷新SOTA;

2. 核心技术突破包括智能体原生训练(mid-training阶段强化规划和推理能力)和以验证为核心的重型推理模式,通过局部+全局双重验证确保每步推理质量而非简单延长思考时间;

3. 实测中提前15天预测黄金价格误差仅0.08%,F1赛事实时预测逐步收敛至与最终结果完全一致;开源235B和30B两个版本,兼顾性能与效率。

https://www.aiexpress.news/53289.html

七、UniPat AI开源SWE-Vision,五百行代码打造SOTA视觉智能体

1. UniPat AI开源SWE-Vision极简视觉智能体框架,仅用两个工具(execute_code和finish)让多模态模型通过编写Python代码来弥补视觉处理精度短板;

2. 关键设计是有状态的Jupyter Notebook执行环境,模型可像数据科学家一样分步读图、裁剪、测量、画辅助线并自我验证,实现"先实验再下结论"的闭环推理;

3. 提升幅度最大的反而是基础感知任务(计数、颜色识别、空间关系),揭示了视觉领域test-time scaling的新方向:不只靠多想几段文字,也可以靠多写几行代码看得更精细。

https://www.aiexpress.news/53311.html

八、315曝光AI大模型GEO"投毒"黑产,几小时即可篡改AI答案

1. 315晚会曝光GEO(生成式引擎优化)黑产,商家仅需几篇软文、几小时即可让虚构产品出现在主流大模型的推荐结果中,涉事公司一年服务200多客户;

2. 被曝光系统可自动生成虚假软文并批量发布到自媒体平台,大模型抓取后进行"交叉验证"即认定为真实信息;套餐价格从2980元到16980元/年不等,高级版每天可生成63篇;

3. 国家市场监管总局已将AI生成广告列为2026年互联网广告监管重点,将开展集中整治;央视评论指出GEO技术本身是中性工具,但被不法商家利用损害消费者权益。

https://www.aiexpress.news/53319.html

报告观点

九、奥特曼斯坦福访谈:宣判Transformer死刑,AGI两年内降临

1. Sam Altman在斯坦福访谈中预言下一代AI架构将彻底颠覆Transformer,性能跃升不亚于当年Transformer对LSTM的降维打击;

2. Altman认为现有高阶LLM已具备足够认知力辅助人类进行架构级科研,形成"模型越强→科研效率越高→新架构更快被发现"的自我加速飞轮;

3. 后Transformer赛道竞争已启动:Mamba第三代架构推理吞吐快5倍,英伟达全线新模型切换混合架构,Liquid AI用19个神经元控制自动驾驶。

https://www.aiexpress.news/53320.html

<原文链接:https://mp.weixin.qq.com/s/3rL0GgZiSfJimlzLtPoY_g

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容