腾讯研究院AI速递 20260309

生成式AI

一、GPT-5.4全整理:首次内置Computer Use,好用

1. OpenAI发布GPT-5.4系列,首次在通用模型中内置Computer Use能力,将代码、推理、桌面操控三大能力合并为统一模型出口;

2. OSWorld桌面操控评测得分75.0%超越人类基准72.4%,GDPval专业工作评测达83.0%,ARC-AGI-2抽象推理跳幅最大达73.3%;

3. 标准版API定价$2.50/M输入、$15/M输出,Pro版12倍溢价主攻复杂Agent场景,Tool Search机制将token消耗降低47%。

https://www.aiexpress.news/50309.html

二、OpenClaw创始人加盟OpenAI首个项目免费送token

1. OpenClaw创始人Peter Steinberger加盟OpenAI后首个项目"Codex for Open Source"正式上线,向开源维护者免费提供API积分和6个月ChatGPT Pro使用权;

2. 申请门槛覆盖核心维护者和被广泛使用的公开项目运营者,非标准项目若在生态中有重要作用也可提交申请说明;

3. Peter自称同时兼顾OpenAI和OpenClaw两份工作,坦言精力投入从200%变成更高,项目目标是尽可能覆盖更多开源贡献者。

https://www.aiexpress.news/50328.html

三、腾讯混元提出HY-WU(无相),推理时实时生成参数"换脑"

1. 腾讯混元提出"功能性神经记忆"新范式HY-WU,在推理时实时生成个性化LoRA参数,替代传统静态微调的"存量博弈"模式;

2. 应用于800亿参数图像编辑基模,在GEdit-Bench多项指标超越闭源模型,与GPT Image 1.5差距仅0.11分,树立开源新标杆;

3. 该范式具备跨模态通用性,团队规划将功能性记忆扩展至视频生成、多模态对齐和端侧部署等六大方向。

https://www.aiexpress.news/50334.html

四、小米移动端AI Agent产品miclaw开启小范围封测

1. 小米基于MiMo大模型推出系统级AI Agent产品miclaw,以系统应用身份运行,封装50+系统级工具,实现推理-执行循环的自主任务编排;

2. 打通米家IoT生态和MCP开放协议,AI可根据日程上下文实时判断并联动全屋设备,支持第三方应用通过SDK主动声明工具能力;

3. 具备自进化元能力,可自主创建子智能体、配置MCP服务、运行沙箱脚本,通过文件级记忆系统持续沉淀用户偏好和使用经验。

https://www.aiexpress.news/50347.html

五、Karpathy开源autoresearch,630行代码AI研究员

1. Karpathy开源autoresearch项目,核心仅630行代码三个文件,让AI Agent在单GPU上自主循环执行代码编辑、模型训练、评估和迭代,全程无需人工干预;

2. 每次训练固定5分钟时长,以val_bpb为统一评估指标,Agent通过Git提交累积有效改进,人类只需迭代指导性prompt文件;

3. Karpathy本人已在8块H100上运行加强版持续自主研究,项目定位为自我进化LLM的概念验证但框架可扩展至任意研究领域。

https://www.aiexpress.news/50353.html

六、Transformer论文作者用Rust重造安全版IronClaw

1. Transformer论文共同作者Illia Polosukhin用Rust从零重写OpenClaw,推出安全版IronClaw,建立四层纵深防御架构确保大模型永远接触不到原始凭证;

2. 核心安全设计包括WASM沙箱隔离工具执行、AES-256-GCM加密凭证保险库和可信执行环境TEE,从架构层面堵住OpenClaw暴露25000+公开实例的安全漏洞;

3. 项目背后是NEAR Protocol"用户自有AI"战略,已搭建AI云平台和智能体互相雇佣市场,IronClaw定位为可信运行时层。

https://www.aiexpress.news/50357.html

七、谢赛宁开源Solaris首个多人视频世界模型,MC中验证

1. 谢赛宁团队推出首个多人视频世界模型Solaris,能够同时生成多名玩家之间保持一致的第一人称视角,在《我的世界》中验证多人协同感知能力;

2. 自主构建SolarisEngine多人数据采集系统,创建含1264万帧的多人Minecraft数据集,是首个带动作标注的多人世界模型训练数据集;

3. 基于MatrixGame 2.0引入多人自注意力层实现玩家间信息交换,在建筑一致性和玩家视觉对齐等困难场景中显著优于此前唯一的多人方案Multiverse。

https://www.aiexpress.news/50358.html

前沿科技

八、Gemini Deep Think攻克宇宙弦引力辐射功率谱未解难题

1. Google Research用Gemini Deep Think+树搜索+自动数值反馈组成神经符号系统,独立攻克理论物理中宇宙弦引力辐射功率谱的精确解析解难题;

2. AI探索约600个候选路径,80%被自动验证器剪枝淘汰,最终找到6种解法,其中格根鲍尔方法最为优雅,权函数恰好消除积分奇点;

3. 最终闭合解析解由人机协作完成,人类研究者将中间结果喂给更强模型进一步化简,展示了可复用的AI驱动科研范式。

https://www.aiexpress.news/50375.html

报告观点

九、Anthropic劳动力报告:AI正悄悄偷走年轻人的第一份工作

1. Anthropic基于Claude实际使用数据发布劳动力市场报告,发现AI冲击并非大规模裁员而是招聘放缓,22-25岁年轻人进入高AI暴露职业的比率下降约14%;

2. 计算机程序员AI任务覆盖率达74.5%居首,但各行业实际AI覆盖率普遍仅为理论值的三分之一,60%潜力尚未释放意味着更大冲击即将到来;

3. 企业停止投资"未来人力资产"转向"即时算力资产",初级岗位的"练级区"正在消失,决策力、审美工程和AI协作能力成为新时代核心竞争力。

https://www.aiexpress.news/50376.html

十、OpenClaw引爆纽约集会,黄仁勋称史上最强软件发布

1. OpenClaw全球热潮持续升温,纽约聚会1300+人抢票人山人海,黄仁勋称其为"历史上最重要的软件发布",覆盖全球6大洲40+城市;

2. 纽约现场观察显示用户月均消耗1000-2000美元模型费用,有人日烧10亿tokens,前金融从业者首日即通过AI交易系统盈利300美元;

3. 安全问题成最大隐患——无人认为系统100%安全,Agent可直接访问完整文件系统,但市场验证了个人智能体的真实需求,消费级AI Agent时代正式开启。

https://www.aiexpress.news/50384.html

<原文链接:https://mp.weixin.qq.com/s/5bJmiFG2d-oPPW1itgwEEw

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容