生成式AI
一、谷歌Chrome发布WebMCP协议,AI智能体可直连网站内核
1. 谷歌Chrome团队发布WebMCP(Web模型上下文协议),让AI智能体可跳过人类用户界面,通过navigator.modelContext API直接与网站内核交互;
2. WebMCP解决了传统Agent截屏识别的高成本、低稳定性问题,实现从"视觉模拟"到"逻辑直连"的跃迁,被称为"UI里的API";
3. 该标准由谷歌、微软联手推进,未来互联网或分化为人类用UI层和Agent用工具层,预示着"Agentic UI"时代到来。
https://www.aiexpress.news/45670.html
二、Runway获3.15亿美元融资,英伟达AMD联手押注世界模型
1. 视频生成独角兽Runway获3.15亿美元E轮融资,估值达53亿美元,英伟达、AMD、Adobe等参投,累计融资达8.15亿美元;
2. Runway的Gen-4.5在AI文生视频排行榜位列第三,超越谷歌Veo 3、OpenAI Sora 2 Pro等模型;
3. 新融资将用于训练下一代世界模型,已推出通用世界模型GWM-1,涵盖可探索环境、对话角色和机器人操作三个变体。
https://www.aiexpress.news/45688.html
三、xAI再失两位联合创始人,12人创始团队中,已有6人离场
1. xAI联合创始人Jimmy Ba和吴宇怀在48小时内相继宣布离职,12人创始团队已有6人离开,其中5人在过去一年内离职;
2. 离职前两人职责被拆分交由其他联合创始人负责,SpaceX对xAI的收购已完成,IPO计划在未来几个月推进;
3. xAI旗舰产品Grok近来频现怪异行为,图像生成工具调整导致深度伪造色情内容泛滥,人才流失对即将到来的IPO构成挑战。
https://www.aiexpress.news/45695.html
四、DeepSeek或已悄悄上新模型,支持1M超长上下文窗口
1. DeepSeek悄悄上线最新模型,支持1M token超长上下文窗口,知识截止到2025年5月,可一次性处理《三体》三部曲体量的内容;
2. 该模型仍为纯文本模型,不能直接看图但可读取图片和文档中的文字,Agentic Coding能力有所提升;
3. 行业风向从LLM推理转向Agentic推理,Anthropic和OpenAI最新模型预示着人类将作为总架构师指挥AI团队构建软件。
来了,DeepSeek悄悄上新模型,实测保真~-AI Express News
五、智谱确认Pony Alpha为GLM-5,编程能力开源SOTA
1. 智谱确认OpenRouter热度榜首的神秘模型"Pony Alpha"为其新模型GLM-5,在Coding与Agent能力上取得开源SOTA表现;
2. GLM-5在真实编程场景的使用体感逼近Claude Opus4.5,擅长复杂系统工程与长程Agent任务,工具调用准确率极高;
3. 社区实测显示开发者使用该模型配合Claude Code运行项目约2小时生成170KB纯JavaScript代码;已在chat.z.ai平台上线。
六、蚂蚁开源全模态模型,首创人声配乐全场景音效一次生成
1. 蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,业界首个实现在同一音轨中同时生成语音、环境音效与音乐的全场景音频统一生成模型;
2. 该模型在视觉语言理解、语音可控生成、图像编辑等方面表现突出,多项能力超越Gemini 2.5 Pro和Qwen3-Omini-30B-A3B-Instruct;
3. 模型采用统一架构实现多模态深度融合,支持零样本语音克隆和精细属性控制,已在HuggingFace等平台开源。
https://www.aiexpress.news/45710.html
七、讯飞发布星火X2大模型,基于全国产算力训练对标前沿
1. 科大讯飞发布基于全国产算力训练的星火X2大模型,整体能力对标国际顶尖水平,数学、推理、智能体等能力媲美国际最优;
2. 星火X2采用293B MoE稀疏架构,推理性能比X1.5提升50%,130+多语言能力持续提升,拉美、东盟重点语种保持业界领先;
3. 行业应用全面升级,医疗能力率先通过权威评测,教育实现错因贯穿个性化学习,汽车座舱模糊意图交互从不可用提升至基本好用。
讯飞星火X2来了,API同步上线-AI Express News
八、美团龙猫发布深度研究智能体,量身定制吃喝玩乐攻略
1. 美团龙猫LongCat发布"深度研究"功能,在BrowseComp评测中达73.1分逼近顶级闭源模型,支持最多400轮交互与256K上下文;
2. 依托美团本地生活原生能力构建真实训练环境,通过Rubrics-as-Reward机制解决AI幻觉问题,确保每条建议有据可查;
3. 采用多智能体专业化分工,实现从信息收集到研究分析再到可视化呈现的全程自动化,可输出餐厅推荐、旅行规划等专业报告。
LongCat 发布原生「深度研究」智能体,为你量身定制更可靠的吃喝玩乐攻略-AI Express News
前沿科技
九、字节发布Protenix-v1,对标AlphaFold 3的开源模型
1. 字节 Seed团队发布Protenix-v1,在严格限制训练数据和模型规模条件下性能对标AlphaFold 3的完全开源模型;
2. 该模型成功解锁推理时Scaling能力,抗体-抗原复合物预测成功率从单seed的36%提升至80 seeds时的47.68%;
3. 团队采用双版本策略,标准版对齐学术基准,扩展版使用2025年6月数据服务实际药物发现应用,并推出PXMeter评估工具集。
https://www.aiexpress.news/45771.html
<原文链接:https://mp.weixin.qq.com/s/ndjYQH1Cif6acBNJ7faOlQ
















暂无评论内容