AI 每日速递 20251031

61次阅读
没有评论

共计 2516 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、OpenAI 刚刚开源了两个专门用于安全分类的推理模型

1. OpenAI 开源 gpt-oss-safeguard 安全分类模型(120b 和 20b 版本), 采用 Apache 2.0 许可证, 能直接理解策略文档进行内容分类无需重新训练;

2. 该模型在多个基准测试中表现超越 GPT-5-thinking, 在内容审核评估集和 ToxicChat 数据集上达到行业最佳性价比;

3. OpenAI 内部已使用该技术 (Safety Reasoner 原型) 处理图像生成和 Sora 2 等产品, 安全推理算力占比高达 16%。

https://mp.weixin.qq.com/s/_dmZj9IwtbRLpvXHulQ_8g

二、Cursor 2.0 更新, 自研模型 Composer, 多 agent 并行

1. Cursor 发布 2.0 版本, 推出首个自研编码模型 Composer, 生成速度达每秒 250 个 token, 是同类前沿系统的 4 倍, 标志从 "AI 外壳" 向 "AI 原生平台" 转型;

2. Composer 采用混合专家 (MoE) 架构, 通过强化学习针对软件工程优化, 在 Cursor Bench 评测中达到前沿水平, 已被团队日常开发使用;

3. 新版界面支持多智能体并行协作, 基于 git worktree 或远程机器实现不同模型同时处理同一任务, 并增加原生浏览器工具用于测试迭代。

https://mp.weixin.qq.com/s/3wkFC_UCkyRRJm2zR72yFQ

三、Sora 连更三大新功能! 一键打造 IP 形象, 限时免注册

1. Sora 推出角色客串 (Character Cameo) 功能, 支持保持非人类客串角色一致性, 可从生成视频中提取虚拟角色实现自循环;

2. 新增视频拼接功能和社区排行榜, 分为被使用最多的客串角色、被二创最多的视频等分类;

3. Sora 在美国、加拿大、日本和韩国四国限时取消邀请码限制直接开放注册, 正值 Android 版本上线节点抢占安卓市场。

https://mp.weixin.qq.com/s/KEQ0OzpbLtHHPv4GhGcUUQ

四、MiniMax Speech 2.6 更新, 最强 Voice Agent 来袭?

1. MiniMax Speech 2.6 端到端延迟低于 250 毫秒达行业顶尖水平, 已成为 LiveKit、Pipecat、Vapi 等全球语音平台的底层技术引擎;

2. 新版本支持多语言的网址、邮箱、电话、日期及金额等非标准文本格式直接转换, 无需繁琐文本预处理实现信息传递更流畅;

3. 提供 Fluent LoRA 功能, 即使是带口音或不流利的非母语录音也可在音色复刻时生成流利自然语音, 支持 40+ 语种。

https://mp.weixin.qq.com/s/RWXK8FYJVS4LhtocKeIxJw

五、刚刚, 智源悟界·Emu3.5 登场, 原生具备世界建模能力

1. 北京智源发布悟界·Emu3.5 多模态世界大模型, 基于 34B 稠密 Transformer 在超 10 万亿 Token(约 790 年视频)上预训练, 首次揭示 "多模态 Scaling 范式";

2. 采用 "下一状态预测" 目标实现视觉叙事和视觉指导能力, 在图像编辑任务上达到与 Gemini-2.5-Flash-Image 相当性能;

3. 提出离散扩散自适应 (DiDA) 技术将图像推理速度提升近 20 倍, 成为首个在速度和质量上媲美顶级闭源扩散模型的自回归模型。

https://mp.weixin.qq.com/s/wXNDkNzKDG3rx9qZ9GkqgQ

六、OpenAI 明年上市, 万亿美元估值将成史上最大 IPO

1. OpenAI 计划最早 2026 年下半年提交上市申请 2027 年挂牌, 拟通过 IPO 募集至少 600 亿美元, 估值或高达 1 万亿美元成全球最大规模 IPO;

2. 完成架构重组后非营利组织持有新组建 OpenAI 集团 26% 股权, 微软放弃独享云服务优先权但获得额外 2500 亿美元 Azure 采购合同;

3. 双方新协议明确 AGI 实现需经独立专家验证, 微软对 OpenAI 技术使用权延长至 2032 年, 同时获准自主开展 AGI 研究或与第三方合作。

https://mp.weixin.qq.com/s/x86jSJx9FXLFD4Kea-EAIA

前沿科技

七、全开源、可商用, 蛋白质等结构预测模型 OpenFold3

1. OpenFold Consortium 发布 OpenFold3 预览版, 基于超 30 万实验结构和 1300 万合成结构训练, 可预测蛋白质与小分子配体、核酸等相互作用;

2. 在单体 RNA 结构预测中性能匹敌 AlphaFold3, 采用模块化设计支持用户修改模型使其以原生格式解读数据;

3. 所有组件采用 Apache 2.0 许可证允许商用, 诺和诺德、Outpace Bio、拜耳等公司已计划利用该模型加速研发。

https://mp.weixin.qq.com/s/1ECZrXAgOR4cnBQ2vApl3A

报告观点

八、Anthropic 发布最新研究《大语言模型中的内省迹象》

1. Anthropic 通过 "概念注入" 实验发现,Claude 能察觉并报告被人为注入的概念, 在最强模型上内省成功率达 20%;

2. 研究团队通过追溯性注入概念篡改 AI 的 "记忆", 发现模型会基于伪造的内部状态为自己的 "错误" 进行辩护和杜撰理由;

3. 实验证明 AI 已具备对内部表征的刻意控制能力, 这是 "可达意识" 的雏形, 但离拥有主观感受的 "现象意识" 还相差甚远。

https://mp.weixin.qq.com/s/uy8Pp2lNrgszzb_tHlqaMw

九、"AI 顿悟" 的真相、大模型如何学会压缩世界 | 独家

1. 前 Meta FAIR 负责人田渊栋发表 Grokking 研究, 以严格数学证明模型仅需 O(M log M)样本即可实现泛化, 远低于传统 M²的需求;

2. 他揭示 "顿悟" 本质是多峰非凸优化过程, 当数据增多使 "泛化峰" 高于 "记忆峰", 参数集体翻越产生从记忆到泛化的跃迁;

3. 田渊栋强调表征学习是所有智能能力的基础,loss function 只是优化的代理信号, 真正的飞跃源于表征方式的改变。

https://mp.weixin.qq.com/s/FXoGquLjazFUbfkiMAKQpw

正文完
 0
评论(没有评论)