AI 每日速递 20251106

58次阅读
没有评论

共计 2549 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、AI 太空竞赛?谷歌 Project Suncatcher 也要将 TPU 送上天

1. 谷歌宣布 Project Suncatcher 计划,将于 2027 年初与 Plant 公司发射两颗原型卫星,搭载 Trillium 代 TPU 上天,利用太阳能驱动 AI 计算;

2. 该计划构想由太阳能卫星组成的紧凑型星座,通过自由空间光通信链路相连,太空太阳能效率比地球高 8 倍且几乎可持续发电;

3. Trillium TPU 已通过辐射测试,可承受 5 年任务周期总电离剂量,预计到 2030 年代中期卫星发射至近地轨道成本可降至每千克 200 美元。

https://mp.weixin.qq.com/s/VmzJkIKT-X_3VMLnMg1CLg

二、Anthropic Agent 开发新范式,让 Token 消耗暴降 98.7%?

1. Anthropic 发布 "代码执行" 新范式,建立在 MCP 之上,让模型编写代码调用工具而非直接调用,将 Token 消耗从 15 万降至 2000,效率提升 98.7%;

2. 新范式采用按需加载工具定义、数据本地流转设计,解决了工具定义过载和中间结果消耗两大 Agent 效率瓶颈;

3. 该方案带来渐进式披露、上下文高效、强大控制流、隐私保护和状态持久化五大核心优势,Cloudflare 也独立发现类似模式。

https://mp.weixin.qq.com/s/XHuQghz8bHXqxes_0dS3FQ

三、Open-Sora Plan 公司发 Uniworld V2,擅长中文和细节控制

1. 兔展智能 & 北大推出 UniWorld-V2 图像编辑模型,在 GEdit-Bench 和 ImgEdit 基准测试中取得 SOTA,综合表现超越 OpenAI 的 GPT-Image-1;

2. 该模型基于首创的 UniWorld-R1 强化学习框架,采用多模态大语言模型作为免训练奖励模型,实现精准中文字体渲染和精细化空间可控;

3. UniWorld-R1 框架具有极强通用性,应用于 Qwen-Image-Edit 和 FLUX-Kontext 等基础模型时同样带来显著性能提升。

https://mp.weixin.qq.com/s/MnnqP4KKdcqLIb6116HZaw

四、QQ 浏览器更新,多了一扇「AI+」小窗,14 种能力全集成

1. QQ 浏览器电脑端 v19.8.0 版本推出 "AI+" 小窗功能,以无感悬浮小窗形式集成 14 种 AI 工具,从网页总结到订阅下载均可在小窗内完成;

2. 新版本升级极简框架,合并菜单与个人中心,地址栏右侧还原搜索框支持常驻或隐藏,提供更多自定义操作选项;

3. 基于精准意图识别,"AI+" 小窗能主动推荐可使用的 AI 功能,包括智能标签整理、AI 翻译、订阅助理等多种生产力工具。

https://mp.weixin.qq.com/s/M_45BWw2OnMNU5YJvZpqOw

五、谷歌把十多年世界建模经验和 Gemini 推理,装进了 Earth AI

1. 谷歌重磅升级 Earth AI,发布遥感、人口动力学和环境三大基础模型,并推出 Gemini 驱动的地理空间推理智能体;

2. 遥感基础模型在文本图像检索任务提升超 16%,零样本检测精度达基准线两倍,人口动力学模型覆盖 17 个国家提供按月更新的人类活动嵌入;

3. 地理空间推理智能体在问答基准测试中准确率达 0.82,显著优于 Gemini 基线,已为 20 亿人提供洪水预警服务。

https://mp.weixin.qq.com/s/8gc1rRCGrS7LAjZp8xRVhw

前沿科技

六、小鹏展示了全新一代 IRON 人形机器人,最拟人的具身智能

1. 小鹏发布第二代 VLA 大模型和全新 IRON 人形机器人,VLA 模型实现视觉到车辆控制指令的端到端映射,接管里程提升 13 倍;

2. IRON 机器人拥有 82 个自由度和 22 个手部自由度,搭载 3 颗图灵 AI 芯片总算力达 2250TOPS,为当前人形机器人最高水平;

3. 小鹏计划 2026 年推出三款 Robotaxi 车型启动试运营,总算力 3000TOPS,同时推出面向消费者的 L4 智驾版本。

https://mp.weixin.qq.com/s/mYOpgFcigMnhA9pSeOeT8g

七、Generalist 推出了一类新型的「通用」具身基础模型 GEN-0

1. AI 机器人公司 Generalist 推出具身基础模型 GEN-0,参数量达 10B+,在 27 万小时真实世界操作数据上训练,数据量超现有最大机器人数据集数个数量级;

2. GEN- 0 首创 "和谐推理" 训练方法,在异步连续时间的感知和行动 token 流之间建立和谐相互作用,实现跨机体部署能力;

3. 研究发现 7B 参数出现 "相变" 现象,更小模型表现出 "固化",更大模型持续改进,并展现强大 Scaling Law,证明具身智能可预测扩展。

https://mp.weixin.qq.com/s/kEdFdgePK5ZFVhL1-d7adg

八、银河通用联合多高校,推出跨本体全域环视的导航基座大模型

1. 银河通用联合北大、阿德莱德大学等推出全球首个跨本体全域环视导航基座大模型 NavFoM,统一 Vision-and-Language Navigation 等不同导航任务;

2. 该模型训练数据包含 800 万条跨任务跨本体导航数据和 400 万条开放问答数据,通过 TVI Tokens 和 BATS 策略实现时空理解和实时响应;

3. 基于 NavFoM,银河通用发布 TrackVLA++、UrbanVLA 和 MM-Nav 三个应用模型,构建从室内到城市的完整具身智能导航体系。

https://mp.weixin.qq.com/s/Jf_fRtcae4zL3pX791WSpg

报告观点

九、ElevenLabs 创业方法论:拆成小团队,半年没 PMF 原地解散

1. ElevenLabs 现有 350 人分为 20 个产品小队,每个 5 -10 人完全自治,6 个月内必须完成 PMF,成功继续否则解散;

2. 公司砍掉 Slack 访问权强制注意力集中,让团队专注自己的 6 个月任务,避免信息过载导致的注意力分散;

3. 提成规则明确落后于公司战略,禁止向竞品出售技术写入政策,销售行为符合长期利益可取消交易但业绩照算。

https://mp.weixin.qq.com/s/TznTC5AjWYk-ShLmaoZ9Jg

正文完
 0
评论(没有评论)