共计 2298 个字符,预计需要花费 6 分钟才能阅读完成。
生成式 AI
一、GPT-5.1 的「马甲」Polaris Alpha 泄露,现在免费就能用
1. OpenRouter 平台上线隐名模型 Polaris Alpha,网友认为这是披着马甲的 GPT-5.1,知识库截止 2024 年 10 月,最大 context 容量 256K,单次最大输出 128K;
2. 实测显示 Polaris 在案头工作、编程任务上表现流畅,文风具有典型 GPT 特征,支持 NSFW 模式苗头初显;
3. Polaris 目前通过 API 免费调用,在编程小游戏、网页设计等方面表现不错,网传 GPT-5.1 或将于 11 月中旬正式发布。
https://mp.weixin.qq.com/s/Q6CIljjkW78gyzobXAz9lw
二、谢赛宁、李飞飞、LeCun 提出多模态智能「Cambrian-S」
1. 纽约大学谢赛宁联合李飞飞、Yann LeCun 发布 Cambrian- S 多模态新范式,提出 "空间超感知" 概念,迈出探索视频空间超感知第一步;
2. 该研究定义多模态智能发展路径从语义感知、流式事件认知到 3D 空间认知和预测性世界建模四个层级,引入 VSI-SUPER 基准测试空间超感知能力;
3. Cambrian- S 采用潜变量帧预测头预测感知,通过 "惊讶度" 信号进行记忆管理和事件分割,在空间认知任务上中小型模型超越 Gemini。
https://mp.weixin.qq.com/s/UBWodeMYwC2T9XQ0SNWTnQ
三、美团出了一款 AI IDE 编程工具,代号叫 Meituan CatPaw
1. 美团推出 AI IDE 编程工具 CatPaw,提供 Tab 代码补全、Agent 问答生成、Browser 内置预览调试和 Codebase 项目级分析四大核心功能;
2. CatPaw 背后核心引擎为美团自研 LongCat 大模型,支持 macOS 系统全面兼容 Python、C++、Java 等主流编程语言,当前阶段完全免费;
3. 该工具在美团内部研发人员周活占比超 80%,每周新增代码中 AI 生成占比约 50%,Windows 版本预计本周五上线。
https://mp.weixin.qq.com/s/90bgwDH8hfSGn3WHnX8LQA
四、00 后团队用国产模型推出 Vinsoo,对标 Claude Code
1. 芸思智能推出全球首个搭载云端安全 Agent 编程团队的 AI IDE Vinsoo,仅用国产模型超越搭载 Claude 的 Cursor、Codex 等产品;
2. Vinsoo 通过 DYCODE 和 COTER 实现超长上下文工程算法突破,极限有效上下文达千万量级,支持最多 8 个智能体同步运行开发;
3. 新版本 Beta 3.0 支持云端一键发布、移动端使用和团队协作功能,创始团队由 00 后主导汇聚中美顶尖学府硕博士和资深工程师。
https://mp.weixin.qq.com/s/PBSl39FwXGaSwMxeE-4s4A
五、阶跃星辰发布一个开源音频编辑大模型 Step-Audio-EditX
1. 阶跃星辰发布全球首个开源 LLM 级音频编辑大模型 Step-Audio-EditX,能通过语言指令精准控制音频情感、说话风格和副语言特征;
2. 该模型采用统一 LLM 框架和 "双码本" 音频分词器结构,支持零样本文本转语音、迭代式编辑和中英双语及多方言;
3. 模型约 3B 参数,单卡 32GB GPU 可运行,采用大边际合成数据训练,情感与风格控制准确率优于 MiniMax、Doubao 等闭源模型。
https://mp.weixin.qq.com/s/vumeCAwJyij-95p4H4Jc2g
六、百度的小度 AI 眼镜 Pro 开售!2199 元,今天定明天到手
1. 百度小度 AI 眼镜 Pro 正式开售,售价 2299 元,双十一优惠价 2199 元,重量 39 克搭载 1200 万像素广角摄像头;
2. 眼镜融合多模态 AI 大模型,功能包括拍照、听歌识曲、AI 翻译、AI 识物、AI 备忘和 AI 录音,支持中英文实时翻译 3 秒内出字幕;
3. 与小米 AI 眼镜类型相同,并非当下更为“完全体”版本的 AI+AR 眼镜。
https://mp.weixin.qq.com/s/7QJvmLV1ppEP17aLuCQygA
前沿科技
七、机器人 "会用手" 了!银河通用首破手掌任意朝向旋转难题
1. 银河通用推出灵巧手神经动力学模型 DexNDM,首次实现通用灵巧手对多类物体的稳定、多姿态、多轴向旋转操作,能拧螺丝、抡锤子等工具使用;
2. DexNDM 采用关节级神经动力学模型将手物交互拆解到关节级,通过 "从专家到通才" 训练流程实现跨任务跨形态的稳定操作,无需成功示例即可弥合 Sim2Real 鸿沟;
3. 该技术已应用于遥操作系统,操作者通过 VR 控制器给出高层指令,DexNDM 自主完成手指层面精细控制,实现从 "能抓能放" 到 "能转能用" 的跨越。
https://mp.weixin.qq.com/s/oGKjrQjhJTmKrLtlenbm-w
报告观点
八、YC 合伙人谈 AI 创业:AI 工具无法替代创始人的销售能力
1. YC 合伙人建议 AI 进入传统行业应先找能快速落地的切入点而非全面自动化,早期创业核心竞争力是 "学习速度" 而非规模,应从能快速验证想法的小客户切入;
2. AI SDR 仅在已有运转良好销售流程时有效,创始人必须先搞清楚 "卖给谁、怎么获得注意力" 两大核心问题,AI 工具才能成为放大器而非自我安慰;
3. 技术挑战和开源策略是护城河而非障碍,真正壁垒来自别人不敢碰的难题,开源和自托管能建立信任、缩短销售周期,对企业级 SaaS 产品尤为有价值。