生成式AI
一、OpenAI拉响红色警报!暂停广告和Agent,下周发新模型
1. OpenAI宣布进入"红色警报"状态,暂停广告、AI Agent和Pulse项目,集中资源修复和升级ChatGPT,下周将发布全新推理模型对抗Gemini 3;
2. 战略优先级调整为产品体验优先于商业变现,重点改进个性化、响应速度、减少拒答和模型行为,目标是在LMArena等榜单上赢回用户;
3. OpenAI面临巨大市场压力,需从100亿美元营收增长至200亿,2027年达到350亿美元,以支撑约1000亿美元融资需求。
https://mp.weixin.qq.com/s/n8RA9ZIy0l6xfd0RZ_LkXA
二、Runway Gen-4.5刷屏发布,把重量、尘土和光影都做对了
1. Runway Gen-4.5以1247 Elo评分在Artificial Analysis文本转视频基准测试中拿下SOTA,超越所有现有模型,物理还原度与视觉精准度获"视频生成AGI时刻"评价;
2. 模型擅长理解并执行复杂序列式指令,可在单个提示词中精准指定镜头运镜、场景构图、时间节点和氛围变化,物体移动具备真实重量感与动量特征;
3. 官方正在逐步开放使用权限,未来几天内所有用户都能体验,将以当前订阅套餐相近的价格全面开放,加量不加价。
https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg
三、快手可灵发布AI视频「O1模型」,统一多模态视频生成
1. 快手发布"全球首个统一多模态视频模型"可灵AI视频O1,将视频修改、镜头延展、多主体参考等功能整合到一个统一模型,支持3-10秒自由生成时长;
2. O1模型具备多图参考生成、局部编辑、镜头延展和动作捕捉能力,多主体元素镜头切换能稳住一致性,局部编辑自然流畅;
3. 快手宣布一周连续上新,Day 2也已发布图片O1模型,在高度一致性、细节处理、风格复刻和创意融合方面表现突出。
https://mp.weixin.qq.com/s/Q3aRvE7LBCvkirvuRdbYeA
四、拍我AI(PixVerse) V5.5 更新:人人都能用 AI 视频当导演
1. 拍我AI V5.5成为国内首个能一键生成"分镜+音频"的AI视频大模型,实现了从素材生成到完整叙事的跨越,具备多角色音画同步和多镜头切换能力;
2. 该模型展现出对视听语言的深度理解,能根据场景自主匹配音效、精准拿捏口型与情绪、智能编排景别镜头,已达到广告提案和影视预演的可用水准;
3. AI视频正从"素材生成"迈入"内容生成"时代,普通人无需专业设备和剪辑技能,即可通过AI完成专业级视频创作。
https://mp.weixin.qq.com/s/ibFB-FCdgE2RmiAlgOTA5w
五、这款"什么都不能做"的AI,试图定义下一代游戏NPC?
1. 蔡浩宇美国AI公司Anuttacon推出聊天产品AnuNeko,不提供生产力功能,专注模拟真实人类对话反应,通过"不知道"和反问保持真人感;
2. AnuNeko提供Orange Cat和Exotic Shorthair两种人格模型,拒绝执行功能性任务,刻意限制AI的"全知全能"以确立独立个体身份;
3. Anuttacon拥有约50人团队,正在打造通用AI NPC生成平台,未来开发者只需输入设定即可生成具备真实交互的NPC角色。
https://mp.weixin.qq.com/s/filQzf9eC0jn28y7ewZMdw
六、英伟达推理版VLA,Alpamayo-R1让自动驾驶更会动脑子
1. 英伟达推出Alpamayo-R1推理版视觉-语言-行动模型,基于Cosmos Reason,通过Chain of Causation因果链数据集让车辆能"推理出因果关系";
2. AR1采用扩散式轨迹解码器和多阶段训练策略,规划精度提升12%,越界率降低35%,近碰率降低25%,推理-行动一致性提升37%,端到端延迟仅99ms;
3. 模型引入多维度奖励机制包括专家推理反馈、推理-行动一致性奖励和底层安全奖励,能解释每个驾驶决策的原因。
https://mp.weixin.qq.com/s/McHq2iVPg6zfyGEjhIfN_g
七、华为开源 openPangu-R-7B-Diffusion,32K上下文慢思考
1. 华为开源openPangu-R-7B-Diffusion扩散语言模型,基于openPangu-Embedded-7B用800B tokens续训练,成功将上下文长度扩展至32K;
2. 模型在MMLU-Pro超越16B参数的LLaDA 2.0-mini-preview 22%,数学推理MATH得分84.26,代码生成MBPP得分84.05,创7B参数量级新SOTA;
3. 采用前文因果注意力掩码设计,支持自回归+扩散双模式解码,并行解码速度最高可达自回归解码的2.5倍,训练推理全流程在昇腾NPU完成。
https://mp.weixin.qq.com/s/xR3v0qDmip7yGbbsbY2Msg
前沿科技
八、众擎发布了最新旗舰产品,全尺寸高动态通用机器人 T800
1. 众擎机器人发布T800全尺寸高动态通用机器人,身高173cm体重75kg,全身43个自由度关节,最大关节力矩高达450 N·m,移动速度3m/s;
2. T800采用72V行星/直线混合驱动,能完美执行巴西战舞、回旋踢、五连踢、组合拳和飞踢等高难度动作,实现对170cm同等身高男性80%以上性能超越;
3. 众擎计划2026年实现数十台级别小批量交付验证场景,2027年争取T800销量达到1-2万台,12月24日将举办"机甲拳王"机器人自由格斗比赛。
https://mp.weixin.qq.com/s/Vxf_1qV6u6EBtK2_JqF-5Q
报告观点
九、红杉美国:人的问题,信念与愿景,要走在用户认知之前
1. 红杉美国首位华裔女性合伙人Jess Lee强调所有问题都是"人的问题",提出EQ、PQ、IQ、JQ四维人才评估框架,重视组建互补型尖锐人才团队;
2. 她认为早期与用户沟通核心是理解真实问题而非产品功能反馈,信念与愿景要走在用户认知之前,早期PM应主动承担更多非职责内工作;
3. 最大的创业教训是选错市场和商业模式,不同业务有自身"物理定律",订阅制现金流优势远超社交电商,商业模式是投资首要考虑因素之一。











暂无评论内容