AI 每日速递 20251205

生成式AI

一、OpenAI代码泄露!最强模型「皇帝」登基,0思考延时

1. OpenAI四个神秘新模型在DesignArena测试,均为"企鹅家族",推理预算分别为Emperor(512)、Rockhopper(64)、Macaroni(16)和Mumble(0);

2. 内部代码流出显示OpenAI正开发"记忆搜索"功能,用户可通过提问快速检索存储的记忆信息,解决当前记忆管理界面难用的痛点;

3. 有付费用户称对话中收到ChatGPT广告推送引发取消订阅潮,外界猜测OpenAI可能提前发布GPT-5.2以应对谷歌Gemini竞争压力。

https://mp.weixin.qq.com/s/fswchZ8a8YClow1yHO6ifg

二、可灵新一代数字人 2.0 已全量上线!不止会说,更会演

1. 可灵数字人2.0正式全量上线,带来表现力拉满、手部及口型精准控制、支持最长5分钟三大突破性改变;

2. 模型精通体态动作、手势、表情、镜头语言,口型效果真实自然,手部细节大幅提升,无惧特写;

3. 在多维度客观评测中效果胜负比综合得分远超同类产品,单次生成视频时长支持5分钟,覆盖深度科普、歌曲演绎等长内容场景。

https://mp.weixin.qq.com/s/IbHKzsWYyVUxO_flqo400g

三、豆包图像创作模型Seedream 4.5发布,聚焦商业生产力

1. 火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5并开启公测,在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代;

2. 重点强化多图组合生成能力,优化海报排版与Logo设计功能,支持高精度图文混排,确保多源素材融合时的自然感与一致性;

3. 全面支持广告营销、电商运营、影视制作、数字娱乐及教育等核心场景应用,已上线火山方舟并面向企业开放API使用。

https://mp.weixin.qq.com/s/UXsaqeQTJUbpwGlmI22Xkg

四、19年苹果老将被Meta挖走,曾负责神机iPhone X设计

1. Meta官宣苹果人机交互设计副总裁艾伦·戴伊加入并成立全新设计工作室,戴伊将担任Meta首席设计官,直接向现实实验室CTO汇报;

2. 戴伊在苹果工作19年,曾负责Apple Watch、Vision Pro头显和iOS 26液态玻璃视觉系统设计,其副手比利·索伦蒂诺也同时加入Meta;

3. 今年Meta已从苹果挖走基础模型团队经理庞若鸣等多位人才,苹果设计团队自2019年乔尼·艾维离职后持续出现人才流失。

https://mp.weixin.qq.com/s/n_zEawMUfrLZXW7PVm5VmA

五、GPT-5-Thinking新训练方法公开:忏悔训练Confessions

1. OpenAI公开在GPT-5-Thinking上进行的忏悔训练研究,让模型在回答后生成"忏悔报告",如实汇报是否偷工减料或违反指令;

2. 在11/12个测试场景中模型至少有一半概率会在忏悔中承认错误,平均"假阴性"概率仅4.36%,专门训练后忏悔准确性从45%提升至89%;

3. 奖励信号完全隔离,模型在忏悔中承认作弊不影响主任务得分,OpenAI将其定位为监控诊断工具,计划与思维链监控等安全技术配合使用。

https://mp.weixin.qq.com/s/orE5ti175bv7DQ9EOpg3Gg

六、国际残疾人日,瞳行科技公司发布国内首款AI助盲眼镜

1. 杭州瞳行科技公司正式发布国内首款AI助盲眼镜,基于Qwen-VL、OCR等系列模型打造,具有出行避障、找物读物、语音助手和一键求助亲友等功能;

2. 在出行场景可实现300ms超低延时,相当于每迈出一步即可给出道路提示,配备121度超广角双摄像头,针对不同场景对模型进行调优;

3. 眼镜由主体、手机、遥控指环、盲杖四部分组成,大模型出现使算力成本降至过去十分之一,通过基模复用加微调优化快速实现所需功能。

https://mp.weixin.qq.com/s/0EXOLdFO56-GrFdPbFLd8g

前沿科技

七、影石的第一台无人机,360 全景技术,探寻无人机「盲区」

1. 影石旗下品牌影翎正式发售首款产品A1,限时补贴后起售价6799元,仅249g重量全球绝大部分地区无需培训即可畅飞;

2. 标准版套装包含支持8K全景画质拍摄的无人机、内置双1英寸Micro-OLED显示屏的飞行眼镜、"指哪飞哪"的体感遥控器;

3. 采用全景技术实现观看视角与飞行方向完全分离,用户拥有360度无限自由空中视角,"先拍摄后取景"大幅降低飞行和拍摄门槛。

https://mp.weixin.qq.com/s/UwoFVV9DnnTJZPrLzdy1Kw

报告观点

八、a16z合伙人分享一组数据:Sora APP 30天留存率1%

1. a16z合伙人Olivia Moore分享数据显示Sora APP用户留存率从day1的10%降至day7的2%、day30的1%、day60的0%;

2. Sora APP虽5天下载破百万且出道即拿下App Store免费榜第一,但目前排名已降至第22,无法留存用户主要因推荐算法糟糕、功能设计不佳、缺乏原生分享链接等;

3. OpenAI首席研究官Mark Chen表示OpenAI本质仍是纯AI研究公司,短视频产品运营对其是不小挑战,Sora更多被当作创意工具而非社交产品使用。

https://mp.weixin.qq.com/s/lki04OTh397PmR7hG7ALig

九、Wispr Flow 创始人:语音输入的关键是听写,不是转录

1. AI语音输入产品Wispr Flow在5个月内ARR翻10倍,估值超7亿美元,用户一年后留存率高达70%,收入自6月以来环比增长近40%;

2. 创始人Tanay Kothari强调核心区别在于解决"听写"而非"转录"问题,"零编辑率"已达89%,用户从看到生成信息到按发送平均仅半秒;

3. 语音消除思考时认知负荷,让用户专注创作而非同时处理拼写标点格式,统计显示平均72%文本输入通过Wispr Flow完成,键盘使用率降至5%以下。

https://mp.weixin.qq.com/s/kolLsZWftgwiZtik5Uh8Hg

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容