AI 每日速递 20251113

64次阅读
没有评论

共计 2523 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、65 岁图灵巨头 LeCun 离职 Meta,投身「世界模型」创业

1. Meta 首席 AI 科学家 LeCun 将在未来几个月离职,与小扎因 AI 战略分歧正式决裂,其领导的 FAIR 实验室逐渐被边缘化;

2. LeCun 坚信大模型无法通往 AGI,AI 终局是 "世界模型",离职后将成立新公司专注推进世界模型研究,目前正在进行早期融资洽谈;

3. Meta 今年进行超 4 次架构调整,将战略重心从 LeCun 领军的 FAIR 转向更快推出模型和 AI 产品,28 岁 Alexandr Wang 领导全新 "超级智能" 团队。

https://mp.weixin.qq.com/s/sgJAu8l-4P31Wzt5dTshrw

二、AI 秒破 18 世纪「天书」账本!谷歌新模型盲测刷屏全网

1. 谷歌 AI Studio 神秘模型成功识别 200 多年前商人 "天书" 账本,字符错误率仅 1.7%,词错误率 6.5%,达到人类专家级准确度;

2. 该模型不仅准确转写,还纠正了原账本书写格式错误,通过反推计算修正了模糊重量表述,展现出抽象推理能力;

3. 测试显示模型在 18 世纪非十进制货币系统、荷英混杂文本等极端场景下表现出色,历史学家认为这标志 AI 跨越真正 "理解" 界限。

https://mp.weixin.qq.com/s/JqHBlGKWbhKVDPglAuwGtw

三、ElevenLabs 发布 Scribe v2 Realtime 实时语音转文本模型

1. AI 语音独角兽 ElevenLabs 发布 Scribe v2 Realtime 模型,实现 150 毫秒超低延迟、93.5% 高准确率,覆盖 90 多种语言;

2. 该模型在 FLEURS 基准测试中针对前 30 种常用语言准确率达 93.5%,能精准识别方言、专业术语,甚至辨别笑声类型;

3. ElevenLabs 成立于 2022 年,目前拥有 7000 万用户,月均生成 3000 万份文档,去年融资 1200 万美元完成 C 轮后估值达 33 亿美元。

https://mp.weixin.qq.com/s/0Z44DWSPn0faugYjw44m1w

四、OpenAI 将推出「Group chats」群聊功能,独立于个人记忆

1. ChatGPT 网页版即将推出群聊功能预览版,用户可生成链接分享,所有成员能查看之前对话记录,支持文件上传、图像生成等功能;

2. 群聊的自定义指令与个人 ChatGPT 设置完全独立,个人记忆功能永远不会在群聊中使用,保护用户隐私;

3. OpenAI CEO 暗示需要原生支持 AI 的生产力套件取代 Slack 等工具,此举被解读为 OpenAI 意图获取企业对话数据以改进模型。

https://mp.weixin.qq.com/s/99C0YfCxG6UtcEOIO7H_OA

五、Lovart 上线分层图像编辑!一键模版自由,设计师的福音

1. LiblibAI 旗下 Lovart 推出 "Edit Elements" 分层图像编辑功能,可将像素位图一键拆分为文字、前景、背景多个图层;

2. 该功能实现从位图产物反推回图层模版,文字按段落格式返回可编辑,支持中英文识别,AI 生成图片也能匹配相似字体;

3. 用户每日登陆可领取 100 积分,分层编辑功能目前活动期免费使用,可结合 AI 编辑模型进行图像替换。

https://mp.weixin.qq.com/s/uQWmlVAM34ZpyEy606qXOw

六、AI 生成乡村歌曲登顶 Billboard 榜首,AI 音乐 PK 创作

1. AI 生成虚拟歌手 "Breaking Rust" 的歌曲《Walk My Walk》登上 Billboard 乡村数字单曲销售榜冠军,月度听众达 180 万;

2. 该 "歌手"Instagram 粉丝超 3 万 评论 粉丝 大量账号具机器人特征,其流量超过多位真人乡村歌手,真人歌手 Ella Langley 因此失去冠军;

3. Billboard 未对 AI 歌曲上榜制定政策规定,过去几个月至少 6 位 AI 或 AI 辅助艺术家出现在榜单,引发关于真人创作竞争力的担忧。

https://mp.weixin.qq.com/s/KwZ4A68UEzoipXiuegR71w

七、极佳视界最新完成一轮亿元级 A1 轮融资,华为参与投资

1. 物理 AI 公司极佳视界完成亿元级 A1 轮融资,由华为哈勃、华控基金联合投资,这是该公司两个月内连续完成的第三轮融资;

2. 极佳视界成立于 2023 年,产品覆盖自动驾驶世界模型、具身基础模型到世界模型平台全栈软硬件,已签约定点合作多家头部主机厂;

3. 核心团队来自清华、中科院等知名院校,发布了国内首个 DriveDreamer 自动驾驶世界模型和支持 16 秒超长时长的视频生成模型 "视界一粟"。

https://mp.weixin.qq.com/s/JePX_1B3Pbz9cs7Jk28gKw

八、TypeScript 是什么?超越 Python 成 GitHub 使用最广语言

1. GitHub《Octoverse 2025》报告显示 TypeScript 以约 4.2 万名贡献者优势首次超越 Python 成为使用最广泛语言;

2. TypeScript 在 2025 年贡献者数量增长超 100 万(同比增长 66%),主要驱动力来自默认使用 TypeScript 的开发框架和 AI 辅助开发;

3. Python 在 AI 和数据科学领域仍保持主导地位拥有 260 万贡献者(同比增长 48%),Jupyter Notebook 依旧是 AI 领域首选探索性环境。

https://mp.weixin.qq.com/s/JoiWmZbqPSp0ES1Nv6u6HQ

报告观点

九、Gamma:全面开放 API,并发布首个 AI PPT 提示词指南

1. AI 演示工具 Gamma 以 21 亿美元估值完成 6800 万美元 B 轮融资,50 人团队实现年经常性收入 1 亿美元,人均创造 ARR 高达 200 万美元;

2. 公司全面开放 API 并发布 100 个场景化提示词指南,覆盖营销、销售、教育等垂直领域,月均生成 3000 万份 "Gamma 文档";

3. Gamma 目前已积累 7000 万用户,其中付费用户超 60 万,自 2023 年起持续盈利且去年融资 1200 万美元至今分文未动。

https://mp.weixin.qq.com/s/E-OlM0oHpYaGmH0kxMMVDg

正文完
 0
评论(没有评论)