AI 每日速递 20251030

64次阅读
没有评论

共计 2739 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、英伟达 GTC 深夜爆拉市值,Vera Rubin 芯片首露面

1. 英伟达在 GTC 华盛顿大会上首次展示 Vera Rubin 超级芯片,搭载 88 核 Vera CPU 和两颗 Rubin GPU,预计 2026 年第三或第四季度量产;

2. 黄仁勋发布会后英伟达股价上涨 4.98%,市值增加 2300 多亿美元达到 4.89 万亿美元,成为首家市值 冲刺 5 万亿美元的公司;

3. 大会重点包括量子互连技术 NVQLink、与美国能源部合作建造 7 台新超级计算机、宣布与 Uber 合作部署约 10 万辆自动驾驶汽车等。

https://mp.weixin.qq.com/s/iMoJ2fuVG23PINixFRSO9w

二、Soul AI Lab 开源播客语音合成模型 SoulX-Podcast

1. Soul App AI 团队正式开源播客语音合成模型 SoulX-Podcast,支持中英川粤等多语种方言,能稳定输出超 60 分钟多轮语音对话;

2. 该模型支持零样本克隆的多轮对话能力,可实现跨方言音色克隆,仅用普通话参考语音即可生成带方言特征的自然语音;

3. 模型基于 Qwen3-1.7B 作为基座,采用 LLM + Flow Matching 语音生成范式,在播客场景下语音可懂度与音色相似度均取得最佳结果。

https://mp.weixin.qq.com/s/bbn1c-e9IUI9mr4h9GL3qw

三、Adobe Firefly Image 5 更新,400 万像素、AI 图层编辑

1. Adobe 在 MAX 大会推出 Firefly 图像模型 5,擅长生成照片级逼真细节,可原生生成 4MP 分辨率图像且无需升级;

2. Adobe CC 2026 全家桶正式发布 Windows 版本,包括 Photoshop 2026 27.0、Illustrator 2026 30.0 等多款软件全面更新;

3. 新版本支持仅通过输入提示即可编辑图像,能根据需要进行精确修改同时保持其他像素不变,且具有商业安全性。

https://mp.weixin.qq.com/s/hgg30DE3MFr3dCZSyUi2kA

四、混元推出国内首个交互式 AI 播客,听众可以 "举手" 提问

1. 腾讯混元推出国内首个交互式 AI 播客,用户可在收听过程中随时打断主持人和嘉宾发言,通过语音或打字方式提问;

2. 基于大模型意图识别、长上下文理解和多轮对话能力,系统能结合上下文及背景信息准确给出答案,改变传统播客单向收听模式;

3. 混元 AI 播客现已支持默认模式、深度探索、思辨讨论三种模式,提供 8 种不同音色,支持单人和双人播客形式。

https://mp.weixin.qq.com/s/RKjyNAN-qJoiC5W2rSVnFw

五、PayPal 宣布已与 OpenAI 达成合作,嵌入其数字钱包

1. PayPal 宣布与 OpenAI 签署合作协议,其数字钱包将嵌入 ChatGPT,让用户能直接在聊天机器人中完成购物支付;

2. 从明年起 PayPal 生态的消费者与商户都可接入 ChatGPT,用户可在平台上购买商品,商户商品库存也能上架销售;

3. 受此消息推动 PayPal 盘前一度大涨超 15%,同时公司上调全年业绩预期并宣布成立 27 年来首次发放股息。

https://mp.weixin.qq.com/s/pagG97f9KUYw8zqnLR7m0A

六、Windsurf 等美国公司们,接入 Made in China 大模型

1. 美国 AI 编程产品 Windsurf 被网友发现其神秘新模型来自中国智谱 GLM,Cerebras 也上架 GLM-4.6 推理服务;

2. 多家美国 AI 公司选择部署中国大模型的核心原因是性价比,OpenAI 和 Anthropic 模型虽好但太贵,而中国模型性能够打且价格实惠;

3. Together AI、Vercel 等美国平台 已部署 GLM-4.6 等国产模型,中国大模型的 Made in China 含金量持续上升。

https://mp.weixin.qq.com/s/Ky8YUjD8cjkROmgnE3aWmQ

前沿科技

七、1X Technologies 公司推出的 NEO 家用机器人,开卖

1. 全球首款家务人形机器人 NEO 正式开售,早鸟价 20000 美元或月租 500 美元,2026 年发货,获 OpenAI 投资;

2. NEO 身高 168 厘米重 30 公斤,内置 Redwood AI 系统可自动完成吸尘、洗碗归位、喂宠物等家务,续航 4 小时最大负载 68 公斤;

3. 华尔街日报记者体验发现目前所有动作由远程专家通过 VR 操控,1X 承诺到 2026 年 NEO 将能自主完成家庭中大部分事务。

https://mp.weixin.qq.com/s/Ny1BVhnW7O1c0rD0d6jZNA

八、LeRobot v0.4.0 正式发布,全面提升机器人学习能力

1. Hugging Face 发布 LeRobot v0.4.0,引入可扩展的 Datasets v3.0 支持 OXE 量级超大规模数据集,新增数据集编辑工具;

2. 新版本集成 PI0.5、GR00T N1.5 等前沿 VLA 模型,新增对 LIBERO 与 Meta-World 仿真环境支持,简化多 GPU 训练;

3. 推出全新插件系统简化硬件集成,仅需 pip install 即可连接任意机器人设备,同步上线 Hugging Face 机器人学习课程。

https://mp.weixin.qq.com/s/s19OHTRUXyKN9zs_CpS0ng

报告观点

九、AGI 权威新定义?图灵奖得主提出,GPT- 5 仅达 57%

1. 图灵奖得主 Yoshua Bengio 等提出 AGI 新定义为 "在认知多样性与熟练度上媲美或超越受过良好教育的成年人的 AI";

2. 基于卡特尔 - 霍恩 - 卡罗尔理论构建框架,将通用智能分解为通用知识、读写能力、数学能力等 10 个核心认知领域进行评估;

3. 评估结果显示 GPT- 4 的 AGI 得分仅为 27%,GPT- 5 的得分也只有 57%,表明当前 AI 缺乏许多对类人通用智能至关重要的核心认知能力。

https://mp.weixin.qq.com/s/Yh9TAzLgwao5MxtN9SGuhQ

十、OpenAI 公开路线图,1.4 万亿投资、GPT-6、IPO 进程

1. OpenAI 完成重组转为公共利益公司,非营利董事会 OpenAI 基金会持有 26% 股权价值约 1300 亿美元,微软成为第一大股东持股约 27%;

2. 奥特曼透露公司预计到 2029 年现金消耗将超 1150 亿美元,未来将承担约 1.4 万亿美元财务责任构建 30 吉瓦基础设施,IPO 是最可能方向;

3. 首席科学家帕乔基宣布目标在 2026 年 9 月前实现能实质性加速研究的 AI 科研助手,2028 年 3 月前实现全自动化 AI 研究员。

https://mp.weixin.qq.com/s/3ZXoJBoEsAs_XQuuYiI2FQ

正文完
 0
评论(没有评论)