AI 每日速递 20251124

53次阅读
没有评论

共计 2750 个字符,预计需要花费 7 分钟才能阅读完成。

生成式 AI

一、Nano Banana Pro 的一张 AI 合影,肉眼难辨,刷爆全网

1. 谷歌 Nano Banana Pro 出世仅 48 小时即在 LMArena 榜单双榜第一,其 AI 生成的硅谷 CEO 合影刷爆全网,逼真到肉眼无法分辨;

2. 该模型基于 Gemini 3 Pro,在文字 - 图像测试中领先第一代 84 分,在图像编辑中高出 41 分,可通过坐标生成特定地点历史事件;

3. 谷歌全栈优势凸显,从 DeepMind 研究人员搭建模型到自研 TPU 训练,再到集成到搜索、YouTube 等应用直接触达用户。

https://mp.weixin.qq.com/s/PrhBNGvIzWJCqxMNP9j39A

二、NotebookLM 震撼上线 "一键生成幻灯片" 功能,这次不一样

1. Google AI 笔记神器 NotebookLM 正式推出 "一键生成幻灯片" 功能,用户只需上传资料即可在几分钟内生成逻辑清晰的演示文稿;

2. 提供详细版和演讲版两种核心模式,支持通过提示语精准控制幻灯片风格、受众和重点,输出多种语言满足跨国汇报需求;

3. 支持在线演示、PDF 下载和链接共享多种管理方式,可广泛应用于学生复习、职场汇报和教师培训等多个场景。

https://mp.weixin.qq.com/s/A2DOsQLxGMtXU9h-rwJWlQ

三、Meta 再推 WorldGen,一句话,「盖」出 50×50 米一座城

1. Meta 发布 WorldGen 系统,通过一段文本提示即可生成 50×50 米可导航、可交互的完整 3D 世界,不同区域以可通行方式连接;

2. 系统基于程序化推理、扩散模型 3D 生成和面向对象场景分解,输出几何一致、视觉丰富且渲染高效的 3D 世界;

3. 与基于 Gaussian Splatting 的 Marble 相比,WorldGen 采用网格输出,原生支持物理模拟、碰撞检测和导航,可无缝接入 Unity 和 Unreal 引擎。

https://mp.weixin.qq.com/s/UBSyyp1jUOC8DbaOkuXoDQ

四、Karpathy 组建大模型「议会」,GPT-5.1 等化身最强智囊团

1. 前 OpenAI 联合创始人 Karpathy 用氛围编程做了新项目 LLM 议会,让 GPT-5.1、Gemini 3 Pro、Claude Sonnet 4.5 和 Grok- 4 组成智囊团;

2. 问题会分发给所有模型,各模型能看到彼此匿名回答并进行审阅排名,最后由 "主席模型" 生成最终回答;

3. 项目已开源但 Karpathy 不 继续 提供 支持,这种多模型集成可能成为一种新型基准测试方式,还有大片未被探索的设计空间。

https://mp.weixin.qq.com/s/QAg3fK57Z4ZumuzG9Bykqw

五、腾讯混元全新视频模型 HunyuanVideo 1.5,「元宝」率先上线

1. 腾讯混元开源 HunyuanVideo 1.5 视频生成模型,参数 8.3B 支持生成 5 -10 秒高清视频,可在 14G 显存消费级显卡上流畅运行;

2. 模型支持中英文文生视频与图生视频,具备强指令遵循能力,可精准实现运镜、流畅运动、写实人物等多种指令;

3. 通过创新 SSTA 稀疏注意力机制和多阶段渐进式训练策略,可原生生成 480p 和 720p 视频,通过超分模型提升至 1080p 电影级画质。

https://mp.weixin.qq.com/s/ck2ZThdaQqbfPmI5MGtKnA

六、华为发布 Flex:ai,能将资源利用率提升 30% 的 AI 容器技术

1. 华为正式发布 Flex:ai AI 容器技术,能将智算资源利用率提升 30%,无生态限制支持英伟达 GPU 和华为昇腾 NPU 等算力卡;

2. 核心能力包括算力资源切分(一卡变 N 卡)、多级智能调度(负载算力精准匹配)和跨节点算力聚合(通算智算融合);

3. 对标英伟达 7 亿美元收购的 Run:ai,在虚拟化和智能调度方面有独特优势,发布后将在魔擎社区开源供产学研共同探索。

https://mp.weixin.qq.com/s/_5a3vha4uY4rcI2o05bUpA

七、Thinking Machines Lab 又融资,刷脸刷出 3500 亿独角兽

1. OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab 要筹集 40-50 亿美元,估值或达 500 亿美元(约 3500 亿人民币);

2. 公司此前已筹集 20 亿美元估值 100 亿美元,目前仅推出微调开源模型的 API 工具 Tinker,几乎是 0 产品状态;

3. Murati 凭借在 OpenAI 担任 CTO 的背景和产品管理经验获资本青睐,新公司聚焦 "企业定制模型" 和 "行业落地" 更务实方向。

https://mp.weixin.qq.com/s/JQRHhG-TPs-6IEBNEXzbqg

前沿科技

八、OpenAI 与众高校:用 AI 协助科学研究,GPT- 5 案例进展

1. OpenAI 与范德堡大学等多所高校及国家实验室合作论文显示,GPT- 5 帮助研究人员综合已知结果、加速艰难计算甚至生成新证明;

2. 生物学案例中 GPT- 5 在几分钟内从未发表图表识别出可能机制,数学领域贡献了关于奇数打破模式的新想法帮助完成证明;

3. 算法与优化案例中 GPT- 5 发现机器人路径规划方法可能失败的新例子,改进了优化中的经典结果,但专家监督仍至关重要。

https://mp.weixin.qq.com/s/pZcScIs4WzLfwK_q8aU8Cw

报告观点

九、6 万亿美元对话?马斯克:钱没意义了,黄教主沉默了 10 秒

1. 马斯克与黄仁勋在美国 - 沙特投资论坛对谈,马斯克直言 AI 发展到一定阶段货币将不再具有实际意义,让黄仁勋沉默 10 秒;

2. 马斯克称人形机器人将成为有史以来规模最大的行业,特斯拉将率先突破,AI 与机器人才能真正实现消除贫困目标;

3. 双方官宣合作,xAI 将与沙特企业 Humain 合作建 500 兆瓦数据中心,英伟达将与 AWS 合作构建目标 1000 兆瓦规模数据中心。

https://mp.weixin.qq.com/s/2kOQxAYVD4sFe5JypXfH9w

、微软 CEO 最新万字访谈:AI 时代,范式正确不代表就能赢

1. 当前 AI 浪潮与 90 年代互联网泡沫不同,不是基础设施过剩而是算力供不应求的产能危机,瓶颈在于电力、涡轮机和增强型外壳供应;

2. 企业 AI 的核心在于构建自己的 "AI 工厂" 和数据层,未来企业护城河将是把隐性知识转化为私有模型权重,这种 "公司主权" 将以 LoRA 权重形式存在;

3. 90 年代微软虽看准互联网方向但押错交互式电视路径被开放网络超越,AI 时代同样值得深思:即使范式正确,具体架构选择和商业模式仍决定成败。

https://mp.weixin.qq.com/s/5OryC_qyTmX__iH308_ODw

正文完
 0
评论(没有评论)