AI 每日速递 20251104

35次阅读
没有评论

共计 2810 个字符,预计需要花费 8 分钟才能阅读完成。

生成式 AI

一、寒武纪基础软件平台 Cambricon NeuWare 的整体进展

1. 寒武纪发布基础软件平台 Cambricon NeuWare,全面兼容 PyTorch 最新版本和 Triton 算子开发语言,支持用户模型和自定义算子快速迁移;

2. 该平台在大模型与搜广推训练推理方面完成大规模技术验证,支持 DeepSeek V3、Qwen 系列等 MoE 类模型训练,实现发布即适配;

3. 平台提供完整的驱动运行时库、编译器、算子库和集群工具,Kernel 调度吞吐达每秒数十万任务,达到业界领先水平。

https://mp.weixin.qq.com/s/GI_yGuwbcfHmVJMTDjqvxw

二、OpenAI 收紧策略,医疗、法律、财务等建议将不再提供

1. OpenAI 更新使用政策,ChatGPT 不再协助提供需要持牌人士才能给出的专业建议,包括医疗、法律和财务等高风险领域;

2. 此次政策收紧主要源于法律风险上升、全球合规压力增大以及 ChatGPT 使用日益商业化,模型越强责任越重;

3. 这不是模型能力下降而是可用范围大幅收缩,AI 的角色正从 "顾问" 回到 "助手",为未来进入关键行业铺设制度护栏。

https://mp.weixin.qq.com/s/BVKkb9T1LYoRNR_rsD3oSw

三、美团开源全模态模型 LongCat-Flash-Omni,APP 上线

1. 美团开源全模态模型 LongCat-Flash-Omni,总参数量 5600 亿激活参数量 270 亿,在全模态基准测试中达到开源 SOTA;

2. 该模型支持 128K tokens 上下文窗口及超 8 分钟音视频交互,采用五阶段渐进式训练策略,预训练使用超 2.5 万亿词元多模态语料库;

3. 美团 LongCat 官方 App 开启公测,支持联网搜索和语音通话,音频通话 10 分钟且响应快速,视频通话功能后续上线。

https://mp.weixin.qq.com/s/6cSAms7LmD5O-GhBWfEBTg

四、文心 AI 漫画 "拍立得" 上线:1 句话 1 张照片生成剧情

1. 百度文心 APP 推出 "魔法漫画" 功能,用户只需一句话或一张照片,两分钟即可生成多图多页、剧情完整的 AI 连载漫画;

2. 功能支持自定义角色形象、九种风格选择(吉卜力、二次元、国风水墨等),每页漫画自动生成文字解说,可一次性生成 6 - 7 页;

3. 支持 "续写" 和 "改编" 功能,用户可基于原剧情延伸或重写新版本,生成的漫画可下载图片或分享到微信朋友圈。

https://mp.weixin.qq.com/s/5IAsRSIrjXkyfQZIWZQHNA

五、Cartesia 推出了全新的 Sonic- 3 语音模型,英伟达参投

1. 美国语音生成创企 Cartesia 完成 1 亿美元融资英伟达参投,同时推出全新语音模型 Sonic-3,创始团队包括 Mamba 作者 Albert Gu 等华人;

2. Sonic- 3 支持 42 种语言和 500 多种音色,模型延迟仅 90 毫秒端到端响应时间在 190 毫秒以内,采用非 Transformer 的 SSM 架构;

3. 该模型支持语音克隆、自定义发音和情绪控制,可通过 API 参数和 SSML 标签精细控制音量、语速和情绪,目前已服务数千家企业。

https://mp.weixin.qq.com/s/GSwdIKcd4lQRpxXyuPntfQ

六、Turbo AI,20 岁辍学生用 AI 记笔记,半年 500 万用户

1. 两位 20 岁大学辍学生创办的 AI 笔记应用 Turbo AI,过去半年用户从 100 万飙至 500 万,年经常性收入达八位数且持续盈利;

2. 产品主打课堂场景,可将录音、课件、PDF、YouTube 视频转化为笔记、闪卡和测验题,整合了 NotebookLM、AI 学习机和遗忘曲线对抗功能;

3. 团队仅 15 人,但客户包括高盛、德勤、麦肯锡等知名企业,7 位全职内容创作者每月贡献上亿次曝光,至今仅融资 75 万美元。

https://mp.weixin.qq.com/s/wGUNucobW6GS2GJcCMVvIQ

七、一周主流 AI 浏览器实测,各有各的亮点,也各有各的坑

1. 主流 AI 浏览器分为渐进派 (Chrome/Edge) 和激进派(ChatGPT Atlas/Perplexity Comet/Dia),后者将 AI 作为浏览器核心并支持智能体模式;

2. ChatGPT Atlas 执行力最强能真正操作网页和自动化任务,Comet 信息聚合全面但执行慢,Dia 速度快但总结缺细节,Edge 免费但 AI 味重;

3. 主要安全威胁是 "间接提示注入攻击",多款产品存在漏洞,黑客可将恶意指令隐藏在网页中误导 AI 执行,目前尚无明确解决方案。

https://mp.weixin.qq.com/s/sTLojYIzfDeSdGdtPUNjsQ

前沿科技

八、Rokid 联手 BOLON 眼镜,眼镜巨头依视路的中国棋局

1. 全球视光巨头依视路旗下 BOLON 眼镜与 Rokid 乐奇联合推出 BZ5000 AI 智能眼镜,整机仅重 38g,集成 1200 万像素摄像头和 6 小时续航;

2. 依视路在中国选择 Rokid 而非复刻 Ray-Ban Meta,看重其自研 YodaOS 系统打通高德导航、支付宝支付等本土化深度服务;

3. Rokid 乐奇眼镜在 Kickstarter 创下 45 天募集 361 万美元的全球智能眼镜品类历史纪录,已获 5000 多名支持者认可。

https://mp.weixin.qq.com/s/HhKKwtpqZgPjMMtF5uyK8A

报告观点

九、李飞飞:大学与非营利机构要让 AI 研究回归公共利益

1. AI 教母李飞飞呼吁大学与非营利机构重新承担推动 AI 作为公共产品的使命,当前 AI 正从 "共享研究事业" 变为 "封闭商业竞赛";

2. 开放科学历史塑造了现代 AI,反向传播算法、ImageNet、PyTorch 等开源工具使创新在全球传播,但 Meta 削减 FAIR 预算、DeepMind 不再公开技术细节;

3. 大学面临市场失灵,Meta 以 1 亿美元签约金争夺顶尖人才,高校在计算能力和数据资源方面严重不足,需建立全球协作网络实践公共利益使命。

https://mp.weixin.qq.com/s/CM64rF_toCDBixGDGfB3xw

十、a16z 直击 "数据护城河":碎片化、高敏感或难获取领域

1. a16z 合伙人指出当基础设施提供商成为最强竞争对手时,初创企业唯一防御路径是构建 "数据围墙花园",真正护城河在于耗时多年无人能复制的数据体系;

2. VLex 和 OpenEvidence 是典型案例,前者整合欧洲最全法律数据库,后者建立高可信医学研究数据库,数据专有性、受监管性和动态精选性构成护城河;

3. 潜在机会包括供应链物流、地方政府记录、前沿科学、文化档案、垂直细分行业流程和气候环境数据等碎片化高敏感或难获取领域。

https://mp.weixin.qq.com/s/iPGB-sP374toxOBiTgupKA

正文完
 0
评论(没有评论)