AI 每日速递 20251127

生成式AI

一、ChatGPT "语音模式"(Voice Mode)全面整合至主聊天界面

1. OpenAI正式宣布将原独立的"语音模式"全面整合至主聊天界面,实现语音与文本交互深度融合,用户无需切换模式即可同步获取语音应答、视觉呈现与文字转录服务;

2. 新版本在用户查询时既能提供自然流畅的语音回应,又能实时生成对应的地图、图表、图片等视觉内容,同时自动完成语音转文字转录;

3. OpenAI特别保留个性化选择空间,在设置菜单中增设模式切换开关,偏好沉浸式音频体验的用户可一键恢复旧版独立语音模式。

https://mp.weixin.qq.com/s/xapHjnzT35PLbhOJ5Q_wdw

二、ChatGPT网页端内测一项重要更新:全新的App Directory

1. OpenAI在ChatGPT网页端内测全新App Directory,首次让开发者构建的第三方应用以系统化方式展示,支持用户浏览、搜索和一键添加使用;

2. 新版目录以卡片形式呈现来自不同开发者的AI应用,覆盖购物、生产力、教育、旅行等多个场景,用户可直接在ChatGPT内完成调用实现"即点即用";

3. 基于ChatGPT 4亿周活用户和每分钟60亿tokens处理量,应用目录将显著改变AI应用分发方式,推动ChatGPT从"AI对话工具"向完整"AI应用商店"演进。

https://mp.weixin.qq.com/s/oyHb6O7KXGvNHd_SR42JoA

三、FLUX.2开源!AI生图DeepSeek能否平替谷歌Nano Banana?

1. 德国黑森林实验室发布FLUX.2图像生成模型家族,可同时参考多达10张图片保持字符、产品和风格一致性,支持最高4百万分辨率图像编辑;

2. FLUX.2系列发布3款模型,开源的FLUX.2 [dev]是32B参数量模型,此前Flux.1 [dev]在Hugging Face上受欢迎度仅次于DeepSeek-R1;

3. 模型基于潜在流匹配架构,结合Mistral-3 24B视觉语言模型与整流流式Transformer,实测在超写实图像生成上表现突出但暂不支持中文渲染。

https://mp.weixin.qq.com/s/qnwfFsfTs7uelOIUTqwrVQ

四、Character AI为孩子上线互动"Stories",而不是开放式聊天

1. Character.AI推出全新"故事"功能,未满18岁用户将无法继续使用聊天机器人服务,转而提供更为结构化的引导式互动方式;

2. CEO坦言"对于18岁以下用户来说,开放式聊天可能并非合适的产品",此决策基于对AI聊天机器人可能带来的心理健康风险的担忧;

3. 加利福尼亚州成为美国首个对AI伴侣进行监管的州,联邦层面也有议员提出全国性法案旨在全面禁止未成年人使用AI伴侣。

https://mp.weixin.qq.com/s/2e2uBk5GfilO0Nljgxl2mg

五、TRAE国内版上线SOLO模式,更新多任务并行、Plan模式等

1. TRAE国内版正式上线SOLO模式,带来SOLO Coder、Plan模式、多任务并行、代码变更工具DiffView、上下文压缩等核心能力;

2. SOLO模式定位为"响应感知的编程智能体",支持检索10万个代码文件的超大上下文,通过全新三栏布局实现多任务并行开发;

3. 核心设计理念是"All in One"统一开发过程中所有元素,让开发者专注于指导和监督AI工作,而非实时"配对"AI编程助手。

https://mp.weixin.qq.com/s/_B4-wqcZDLcheJVj1wRL1g

六、腾讯混元3D创作引擎正式推出国际站,模型API同步上线

1. 腾讯混元3D创作引擎正式推出国际站,模型API在腾讯云国际站同步上线面向国际用户开放,社区下载量超300万是全球最受欢迎的3D开源模型;

2. 最新Hunyuan3D 3.0版本首创3D-DiT分级雕刻模型,建模精度较前代提升3倍,支持1536³几何分辨率与36亿体素超高清建模,效果保持业界SOTA;

3. 目前已有超过150家企业通过腾讯云接入,涵盖游戏制作、电商宣传、影视特效、3D打印等领域,传统3D制作周期从数天缩短至分钟级。

https://mp.weixin.qq.com/s/9h5nNiOFcNBhYq6JWU06tA

七、Skywork上线"专业数据"模式,覆盖430家权威机构数据源

1. 天工Skywork全新上线"专业数据"模式,已连接430家权威机构数据源,覆盖政府开放数据、国际组织、学术科研、金融市场、气象环境等多个关键领域;

2. 接入世界银行、IMF、WHO、FDA、Google Scholar、NASA等核心数据源,通过跨源统一回答与聚合实现一次检索整合权威数据;

3. 支持指定特定专业数据库回答确保无幻觉内容生成,所有答案自动附上数据来源信息确保回答可追溯、更透明,提升决策和报告可靠性。

https://mp.weixin.qq.com/s/jQtil9HkMwdxIoMUAyc2KA

报告观点

八、Ilya最新深度访谈:我们正在从Scaling时代,走向研究时代

1. Ilya Sutskever在1个半小时深度访谈中提出"Scaling时代已终结,我们正走向研究时代",认为当前技术路线无法实现AGI;

2. 他指出模型泛化能力是核心瓶颈远逊人类,即便用所有编程竞赛题目训练模型仍无法形成真正"解题直觉",评估分数光鲜但实际性能滞后;

3. Ilya预测5-20年内将出现能像人类一样学习并超越人类的AI系统,强调需要为模型内置类似人类的判断直觉和稳定价值感受器。

https://mp.weixin.qq.com/s/MAr50qlL2-LEWIb7JgIs7Q

九、英伟达:祝贺谷歌自研TPU成功,但我们的GPU领先一代

1. 谷歌开始向Meta等大型机构推介在其数据中心部署TPU方案,Meta计划2027年斥资数十亿美元使用TPU,谷歌云预测此业务可拿下英伟达10%年营收;

2. 英伟达罕见紧急发声回应,强调自己是"唯一能够兼容所有AI模型、覆盖所有计算场景的硬件平台",并积极通过投资拉拢Anthropic、OpenAI等大客户;

3. 黄仁勋在内部会议坦言"英伟达撑着整个地球",业绩好被说助长泡沫、业绩差会被当作泡沫破裂证据,市场预期难以满足。

https://mp.weixin.qq.com/s/fYfMsB8lV2KRW3-X3zwYgg

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容