让智能体落地、真干活的最大难题,被讯飞这个平台搞定了

图片[1]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News图片[2]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News🤖头图由AI生成

讯飞星辰智能体平台升级,创建数字人、多模态交互、自动执行全配齐。
作者 |  程茜
编辑 |  漠影
智东西1月26日报道,今日,讯飞星辰智能体平台官宣重大升级,实现了讯飞星辰智能体平台和AIUI开放平台完全打通、升级超拟人交互技术、支持快速定制音色、RPA升级,提供一套全面且完整的多模交互解决方案,让智能体拥有更全面的类人化交互能力、全场景执行能力。
其中最直观的一个例子就是,将为智能体定制声音的时间压缩到了几秒钟。发布会的实际演示中,操作人员在讯飞星辰智能体平台生成了曹操人格的智能体后,通过自然语言描述想要的音色声线、输入试听文本、点击生成,就在几秒内合成4个候选音色。接着选择保存、应用音色后,用户就能与刚刚的曹操人格智能体进行语音聊天。
图片[3]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
这是讯飞星辰智能体平台此次升级的一个缩影,而智能体的未来形态,将从单一工具,升级为兼具感知、交互能力,拥有专属声音、形象与性格人设,还能自主完成操作执行的全能型智能体,驱动这一切进化的核心,正是多模交互技术
当前海内外大厂与科创企业均在智能体平台赛道加速布局、密集发力,但行业仍普遍面临技术落地难、场景适配不深的核心痛点。
讯飞星辰智能体平台此次实现感知、交互、执行三大核心能力的一体化整合,从底层打破智能体落地过程中的技术协同壁垒,直面其场景适配难题,为智能体技术的规模化落地扫清关键障碍。
图片[4]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
简言之,讯飞星辰智能体平台此次升级,核心便是瞄准降低智能体开发门槛、丰富其可落地的能力边界两大核心目标,在扩展服务能力的基础上,还提供了低代码、一键接入、快速接入等快速开发部署工具。
总的来看,当前智能体产业技术成熟度足够支撑场景落地,市场需求旺盛,但落地效率与成本仍是核心瓶颈,而打通场景适配、能力集成、生态协同的全栈能力,将成为智能体产业竞争的核心壁垒。
 
01.
决胜智能体落地
全栈平台需具备三大核心能力

 

智能体迈入大规模落地阶段,其正接棒大模型成为下一个最具潜力的爆发风口。
打通智能体高效落地的关键,既要解决技术落地的场景适配问题,还需要同时满足用户对高效、自然、个性化智能服务的需求,这也是智能体产业竞争的核心壁垒。
这背后,离不开智能体平台的全栈能力支撑。
智能体展现出更多元、自然的交互形态,而唯有具备这类更贴合人类习惯的自然交互能力,才能使其真正融入工作与生活场景,真正实现从工具到协作伙伴的升级。
正因如此,智能体还需构建起自动执行能力,这也是其区别于传统系统的关键特征。这种感知、决策、运动、执行的闭环能力,让智能体具备独立完成端到端复杂任务的能力。
最后当智能体深入千行百业,不同领域对其能力边界的要求也存在显著差异。智能体平台必须支持智能体的角色与能力定制,精准匹配不同领域的专属要求,同时配备完善的音色、形象个性化选择功能。
但从当前行业现状来看,能够同时集成超拟人交互、角色定制、自动执行三大核心能力的智能体平台仍属少数,这背后是技术复杂度高、场景适配成本高、生态协同难度大三重壁垒的叠加制约。
技术平台上的全栈能力并非简单拼接,而是需要感知、决策、执行、交互四大模块无缝协同;在实际应用中,碎片化的需求和技术规模化落地之间的矛盾,会使得平台适配成本居高不下,难以大规模落地;一个完整的智能体平台,需要硬件供应商、算法开发商、数据服务商和场景方协同配合,形成清晰的分工体系。
也正因如此,兼具全栈技术能力的智能体平台打造难度颇高,而这恰恰是当前行业的核心短板。
 
02.
拟人交互、自动执行、定制人设
解锁智能体多维协同潜力

 

讯飞星辰智能体平台就是围绕着上述痛点,打破模态壁垒,实现智能体的多维能力协同。
此次其升级的一大重点是与用户紧密相关的交互层面,让其搭载效果更好的语音交互和运动轨迹能力,这同样是智能体平台的能力基础。
一般而言,语音智能体的应用场景往往是问答、搜索、闲聊等纯对话方式,而想要叠加动作编排、轨迹规划的智能体就需要更为复杂的开发部署工作。针对这一痛点,讯飞星辰智能体平台实现了和讯飞人机交互开发平台AIUI的完全打通
这两大平台结合的意义在于,为开发者降本增效以及拓宽应用场景,一方面能快速打通复杂智能体和语音交互,使得语音交互过程中调用智能体更快,随后让机器人进行动作规划整个过程一气呵成;另一方面开发者可以在自己的应用上开发复杂智能体,然后快速集成、试用。
结合发布会上的演示可以看到,当开发者在两个平台上登录同一账号,就可以在讯飞星辰智能体平台上快速创建智能体并直接发布到AIUI开放平台。与此同时,其就能为AIUI上创建的桌面机器人等产品快速添加绘本生成等智能体。
图片[5]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
桌面机器人搭载了绘本生成智能体,根据《望庐山瀑布》的诗句内容在几秒钟内就生成了图文、声音结合的绘本。
图片[6]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
其次是让数字人从拟人到类人迈出的一大步,讯飞星辰智能体平台上多模态超拟人交互的升级。
为了贴合真实场景的用户交互形式,多模态超拟人交互从两个角度下功夫,增强了一句话声音复刻一张照片构建数字分身能力。
在一句话声音复刻能力方面,其能帮助用户快速构建自己的个人音库,同时支持中英日韩粤等多种语言、方言合成以及绘本、新闻、交谈等多风格场景音色生成;一张照片就可以快速构建数字分身,并且数字分身的口型、表情、动作是大模型自动生成,可以精准匹配用户意图。
图片[7]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
这类多维度协同共生的交互体系,更贴合人与人的自然交流。例如在智慧大厅,数字人前台通过多模态视觉理解,可以实时融合语音、人脸、环境等多模态信息,实现自动感知与主动迎宾,并且还能通过自然手势和类人举止反馈,担任智能导览顾问,并在理解复杂问题的基础上灵活调用数据和知识,引导用户办理相关业务。
图片[8]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
值得一提的是,这样的技术升级已经转化为企业可以量化的核心指标,如让企业降低门槛构建企业的专属数字形象代言人,多语言多方言合成能力进行全球化业务拓展等。
但仅靠形象、声音等外在表现仍然不够,智能体还需要在长期使用过程中,沉淀出稳定且鲜明的性格属性
尤其在长期陪伴、用户高频交互的场景中,以及强内容创作、泛娱乐类的角色扮演应用里,智能体是搭建用户情感联结的核心载体。这就要求其能依据自身不同状态、情绪变化与场景需求,定制适配的音色表达,并生成贴合角色特质的内容输出,让情感互动更具真实感与专属感。
实际演示中,用户在讯飞星辰智能体平台生成了曹操人格的智能体后,就可以通过自然语言描述曹操的声线,然后点击生成、试听文本在几秒内合成4个候选音色。保存、应用音色后,用户就能与刚刚的曹操人格Agent进行语音聊天。
图片[9]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
同一个角色的声音在不同年龄段也有不同,用户只需要调整对应的描述就可以创造青年版的曹操声线。
图片[10]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
逼真的数字人形象、自然的音色、符合人设的生成内容,就能让智能体作为多模交互的“情感与形象载体”。这也使得智能体进一步跳出冰冷的技术工具属性,通过具象化的情感表达、场景化的形象塑造,实现对用户状态的精准感知与主动交互,让人机协作更具温度。
最后是让智能体真正执行、落地,将交互指令转化为实际行动的关键一步。RPA数字员工可以操控不同的应用软件,为智能体带来执行能力,这就相当于智能体执行的“手脚”。
这之中的两大升级对应的智能体当下的高频场景。
目前智能体应用的场景大多为网页自动化,因此讯飞星辰智能体平台升级了智能组件,可以帮助开发者快速配置参数,让企业内部不具备专业编程能力的运营人员也可以快速进行编排;企业内部自动化流程的开发业务,会涉及大量数据处理任务,其完全开源的数据表格功能基于可视化的数据处理方式,将数据处理过程变得透明、可调适。
可以看到在实际操作中,用户输入指令需求,智能组件助手就可以在目标网页进行数据提取,通过打开浏览器的网页、在网页筛选数据、在数据表格中展示待办任务的标题、提交者等。
图片[11]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News
在此之外,讯飞星辰智能体平台还通过多模交互的能力,重构智能体与世界的连接方式,让其实现更高效落地。科大讯飞以讯飞星辰智能体为基础,聚焦中东、东南亚两大市场,覆盖基建招投标、法务与合同等八大智能体应用场景,打造全场景、全链路的出海智能生态。
智能体落地在真实一线已经成为现实。
 
03.
技术沉淀+生态壁垒
讯飞星辰智能体平台加速拓宽能力边界

 

从产业视角来看,这样具备完善能力的智能体平台,除了是技术层面的关键突破,还有望成为重构人机协作模式、拓展智能体服务边界的核心基础设施。
其产业价值体现在两大维度,一方面其可以形成一套可复用的角色定制模板、运动控制算法库、交互决策引擎,从而反哺下一代的大模型训练;另一方面能让智能体低成本、高适配地嵌入垂直场景,降低其使用门槛。
但正如前文所述,想要构建拥有完善能力的智能体平台难度很高,而讯飞星辰智能体平台的升级成果,正是讯飞过往技术积淀与全栈能力的有力印证。
在生态层面,讯飞已经围绕AI构建起多个生态平台。
其中讯飞开放平台的生态规模尤为亮眼。截至2025年12月31日,该平台已汇聚超1026.5万开发者团队,开放920项AI产品及能力,平台总应用数突破387.3万,累计覆盖终端设备数更是超42.8亿台。
更为垂直的开发平台方面,讯飞星辰智能体平台已经落地高校、金融、医疗、车载等众多行业,打通了模型选择、Agent开发、效果测评与多渠道发布全流程,此次重磅升级也证明,其已经将“让每个人都能创造自己的智能体”成为现实。
而在更细分的赛道布局上,其AI虚拟人交互平台已经构建了超10万数字分身与500万个人音库; 交互方面的AIUI开放平台,科大讯飞的数据显示,目前这一平台日均交互量突破3亿次,连接开发者超过28万,赋能终端设备达24亿台。
与此同时,科大讯飞在国内大模型政企商业化落地赛道,也形成了技术、场景、交付层面的领先优势,根据智能超参数今年1月初发布的《中国大模型中标项目监测与洞察报告 (2025)  》,2025年科大讯飞中标项目数量达210个,中标总金额23.15亿元,中标项目数量和金额均位列第一。
这些多维度、全场景的生态平台布局,是讯飞星辰智能体平台此次重磅升级、构筑起全栈技术能力的核心基石。
在软硬件产品层面,科大讯飞已经构筑起数个原生AI应用以及硬件产品矩阵
例如讯飞绘文、讯飞智文、讯飞智作均围绕着内容创作者的全方位需求,为其提供一站式解决方案。截至2025年底,讯飞绘文累计生成文章超3334万篇、创意图片超1166万张,讯飞智文累计创作2.35亿页PPT、生成1.01亿张PPT配图,讯飞智作已汇聚超500万AI创作者,提供300多个公共形象与1000多个发音人资源。
正是这种技术、生态、产品的全方位积淀,让科大讯飞得以突破行业壁垒,打造出能力完备的讯飞星辰智能体平台,为智能体行业的发展提供了可参考的实践路径,让每个人都能创造可落地、个性化的智能体成为现实。
当下正处于智能体规模化应用的关键窗口期,科大讯飞正通过实现底层技术、平台工具、行业方案、全球市场的全链路布局,推动智能体解决方案在不同区域的落地生根。
 
04.
结语:全栈智能体平台
正打破场景适配痛点

 

从行业视角来看,具备自然交互、定制角色、自动执行核心能力的智能体平台,正成为破解各垂直领域痛点的关键。
当下制造、医疗、消费、金融、车载等各行业的智能升级需求愈发迫切,却普遍面临通用技术与场景化需求适配不深、定制开发成本高、落地效率低等行业共性问题,而讯飞星辰智能体平台的此次重磅升级,正精准切中这些行业核心诉求。
随着智能体迈向规模化落地,或许相应平台所积淀形成的可复用技术框架、标准化开发流程与生态协同模式,还能进一步降低各行业智能化转型的技术门槛、开发成本与落地周期,进一步推动智能体技术在千行百业的规模化落地与深度应用。
图片
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

图片[13]-让智能体落地、真干活的最大难题,被讯飞这个平台搞定了-AI Express News

<原文链接:https://mp.weixin.qq.com/s/mdXBi4YjGrcMxrpOZVWCnQ

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容