科大讯飞发布星火X1.5大模型,多款“AI员工”已投入实际应用
2025-11-07 21:11:29
  • 0
  • 0
  • 0

11月6日,第八届世界声博会暨2025科大讯飞全球1024开发者节在安徽合肥举行,本次大会以“更懂你的AI”为主题,科大讯飞董事长刘庆峰及核心团队发布了星火X1.5深度推理大模型,并展示了系列软硬件一体化解决方案及技术应用成果,同时介绍了开发者生态建设进展。

刘庆峰阐述AI发展核心方向及产业应用现状

在大会主旨发言中,科大讯飞董事长刘庆峰提出,AI红利的兑现需要攻克四大核心要素,分别是自主可控、软硬一体、行业纵深和个性化。他表示,当前人工智能产业正处于技术爆发向价值兑现的转折阶段,这一发展路径已在实际应用中取得一定成效。

刘庆峰介绍,讯飞联合头部企业打造的300多个“开箱即用”智能体中,多款“AI员工”已投入实际应用。其中,“星火行业分析师”成为国内首个通过工信部考试认证的行业分析AI应用,在《大数据分析师技术水平考试》中获得92分,成绩超过85%的人类考生。

针对算力问题,刘庆峰提到,讯飞星火是目前国内主流大模型中唯一基于国产算力训练的通用大模型。初期在国产昇腾芯片上训练模型的效率仅为英伟达A800的30%,经过与华为团队联合攻坚,通过底层算法优化与平台适配,训练效率已提升至84%。这一突破对于国产算力的成熟与应用具有重要意义,也为中国大模型人工智能国家战略提供了支撑。

在AI出海方面,刘庆峰表示,讯飞大模型已支持130种语言,其中10个主要语种的处理效果达到国际主流模型的95%,可为拉美、东盟等地区提供自主可控的AI技术选择,中国开发者使用讯飞星火出海可避免“卡脖子”问题。

星火X1.5大模型发布,技术参数与性能指标明确

本次发布会的核心内容之一是讯飞星火X1.5深度推理大模型的正式发布,该模型已开放给开发者下载体验。其采用混合专家(MoE)架构,总参数量为2930亿,激活参数300亿,推理效率较上一代产品有所提升。

在核心能力方面,该模型在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大维度对标国际主流模型,其中数学能力在多次测评中表现突出。多语言支持能力覆盖超过130个语种,在拉美、东盟等14个重点语言的处理效果上具有优势。

技术突破方面,星火X1.5在全国产算力平台上实现两项关键进展:一是长思维链强化学习训练效率从30%提升至84%以上;二是攻克MoE模型全链路训练效率难题,端到端性能达到国际竞品效率的93%以上。此外,科大讯飞还首发了非自回归语音大模型架构,通过并行一次性输出整个文本序列的设计,处理效果相对提升16%,推理成本下降520%。

模型参数设定上,科大讯飞采用了兼顾性能与部署成本的方案,用户只需购买一台标准的国产生成服务器,即可在医院、学校、政府机构、央企单位等场景部署该模型。

为实现“更懂你的AI”目标,星火X1.5在个性化技术和多模态交互方面进行了升级,发布会上展示了两项核心功能。

个性化记忆体系通过构建用户专属记忆库,综合分析用户长期行为模式、近期反馈数据及短期对话内容,形成用户画像,为用户提供定制化服务。该功能可实现10轮以上的对话记忆能力,能总结用户喜好并记录关键事件转化为长时记忆。

百变声音复刻技术基于星火语音大模型,仅需1秒钟的原始音频样本,即可实现任意音色的复刻,并支持跨语言、跨风格的语音合成,用户可通过一条指令实现声音风格转换。

此外,发布会还展示了多模态交互的八项技术能力,包括麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义等。现场通过数字人导览“小飞”演示了这些能力的应用,其可实现多人多语种对话、个性化推荐及购票、订酒店等任务办理。

全场景软硬件一体化方案,覆盖多行业应用

发布会上,科大讯飞展示了融合AI技术与麦克风阵列、扬声器阵列、摄像头阵列、视觉呈现等的软硬件一体解决方案,产品覆盖办公、教育、医疗、汽车等多个领域。

办公场景硬件

讯飞智能办公本X5:采用首创的上4下4环八麦克风阵列,高噪环境下识别准确率达95.08%,可自动识别声纹生成会议纪要,并能学习用户历史文件。

讯飞AI翻译耳机:首创单耳三麦多感融合降噪系统,复杂噪声下识别准确率达97.1%。

讯飞双屏翻译机2.0:独创强降噪模式,在90dB噪音环境下识别率达98.69%,支持双面可视和多语言实时显示。

讯飞同传麦克风:业界首个软硬一体产品,可实现自动翻译免切换,同传播报首响延迟低于2秒,支持私有化部署。

讯飞星火AIPC:采用全栈国产软硬一体方案,提供文书处理、智能会议记录、政策问答等服务,可节省70%的文书审校时间和60%的会议记录整理时间。

教育场景硬件

讯飞AI黑板:搭载全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,具备130度超宽域显示效果。

讯飞AI学习机:集成微纳米类纸屏等多项护眼技术,获得国内外10余项权威护眼认证,硬件实现100%国产化。依托星火大模型构建了3大类、3层级、4000+标签的错因体系,通过智能批阅机和教师助手,实现从作业批改到课堂教学的“小时级闭环”。

医疗场景应用

科大讯飞正式发布“智医助理医院版1.0”,提供辅助诊疗、病历生成等核心功能。基于覆盖超7.7万家基层医疗机构的“智医助理”数据,人机协同可将诊断合理率从87%提升至96%,病历书写时间减半。个人AI健康助手“讯飞晓医”支持99%医学报告解析,累计完成1.6亿次AI健康咨询。

汽车场景技术

星火智慧座舱2.0融合13个摄像头,通过54维2808个记忆锚点记录用户偏好,并提供5项体征实时监测。其搭载的iFLYSOUND音响方案已在19家车企量产落地,出货量超100万台。

AIUI平台升级,开发者生态持续扩大

面向开发者群体,科大讯飞正式发布并全面开源了首个原生支持机器人流程自动化(RPA)的智能体开发平台“Astron”,该平台将Agent(大脑)与RPA(手脚)相结合,降低了AI应用开发门槛。

同期,讯飞AIUI人机交互平台升级至大模型极速超拟人交互阶段,支持超多轮连续对话、AI人格、共情交互、长时记忆、驱动数字人等能力,可接入三方智能体、开源及私有大模型,全链路响应耗时优化至1.6秒。该平台具备情感贯穿能力,能通过语气、语调预判用户情绪,搭配超拟人合成技术提升交互体验,并构建了类人记忆系统。

在角色定制方面,平台提供95种音色库,用户可自定义角色人设、音色与回复风格,结合声音复刻技术打造品牌专属AI IP形象。同时集成问答库、智能体工作流、外部工具接入等核心能力,支持设备指令控制、知识精准问答与多任务串联。

开发者生态建设方面,截至目前,科大讯飞开放平台开发者数量已突破968万,年内新增200万注册用户,大模型相关开发者增长125%。Astron平台已与多家行业领军企业合作开发300余个智能应用。

此外,2025科大讯飞AI开发者大赛以“大模型深化应用”为核心,聚焦工业制造、医疗健康、教育学习等多个领域,吸引全球3万余支团队参赛,优胜团队展示了智能眼镜、AR头显、智慧交通、四足机器人等领域的创新应用成果。

开发者论道与行业应用探讨

在开发者节期间举办的“开发者论道”专场活动中,来自IT、应急管理、求职招聘、法律等领域的行业专家和开发者,与讯飞开放平台业务负责人共同探讨了大模型实际落地场景及未来挑战。

参赛团队的创新成果显示,AI技术在多领域的应用已逐步落地。南京魔数团信息科技推出的Teamhelper+AI开发平台,通过集成常用应用和标准化SDK封装,减少AR硬件开发时间和成本;上海火离科技研发的工业级AR头戴设备和儿童专属AI终端,分别应用于工业场景赋能一线员工和青少年防近视场景;智丽显示技术深圳团队开发的FSHD场序显示技术,可应用于AR/VR、车载HUD、投影机等场景;香港中文大学纪祥团队打造的四足机器人巡检与孪生操控系统,实现了多地形自主巡检和远程控制。

第八届世界声博会暨2025科大讯飞全球1024开发者节集中展示了科大讯飞在大模型技术、软硬件产品及开发者生态方面的进展。星火X1.5大模型在国产算力适配、性能提升及个性化交互方面的突破,为AI技术的落地应用提供了支撑;全场景软硬件解决方案的推出,推动AI技术进一步融入办公、教育、医疗、汽车等行业;开发者生态的持续扩大,加速了AI创新应用的落地。

刘庆峰提到,超拟人多模态交互将是未来AI进入每个家庭的标配,人工智能技术的发展最终将推动其从技术概念转化为实际应用,赋能千行百业。本次大会的举办,为AI行业提供了技术交流与合作的平台,也展现了中国AI产业在自主可控、场景应用等方面的发展成果。

---------------------

不保证以上内容的准确性和真实性。市场有风险,投资交易需谨慎。所涉标的不做任何推荐,据此投资交易,风险自担。

科记汇,资深财经媒体人创办,财经报道先锋,年阅读观看量数亿。关注研究重大财经动态、企业家精神、商业文明发展历程,报道大型企业、上市公司、创业公司关键发展节点。内容同步数十家网络平台。欢迎提供报道线索和采访机会。


 
最新文章
相关阅读