5月9日,全球权威TTS评测榜单Artificial Analysis Speech Arena Leaderboard更新,阶跃语音生成模型StepAudio 2.5 TTS跻身全球前三,成为当前榜单排名最高的中国大模型。
该榜单采用盲测Elo评分机制,由用户在未知模型身份的情况下对同一文本生成的两段语音进行听感判断,测试覆盖客户服务、知识分享、数字助手、娱乐等真实应用场景,这意味着StepAudio 2.5 TTS的领先并非仅参数或指标提升,而是在真实用户听感中展现出更自然、接近真人表达的能力,实际落地竞争力更强。
阶跃近期集中发布StepAudio 2.5系列模型,包括TTS、ASR和Realtime三款,覆盖语音生成、语音识别与实时语音交互全链路。其中Realtime模型聚焦打造有“活人感”的AI聊天搭子,具备顶级副语言能力、千万人设自定义等特点,可提供有温度的实时语音交互体验。
此外,阶跃在AI语音领域已长期深度布局,多款开源模型曾登相关评测榜前列;其语音模型已在吉利银河M9、极氪8X等车型实现规模化商业落地。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END