2026年5月22日,网易有道宣布将“子曰”大模型4.0的核心双引擎——多模态模型与语音合成(TTS)模型面向全球全量开源,开发者可免费下载、部署并进行二次开发。
此次开源的“子曰4”多模态模型为27B参数规模,聚焦教育场景,支持视觉输入的数理能力达行业顶尖水平,处理纯文本中文数理难题准确率为81.4%。该模型采用精细化思维链重构方案,将思维链输出长度压缩43.2%,可减少Token输出、缩短推理路径、提升答题速度,进而降低推理成本,且针对国内学生真实学习场景做了深度优化。
开源的语音合成模型支持跨语种音色情感迁移克隆,上传一段中文音频即可克隆说话人音色,流利输出14种语言且无中式口音,同时可精准迁移情感;完成零样本原声复制仅需3秒,克隆任务准确度超97%,克隆音色与原声相似度达85%以上。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END