- 欢迎访问

你的位置:开云(中国)kaiyun体育网址-登录入口 > 资讯 > 开云体育(中国)官方网站两款模子均引入了弘大的“提醒解雇”才智-开云(中国)kaiyun体育网址-登录入口

开云体育(中国)官方网站两款模子均引入了弘大的“提醒解雇”才智-开云(中国)kaiyun体育网址-登录入口

发布日期:2026-03-04 06:20    点击次数:60

资讯

快科技3月2日音书,本日,阿里发布两款语音新模子开云体育(中国)官方网站,基于参考音频的声息克隆模子Fun-CosyVoice3.5、无参考音频的音色瞎想模子Fun-AudioGen-VD。 据先容,两款模子均引入了弘大的“提醒解雇”才智,解放截止声息的厚谊、语速、场景等。 其可用freestyle(解放格调形态)定制扮装,适用于有声书、游戏、客服、播客、教诲、直播等多个场景。 值得恰当的是,两款模子在同尺寸模子的基准评测中斩获多项SOTA。 在Seed-TTS基准测试的中语“贫苦案例”打算中

详情

开云体育(中国)官方网站两款模子均引入了弘大的“提醒解雇”才智-开云(中国)kaiyun体育网址-登录入口

快科技3月2日音书,本日,阿里发布两款语音新模子开云体育(中国)官方网站,基于参考音频的声息克隆模子Fun-CosyVoice3.5、无参考音频的音色瞎想模子Fun-AudioGen-VD。

据先容,两款模子均引入了弘大的“提醒解雇”才智,解放截止声息的厚谊、语速、场景等。

其可用freestyle(解放格调形态)定制扮装,适用于有声书、游戏、客服、播客、教诲、直播等多个场景。

值得恰当的是,两款模子在同尺寸模子的基准评测中斩获多项SOTA。

在Seed-TTS基准测试的中语“贫苦案例”打算中,Fun-CosyVoice3.5进展拉风,词错误率(Word Error Rate,WER)和言语东说念主相通度(Speaker Similarity,SSIM)均为最好。

同期,因为优化了“贫苦案例”的发音,荒僻字句错率由15.2%缩短到5.3%。

其中,Fun-CosyVoice3.5赈济freestyle提醒截止,责罚了传统克隆模子只会效法不成指定扮装的痛点。

Fun-AudioGen-VD专注“从无到有”的音色瞎想。在提醒解雇才智和可控性的Instruct-TTS基准测试中跳跃gemini2.5-pro和gpt-4o-mini-tts。

该模子不仅能左证形色定制音色和厚谊,还能同步模拟复杂的听觉环境,扫尾“东说念主物+场景”的一体化。

在强化学习中,两款模子通过使用DiffRO和GRPO,加多了时长和韵律多通说念的奖励。

此外,Fun-CosyVoice3.5所用的tokenizer帧率减半,提高查考后果,且首包蔓延缩短35%,大幅普及了及时交互体验。

即日起开云体育(中国)官方网站,用户可在阿里云百真金不怕火调用这两款最新模子。

服务热线
官方网站:www.weras.top
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:26751058694
邮箱:86f3a04c@outlook.com
地址:资讯科技园7326号
关注公众号

Powered by 开云(中国)kaiyun体育网址-登录入口 RSS地图 HTML地图

Powered by站群
开云(中国)kaiyun体育网址-登录入口-开云体育(中国)官方网站两款模子均引入了弘大的“提醒解雇”才智-开云(中国)kaiyun体育网址-登录入口

回到顶部