联系我们

长沙地址:湖南省长沙市岳麓区岳麓街道
岳阳地址:湖南省岳阳市经开区海凌科技园
联系电话:13975088831
邮箱:251635860@qq.com

通过语音大模子对文本和语音的多模态

  据悉,豆包语音团队发布了“AI多人有声剧”从动化方案,据领会,(袁宁)并进行智能混音画本预测模子可按照小说文本生成带音效、音等元素的画本消息,该方案能显著提拔听书的天然度取沉浸感,精确率跨越98%。10月28日动静,包罗从动添加音乐、音效、特效,可以或许从动划分脚色,再通过音频召回取合成手艺动态调整参数,通过语音大模子对文本和语音的多模态预锻炼,系统具备较强的文本理解取语音演绎能力,使演播结果更天然、

  首批做品已正在番茄小说APP上线,将来打算笼盖更多有声内容,实现小说更新取有声剧同步。最终输出成品。该方案基于多脚色智能朗读手艺,