Links
Comment on page

概览

通过阅读我们的指南与技术文档,您可以更深入地了解REECHO的各项内容
本指南将帮助您开始使用REECHO.ai,我们将一步步地带领您从账号注册开始,到克隆您的第一个声音,再到生成您的第一段语音。我们还将指导您如何给予人工智能更好的音频和文本提示,以提升整体的生成质量,并向您介绍当前我们存在的缺点和局限性。
首先,我们可以先从角色管理开始,您可以在此处添加任意音频样本用于语音克隆,并为它们设置名称以及描述等内容。在您添加了角色后,您就可以前往语音生成页面,在此处您将可以使用您创建的角色声音来生成您的第一段语音。

AI模型工作原理

我们的REECHO睿声语音大模型已预先经过海量中文音频的训练,训练的内容涵盖多种类型,但最多的是有声读物常规对话音频。如果您提供的克隆音频样本以及目标文本是此类内容,则通常会在生成语音时取得较好的效果。我们的模型会尽可能模仿克隆音频样本的语调、语速、情感、停顿、响度、声学环境、呼吸声、口音、发声方式等特征,尽可能理解目标文本的上下文,并综合它们来产生最匹配的语音。

缺点与局限性

当前版本的语音模型(V0.9)仍然处于早期测试阶段,存在较多已知问题,您可能会在使用过程中遇到以下问题:
  • 稳定性较差:目前版本的生成稳定性相对较差,您可能经常会遇到一些不可预测乃至不可用的生成结果。您可以通过少量降低随机性(不建议低于95)以及启用稳定性增强并设置为一个适当的数值(不建议低于20)来改善全局稳定性,但会降低产生更丰富表现力的概率。您还可以尝试多次生成同一段文本,以获得更好的生成结果。
  • 仅支持纯中文内容:目前我们的训练内容绝大部分以中文为主,这导致模型完全无法理解或合成中文以外的语音,包括任何英文字母。目前,如果您的克隆样本或生成文本中包含任何外语内容,则较大可能会导致生成失败、相关内容没有声音、或显著的质量下降。
  • 不太擅长较为浮夸尖锐或表现力较强的克隆样本:目前我们的训练内容中,对较为浮夸或尖锐的音色数据涵盖较少,例如许多二次元或动漫音色;对于此类音色的克隆,您可能会遇到生成质量的显著降低。同时,对于情感表现力波动较大的音频样本,也可能表现出较为不稳定的生成结果。我们目前推荐您尽可能使用自然的音频样本以取得最佳效果
我们下一版本的语音模型(V1.0)已针对以上问题进行专项优化,预计将大幅改善这些问题,提供高质量的生成结果,并同时支持中英双语。新版本模型预计将于2023年12月上线,敬请期待。

加入我们的社区

最近更新 1mo ago