概览

通过阅读我们的指南与技术文档，您可以更深入地了解REECHO的各项内容

本指南将帮助您开始使用Reecho.ai，我们将一步步地带领您从账号注册开始，到克隆您的第一个声音，再到生成您的第一段语音。我们还将指导您如何给予人工智能更好的音频和文本提示，以提升整体的生成质量，并向您介绍当前我们存在的缺点和局限性。

首先，我们可以先从角色管理开始，您可以在此处创建角色并添加任意音频样本用于语音克隆，并为它们设置名称以及描述等内容。在您添加了角色后，您就可以前往语音生成页面，在此处您将可以使用您创建的角色声音来生成您的第一段语音。

AI模型工作原理

我们的REECHO睿声语音大模型已预先经过海量中文音频的训练，训练的内容涵盖多种类型，但最多的是有声读物与常规对话音频。如果您提供的克隆音频样本以及目标文本是此类内容，则通常会在生成语音时取得较好的效果。我们的模型会尽可能模仿克隆音频样本的语调、语速、情感、停顿、响度、声学环境、呼吸声、口音、发声方式等特征，尽可能理解目标文本的上下文，并综合它们来产生最匹配的语音。

缺点与局限性

当前版本的语音模型(V1.0)已具备与真人无异的语音生成能力，但仍不够完美，您可能会在使用过程中遇到以下问题：

偶发的不稳定结果：您可能会偶尔遇到一些质量较差的生成结果。您可以通过少量降低多样性（不建议低于95）以及启用稳定性过滤并设置为一个适当的数值（不建议低于40）来改善全局稳定性，但会降低产生更丰富表现力的概率。您还可以尝试多次生成同一段文本，以获得更好的生成结果。
英文内容的稳定性或质量可能低于中文：目前版本的模型支持中英双语的克隆与合成，但英文支持仍属于实验性阶段，因此英文内容的克隆与合成表现可能会略低于中文内容。
不太擅长过于浮夸尖锐或过于独特的克隆样本：您在使用过于浮夸尖锐或过于独特的克隆样本时，可能会遇到音质/相似度/稳定性下降的问题；您可以尝试通过多次生成单句，并将您最满意的一句生成结果作为样本进行克隆来改善此问题。

我们即将到来的下一版本的语音大模型(V1.1)已针对以上问题进行专项优化，预计将大幅改善这些问题，敬请期待。

加入我们的社区

下一页快速开始

最后更新于20天前