爱盲论坛

标题: 球推荐一款声音克隆软件 [打印本页]

作者: 指环王    时间: 2024-10-26 13:50
标题: 球推荐一款声音克隆软件
安卓手机上面用的,能用来克隆声音从而生成文本的软件。谁知道比较好用的推荐一下呀。
本帖来自微秘
作者: 千里一醉    时间: 2024-10-27 18:54
这种软件你要求效果特别好的就别想要安卓端的。安卓端手机计算跟不上。效果差一点的豆包好像可以。
本帖来自微秘安卓版
作者: 千里一醉    时间: 2024-10-27 19:03
如果你嫌豆包效果差的话。我这边有一个网站。这是个人搭建的。网站能用多久完全看作者能撑多久。这个网站用的模型是上海交大。开发的f5tts声音克隆工具。当然,它的整体效果是没有CosyVoice 效果好。但是目前手机的话,可以通过这个作者搭建的网站使用f5,虽然效果比不上阿里的那个。但是再手机上用的话还是可以的。目前支持中英文。还支持情感语音的生成。支持生成对话音频。目前的问题就是这个模型自己断句断得太差了。你要手动给文本断句。还有一个问题就是。他在朗读长文本的时候。有些字会重复朗读。而且这个模型最大的一个问题。他不能保存你克隆的音色。每一次你要生成音频。都要先上传参考音频。然后再输入。音频里的文本内容。当然参考,文本不输入也行。就是生成出来的,那效果会差一点。目前这是他最大的问题。但是这玩意儿克隆出来的音色还挺像的,要想手机上用的话,可以去试试。但是就像我说的这个网站,估计长不了。因为这玩意儿用的人多了。对作者那边的压力很大的。所以能用多久就看作者能撑多久了?网址放在楼下。自己去试试吧!
本帖来自微秘安卓版
作者: 千里一醉    时间: 2024-10-27 19:05
f5.chatweb.cloud
本帖来自微秘安卓版
作者: 千里一醉    时间: 2024-10-27 19:07
最近我是对这玩意儿比较感兴趣。看了相关的很多视频。这个网站也是在我刷视频的时候看到的。
本帖来自微秘安卓版
作者: 千里一醉    时间: 2024-10-27 19:09
之前在隔壁帮忙社区也有朋友推荐了一个网站。只不过那个效果就不行了。首先他的每一次生成都有字数限制150个字。第二生成出来的音色是非常不理想的。读的太生硬,一点不自然,而且还吃字。
本帖来自微秘安卓版
作者: 指环王    时间: 2024-10-29 14:05
标题: 回复沙发千里一醉
我用其他的软件克隆声音他总是说噪音太强了,让我降低周围其他声音。就是操作不成功。
本帖来自微秘
作者: 千里一醉    时间: 2024-10-29 23:23
标题: 回7楼指环王
参考音频最好上传比较纯一点的,不要有噪音背景啥的,这样的生成效果会好一点,成功几率也会高。
本帖来自微秘安卓版
作者: 千里一醉    时间: 2024-10-29 23:27
而且每一款软件对参考音频要求还不同,这个要仔细看。手机上我还真不知道有多少能克隆声音的,就算有的话效果也比较差。目前我知道最好的就是刚刚我给你发的网站了。因为这个是作者自己搭建的。咱们训练的时候使用他那边的服务器来跑的。虽然咱们是用手机生成的,但是它计算的时候还是用他那边的服务器来算的。所以生成效果会好一点。没事的时候你可以去那个网站看看操作也挺简单的。参考音频最好控制到15秒左右。也是尽量不要有噪声。她在生成的时候有两个参数,你可以选择一个16一个32。个人推荐你选择32那样的话,训练出来的效果会好一点。
本帖来自微秘安卓版
作者: 千里一醉    时间: 2024-10-29 23:28
想玩这个的话,还是用电脑比较好,最近刚配了台电脑,主要就是玩这个声音克隆模型。论坛回复比较麻烦,如果对这个真的感兴趣的话,可以加我QQ号来进行交流。2357813250
本帖来自微秘安卓版




欢迎光临 爱盲论坛 (https://aimang.net/) Powered by Discuz! X3.2