探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

作者：老汪软件技巧
发表时间：2024-11-21 04:02
浏览量：

大家好，我是徐徐。今天我们来探索一个 AI 工具：Fish-Speech。

前言

随着深度学习技术的迅猛发展，越来越多的人工智能应用开始走进了我们的日常生活。特别是在语音识别、合成等领域，模型的性能和部署效率至关重要。Fish-Speech 是一个基于先进的深度学习模型，专门用于语音生成和合成的开源项目。它结合了最新的技术，如 GAN（生成对抗网络）和 VQ-VAE（向量量化变分自编码器），在多种语音生成任务中展现了卓越的表现。

对于开发者和研究人员来说，能够在本地部署这些模型并进行定制化训练和调优，是提升应用效果、加速研发的重要途径。然而，由于深度学习模型通常需要高效的计算资源、复杂的依赖库和框架，在本地部署这些模型并不是一件简单的事。本文将详细介绍如何在 Windows 环境中本地部署 Fish-Speech 模型，帮助开发者轻松完成模型的安装、配置以及启动过程。下面我们就看看如何从 0 在本地搭建这个模型。

安装 Conda

首先我们需要安装 Conda 环境，Conda 是一个开源的包管理器和环境管理工具，旨在帮助开发者管理软件包的安装、依赖关系的解决以及创建隔离的开发环境。它广泛应用于数据科学、机器学习和 Python 开发中，尤其是在需要处理复杂依赖关系和版本兼容性问题时，Conda 提供了一个简便、强大的解决方案。

下载 Conda

下载地址：

填写邮箱之后，会发送邮件到你邮箱，点击之后发送的链接之后，会出现如下界面，我们下载 Windows 版本，建议安装目录放在非 C 盘的其他非空格的英文目录下。

探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_

安装成功过后会出现如下 GUI 的界面

_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

配置环境变量

我们下载安装好程序之后还需要配置相应的环境变量，不然你在命令行里面运行一些 Conda 的命令是无法运行的。我们直接进入环境变量管理面板里面去编辑系统变量中的 Path，如下图所示。

探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_

因为我的conda 是安装在 D 盘的，所以就需要添加如下的环境变量

_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

添加好之后依次确定，环境变量就设置好了。接下来我们需要验证一下环境变量是否配置生效，我们需要在命令行窗口中运行如下代码：

 conda info

不出意外会出现如下界面：

_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

到这里我们的 conda 就安装好了，接下来我们就可以开始本地运行项目了。

clone 项目

git clone https://github.com/fishaudio/fish-speech.git

_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech_探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

安装虚拟环境和依赖

首先进入到项目目录

cd fish-speech

然后依次运行以下命令行

# 创建一个 python 3.10 虚拟环境, 你也可以用 virtualenv
conda create -n fish-speech python=3.10
conda activate fish-speech
# 安装 pytorch
pip3 install torch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 --index-url https://download.pytorch.org/whl/cu121
# 安装 fish-speech
pip3 install -e .
# (开启编译加速) 安装 triton-windows
pip install https://github.com/AnyaCoder/fish-speech/releases/download/v0.1.0/triton_windows-0.1.0-py3-none-any.whl

其中安装 pytorch 和项目里的依赖都会比较耗时，确保梯子稳定可用。

运行项目直接打开项目文件夹，点击 install_env.bat 安装内置环境。双击start.bat打开训练推理 WebUI 管理界面。在这个过程中会去 Hugging Face 仓库下载模型，确保网络通畅，会出现如下进入

探索 AI 语音世界：在 Windows 上搭建 Fish-Speech__探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

不出意外，会出现如下界面，你就可以愉快的玩耍了，训练你想要的声音了。

探索 AI 语音世界：在 Windows 上搭建 Fish-Speech__探索 AI 语音世界：在 Windows 上搭建 Fish-Speech

结语

通过本文的步骤，我们可以在 Windows 环境中顺利搭建模型并进行调试，为后续的开发和优化工作打下坚实的基础，需要注意的是网络问题，有科学上网的工具可以帮你减少很多麻烦，因为有很多资源下载都比较耗时。最后祝你可以成功在本地部署 fish-speech。

参考

上一条查看详情 +详解losetup vs mount

下一条 查看详情 +没有了