ultimatevocalremovergui/README_CN.md
2022-07-27 03:25:11 -05:00

157 lines
7.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Ultimate Vocal Remover GUI v5.4.0
<img src="https://raw.githubusercontent.com/Anjok07/ultimatevocalremovergui/master/img/UVR_v54.png?raw=true" />
[![Release](https://img.shields.io/github/release/anjok07/ultimatevocalremovergui.svg)](https://github.com/anjok07/ultimatevocalremovergui/releases/latest)
[![Downloads](https://img.shields.io/github/downloads/anjok07/ultimatevocalremovergui/total.svg)](https://github.com/anjok07/ultimatevocalremovergui/releases)
[English](README.md) | 简体中文
## 关于
本程序使用了最先进的音源分离模型以去除音频文件中的人声。UVR 的核心开发人员训练了这个软件包中提供的所有模型(除了 Demucs 的辅助模型)。
- **核心开发者**
- [Anjok07](https://github.com/anjok07)
- [aufr33](https://github.com/aufr33)
## 安装
### Windows 安装
该安装包包含 UVR 接口、Python、PyTorch 和其他有效运行应用程序所需的依赖项。不需要任何先决条件,即装即用。
- 请注意:
- 该安装程序适用于 Windows 10 或更高版本。
- 不保证在 Windows 7 或更低版本时的应用功能。
- 不保证英特尔奔腾和赛扬 CPU 的应用功能。
- 通过以下链接下载UVR安装程序
- [主程序下载链接](https://uvr.uvr.workers.dev/UVR_v5.4.0_setup.exe)
- [主程序镜像链接](https://www.mediafire.com/file/7ugm0lo8sec7rwr/UVR_v5.4.0_setup.exe)
- 为已经安装了 UVR 的用户更新软件包的说明:
- 从 UVR v5.4 更新 - [更新包](https://github.com/Anjok07/ultimatevocalremovergui/releases/download/v5.4.0/UVR_v5.4_Update_Package.exe)
- **可选项**
- 额外的模型和程序补丁可以通过程序内的 "Settings" 菜单下载。
- **请注意:** 最新发布版本请见“最新发布”页面 [Releases](https://github.com/Anjok07/ultimatevocalremovergui/releases/tag/v5.4.0)
### 其他平台
本程序可以在Mac和Linux上手动安装并运行更多信息请参见下面的**手动开发者安装**部分。有些功能在非Windows平台上可能无法使用。
## 应用手册
**一般选项**
<img src="https://github.com/Anjok07/ultimatevocalremovergui/blob/master/img/gen_opt.png?raw=true" />
**VR 架构选项**
<img src="https://github.com/Anjok07/ultimatevocalremovergui/blob/master/img/vr_opt.png?raw=true" />
**MDX-Net 选项**
<img src="https://github.com/Anjok07/ultimatevocalremovergui/blob/master/img/mdx_opt.png?raw=true" />
**Demucs v3 选项**
<img src="https://github.com/Anjok07/ultimatevocalremovergui/blob/master/img/demucs_opt.png?raw=true" />
**合奏选项**
<img src="https://github.com/Anjok07/ultimatevocalremovergui/blob/master/img/ense_opt.png?raw=true" />
**手动合奏**
<img src="https://github.com/Anjok07/ultimatevocalremovergui/blob/master/img/user_ens_opt.png?raw=true" />
### 其他应用说明
- 建议使用至少有 8GB 显存的 nVidia GPU。
- 该应用程序只兼容 64 位平台。
- 该应用程序依赖于 Sox - Sound Exchange 的降噪。
- 该应用程序依赖于 FFmpeg 来处理非 wav 格式的音频文件。
- 应用程序将在关闭时自动记住你的设置。
- 转换时间将在很大程度上取决于你的硬件。
- 程序所采用的模型是计算密集型的,请谨慎行事,并在程序运行时时刻关注你的电脑,确保它不会过热。***我们不对任何硬件损坏负责。***
## 更新日志
- **v4 对比 v5**
- v5 模型的表现明显优于 v4 模型。
- 音频提取的力度 (Agreesiveness) 可以通过 "Aggression Setting." 来调整。默认值为10对大多数音频来说是最佳的。
- 所有 V2 和 V4 模型已被移除。
- 增加了“混合模式” -- 这使用户能够从每个模型中得到最为稳健的结果。
- “模型堆叠”选项已被完全移除,以新的“力度选项”以及模型混合模式取代之。
- 现在NFFT、HOP_SIZE 和 SR 等值已均能在程序内设置。
- 添加了 MDX-NET 人工智能引擎和模型。
- 这是 UVR GUI 的新增的功能。
- Package内包括了4个 MDX-Net 模型。
- 内嵌的 MDX-Net 模型是由 UVR 的核心开发人员训练的。
- 该神经网络无需大量计算资源,但其无比强大。
- MDX-Net 是一个 Hybrid Waveform/Spectrogram network (混合型波形/频谱网络)。
- 加入了 Demucs v3 人工智能引擎和模型。
- 可以通过 Demucs v3 分离音乐的四个器乐部分了。
## 故障排除
### 常见问题
- 若没有正确安装并配置 FFmpeg并试图转换一个非 WAV 文件,本程序将抛出一个错误。
- 内存分配错误通常可以通过降低 "Chunk Size" (分块大小)来解决。
### 问题报告
在发布新 Issue 时,请尽可能详细描述。
如果可以的话,请点击 "Start Processing" 按钮左边的 "Settings Button",再点击 "Error Log" 按钮,以获得可提供给我们的详细错误信息。
## 手动安装(针对开发者)
这些说明只适用于**手动**安装UVR v5.2.0 的人。
1. 下载并安装Python 3.9或更低版本但不低于3.6[Python](https://www.python.org/downloads/)
- **注意:** 确保 *"Add Python to PATH"* 选框被选中
2. 下载源代码 [Github](https://github.com/Anjok07/ultimatevocalremovergui/archive/refs/heads/master.zip)
3. 通过应用程序内的 "Settings" 菜单下载模型。
4. 提取 ultimatevocalremovergui-master.zip 中的 *ultimatevocalremovergui-master* 文件夹至任意位置。
5. 下载 SoX 文件 [SoX](https://sourceforge.net/projects/sox/files/sox/14.4.2/sox-14.4.2-win32.zip/download) 并将其内容提取至 *ultimatevocalremovergui-master/lib_v5/sox* 目录。
6. 从ultimatevocalremovergui-master目录打开命令提示符分别运行以下命令
```
pip install --no-cache-dir -r requirements.txt
```
```
pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html
```
从这里你应该能够打开并运行 UVR.py 文件
- FFmpeg
- 必须预先安装并配置好FFmpeg ,以便本程序能够处理非 *.wav* 文件的轨道。请查阅相关资料,并在你所使用的操作系统上配置好该工具库。
## 许可证
**Ultimate Vocal Remover GUI** 的代码采用 [MIT-licensed](LICENSE).
- **请注意:** 所有希望使用我们的模型的第三方应用程序开发人员,请尊重 MIT 许可,向 UVR 及其开发人员致谢。
## 致谢
- [DilanBoskan](https://github.com/DilanBoskan) - 在该项目伊始时为UVR做出了至关的重要贡献。
- [Bas Curtiz](https://www.youtube.com/user/bascurtiz) - 设计了 UVR 的官方标志、图标、横幅和启动画面。
- [tsurumeso](https://github.com/tsurumeso) - 开发了原始的 VR 架构代码。
- [Kuielab & Woosung Choi](https://github.com/kuielab) - 开发了原始的 MDX-Net AI 代码。
- [Adefossez & Demucs](https://github.com/facebookresearch/demucs) - 开发了原始的 Demucs AI 代码。
- [Hv](https://github.com/NaJeongMo/Colab-for-MDX_B) - 帮助实现了MDX-Net AI代码中的大量内容
## 向本项目贡献
-**Ultimate Vocal Remover GUI** 的持续开发感兴趣的任何人,请向我们发送 PR我们将对其进行审核。
- 这个项目是100%开源的,任何人都可以按照自己的意愿免费使用和修改。
- 我们只对 **Ultimate Vocal Remover GUI** 和为其提供的模型进行维护开发和支持。
## 参考文献
- [1] Takahashi et al., "Multi-scale Multi-band DenseNets for Audio Source Separation用于音源分离的多尺度多波段密集网络", https://arxiv.org/pdf/1706.09588.pdf