mirror of
https://github.com/Anjok07/ultimatevocalremovergui.git
synced 2024-11-24 07:20:10 +01:00
7.5 KiB
7.5 KiB
Ultimate Vocal Remover GUI v5.4.0
English | 简体中文
关于
本程序使用了最先进的音源分离模型,以去除音频文件中的人声。UVR 的核心开发人员训练了这个软件包中提供的所有模型(除了 Demucs 的辅助模型)。
安装
Windows 安装
该安装包包含 UVR 接口、Python、PyTorch 和其他有效运行应用程序所需的依赖项。不需要任何先决条件,即装即用。
-
请注意:
- 该安装程序适用于 Windows 10 或更高版本。
- 不保证在 Windows 7 或更低版本时的应用功能。
- 不保证英特尔奔腾和赛扬 CPU 的应用功能。
-
通过以下链接下载UVR安装程序:
-
为已经安装了 UVR 的用户更新软件包的说明:
- 从 UVR v5.4 更新 - 更新包
-
可选项
- 额外的模型和程序补丁可以通过程序内的 "Settings" 菜单下载。
-
请注意: 最新发布版本请见“最新发布”页面 Releases
其他平台
本程序可以在Mac和Linux上手动安装并运行(更多信息请参见下面的手动开发者安装部分)。有些功能在非Windows平台上可能无法使用。
应用手册
一般选项
VR 架构选项
MDX-Net 选项
Demucs v3 选项
合奏选项
手动合奏
其他应用说明
- 建议使用至少有 8GB 显存的 nVidia GPU。
- 该应用程序只兼容 64 位平台。
- 该应用程序依赖于 Sox - Sound Exchange 的降噪。
- 该应用程序依赖于 FFmpeg 来处理非 wav 格式的音频文件。
- 应用程序将在关闭时自动记住你的设置。
- 转换时间将在很大程度上取决于你的硬件。
- 程序所采用的模型是计算密集型的,请谨慎行事,并在程序运行时时刻关注你的电脑,确保它不会过热。我们不对任何硬件损坏负责。
更新日志
- v4 对比 v5
- v5 模型的表现明显优于 v4 模型。
- 音频提取的力度 (Agreesiveness) 可以通过 "Aggression Setting." 来调整。默认值为10,对大多数音频来说是最佳的。
- 所有 V2 和 V4 模型已被移除。
- 增加了“混合模式” -- 这使用户能够从每个模型中得到最为稳健的结果。
- “模型堆叠”选项已被完全移除,以新的“力度选项”以及模型混合模式取代之。
- 现在NFFT、HOP_SIZE 和 SR 等值已均能在程序内设置。
- 添加了 MDX-NET 人工智能引擎和模型。
- 这是 UVR GUI 的新增的功能。
- Package内包括了4个 MDX-Net 模型。
- 内嵌的 MDX-Net 模型是由 UVR 的核心开发人员训练的。
- 该神经网络无需大量计算资源,但其无比强大。
- MDX-Net 是一个 Hybrid Waveform/Spectrogram network (混合型波形/频谱网络)。
- 加入了 Demucs v3 人工智能引擎和模型。
- 可以通过 Demucs v3 分离音乐的四个器乐部分了。
故障排除
常见问题
- 若没有正确安装并配置 FFmpeg,并试图转换一个非 WAV 文件,本程序将抛出一个错误。
- 内存分配错误通常可以通过降低 "Chunk Size" (分块大小)来解决。
问题报告
在发布新 Issue 时,请尽可能详细描述。
如果可以的话,请点击 "Start Processing" 按钮左边的 "Settings Button",再点击 "Error Log" 按钮,以获得可提供给我们的详细错误信息。
手动安装(针对开发者)
这些说明只适用于手动安装UVR v5.2.0 的人。
- 下载并安装Python 3.9或更低版本(但不低于3.6)Python
- 注意: 确保 "Add Python to PATH" 选框被选中
- 下载源代码 Github
- 通过应用程序内的 "Settings" 菜单下载模型。
- 提取 ultimatevocalremovergui-master.zip 中的 ultimatevocalremovergui-master 文件夹至任意位置。
- 下载 SoX 文件 SoX 并将其内容提取至 ultimatevocalremovergui-master/lib_v5/sox 目录。
- 从ultimatevocalremovergui-master目录打开命令提示符,分别运行以下命令
pip install --no-cache-dir -r requirements.txt
pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html
从这里你应该能够打开并运行 UVR.py 文件
-
FFmpeg
- 必须预先安装并配置好FFmpeg ,以便本程序能够处理非 .wav 文件的轨道。请查阅相关资料,并在你所使用的操作系统上配置好该工具库。
许可证
Ultimate Vocal Remover GUI 的代码采用 MIT-licensed.
- 请注意: 所有希望使用我们的模型的第三方应用程序开发人员,请尊重 MIT 许可,向 UVR 及其开发人员致谢。
致谢
- DilanBoskan - 在该项目伊始时为UVR做出了至关的重要贡献。
- Bas Curtiz - 设计了 UVR 的官方标志、图标、横幅和启动画面。
- tsurumeso - 开发了原始的 VR 架构代码。
- Kuielab & Woosung Choi - 开发了原始的 MDX-Net AI 代码。
- Adefossez & Demucs - 开发了原始的 Demucs AI 代码。
- Hv - 帮助实现了MDX-Net AI代码中的大量内容
向本项目贡献
- 对 Ultimate Vocal Remover GUI 的持续开发感兴趣的任何人,请向我们发送 PR,我们将对其进行审核。
- 这个项目是100%开源的,任何人都可以按照自己的意愿免费使用和修改。
- 我们只对 Ultimate Vocal Remover GUI 和为其提供的模型进行维护开发和支持。
参考文献
- [1] Takahashi et al., "Multi-scale Multi-band DenseNets for Audio Source Separation(用于音源分离的多尺度多波段密集网络)", https://arxiv.org/pdf/1706.09588.pdf