1
0
mirror of synced 2025-01-24 07:14:09 +01:00
2023-08-27 22:13:47 +09:00
..
2023-08-27 22:04:13 +09:00
2023-08-27 22:04:13 +09:00
2023-08-27 22:04:13 +09:00
2023-08-27 22:13:47 +09:00
2023-08-27 22:04:13 +09:00

Retrieval-based-Voice-Conversion-WebUI

Retrieval Tabanlı Ses Dönüşümü Web Arayüzü

Kolay kullanılabilen VITS tabanlı bir Ses Dönüşümü çerçevesi.

madewithlove


Open In Colab Licence Huggingface

Discord


Değişiklik Kaydı | SSS (Sıkça Sorulan Sorular)

English | 中文简体 | 日本語 | 한국어 (韓國語) | Türkçe

Demo Videosu için buraya bakın!

RVC kullanarak Gerçek Zamanlı Ses Dönüşümü Yazılımı: w-okada/voice-changer

RVC kullanan çevrimiçi bir demo: Vocal'i Akustik Gitar sesine dönüştüren demo: https://huggingface.co/spaces/lj1995/vocal2guitar

Vocal2Guitar demo videosu: https://www.bilibili.com/video/BV19W4y1D7tT/

Ön eğitim modeli için neredeyse 50 saatlik yüksek kaliteli VCTK açık kaynaklı veri kümesi kullanılmıştır.

Lisanslı yüksek kaliteli şarkı veri kümesi, telif hakkı ihlali endişesi olmadan kullanımınız için sırayla eklenecektir.

Özet

Bu depo aşağıdaki özelliklere sahiptir:

  • Top1 geri alım kullanarak kaynak özelliğini eğitim seti özelliğiyle değiştirerek ses tonu sızmasını azaltma;
  • Kolay ve hızlı eğitim, hatta göreceli olarak zayıf grafik kartlarında bile;
  • Az miktarda veri ile bile (en az 10 dakika düşük gürültülü konuşma tavsiye edilir) oldukça iyi sonuçlar elde etme;
  • Timbrları değiştirmek için model birleştirmeyi destekleme (ckpt işleme sekmesinde ckpt birleştirme kullanma);
  • Kolay kullanımlı Webui arayüzü;
  • UVR5 modelini kullanarak hızlı bir şekilde vokalleri ve enstrümanları ayırma.
  • En güçlü Yüksek Tiz Ses Ayıklama Algoritması InterSpeech2023-RMVPE sessiz ses sorununu önlemek için kullanılması. En iyi sonuçları (önemli ölçüde) sağlar ve Crepe_full'dan daha düşük kaynak tüketimiyle daha hızlıdır.

Ortamı Hazırlama

Aşağıdaki komutlar Python sürümü 3.8 veya daha yüksek olan ortamda çalıştırılmalıdır.

(Windows/Linux) Önce pip aracılığıyla ana bağımlılıkları yükleyin:

# PyTorch ile ilgili temel bağımlılıkları yükleyin, kuruluysa atlayın
# Referans: https://pytorch.org/get-started/locally/
pip install torch torchvision torchaudio

#Windows + Nvidia Ampere Mimarisi(RTX30xx) için, deneyime göre https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/issues/21 adresindeki cuda sürümüne göre pytorch'a karşılık gelen cuda sürümünü belirtmeniz gerekebilir
#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

Sonra poetry kullanarak diğer bağımlılıkları yükleyebilirsiniz:

# Poetry bağımlılık yönetim aracını yükleyin, kuruluysa atlayın
# Referans: https://python-poetry.org/docs/#installation
curl -sSL https://install.python-poetry.org | python3 -

# Proje bağımlılıklarını yükleyin
poetry install

Bunun yerine pip kullanarak da yükleyebilirsiniz:

pip install -r requirements.txt

Mac kullanıcıları bağımlılıkları run.sh üzerinden yükleyebilir:

sh ./run.sh

Diğer Ön-Modellerin Hazırlanması

RVC'n

in çıkarım ve eğitim için diğer ön-modellere ihtiyacı vardır.

Onları Huggingface alanımızdan indirmeniz gerekmektedir.

İşte RVC'nin ihtiyaç duyduğu Diğer Ön-Modellerin ve diğer dosyaların listesi:

hubert_base.pt

./pretrained 

./uvr5_weights

V2 sürümü modelini test etmek istiyorsanız (v2 sürümü modeli girişi 256 boyutlu 9 katmanlı Hubert+final_proj'dan 768 boyutlu 12 katmanlı Hubert'ın özelliğine ve 3 dönem ayrımına değiştirilmiştir), ek özellikleri indirmeniz gerekecektir.

./pretrained_v2

#Eğer Windows kullanıyorsanız, FFmpeg yüklü değilse bu dictionariyaya da ihtiyacınız olabilir, FFmpeg yüklüyse atlayın
ffmpeg.exe

Daha sonra bu komutu kullanarak Webui'yi başlatabilirsiniz:

python infer-web.py

Windows veya macOS kullanıyorsanız, RVC-beta.7z'yi indirip çıkarabilir ve Webui'yi başlatmak için windows'ta go-web.bat veya macOS'te sh ./run.sh kullanarak RVC'yi doğrudan kullanabilirsiniz.

Ayrıca, RVC hakkında bir rehber de bulunmaktadır ve ihtiyacınız varsa buna göz atabilirsiniz.

Teşekkürler

Tüm katkıda bulunanlara teşekkürler