1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
-
Updated
Oct 2, 2024 - Python
1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
SoftVC VITS Singing Voice Conversion
Easily train a good VC model with voice data <= 10 mins!
so-vits-svc fork with realtime support, improved interface and more features.
Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audio, music, and speech generation research and development.
Speech-to-text, text-to-speech, speaker recognition, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, C/C++, Python, Kotlin, C#, Go, NodeJS, Java, Swift, Dart, JavaScript, Flutter, Object Pascal, Lazarus, Rust
AI Vtuber là một cái từ 【ChatterBot/ChatGPT/claude/langchain/chatglm/text-gen-webui/ nghe đạt / ngàn hỏi /kimi/ollama】 điều khiển giả thuyết chủ bá 【Live2D/UE/xuniren】, có thể ở 【Bilibili/ Douyin / nhanh tay / WeChat video hào / Bính Đa Đa / đấu cá /YouTube/twitch/TikTok】 phát sóng trực tiếp trung cùng người xem thật khi hỗ động hoặc trực tiếp ở bản địa tiến hành nói chuyện phiếm. Nó sử dụng TTS kỹ thuật 【edge-tts/VITS/elevenlabs/bark/bert-vits2/ duệ thanh 】 sinh thành trả lời cũng có thể lựa chọn 【so-vits-svc/DDSP-SVC】 biến thanh; mệnh lệnh hợp tác SD vẽ.
Core Engine of Singing Voice Conversion & Singing Voice Clone
A simple, high-quality voice conversion tool focused on ease of use and performance.
Best practice TTS based on BERT and VITS with some Natural Speech Features Of Microsoft; Support ONNX streaming out!
A simple VITS HTTP API, developed by extending Moegoe with additional features.
So-VITS-SVC bản địa bố trí / huấn luyện / trinh thám / sử dụng trợ giúp hồ sơ So-VITS-SVC Local Deployment/Training/Inference/Usage Help Document
singing voice change based on whisper, and lora for singing voice clone
liujing04/Retrieval-based-Voice-Conversion-WebUI reconstruction project
SummerTTS là một cái căn cứ vào C++ độc lập biên dịch tiếng Trung cùng tiếng Anh giọng nói hợp thành hạng mục, có thể bản địa vận hành không cần internet, hơn nữa không có thêm vào ỷ lại, một kiện biên dịch hoàn thành có thể dùng cho tiếng Trung cùng tiếng Anh giọng nói hợp thành. SummerTTS is a standalone Chinese and English speech synthesis(TTS) project that has almost no dependency and could be easily used for Chinese TTS with just one key build out
Add a description, image, and links to the vits topic page so that developers can more easily learn about it.
To associate your repository with the vits topic, visit your repo's landing page and select "manage topics."