Vits

2024-11-13sherpa-onnx：跨平台、多语言的语音处理工具包
Sherpa-onnx是一个基于ONNX运行时的开源语音处理库，支持多种语音相关任务，包括语音识别、语音合成、说话人识别、语言识别等。它不仅支持多种编程语言（如C++、C、Python、JavaScript、Java、C#等），还支持多种操作系统和硬件平台（如Windows、macOS、Linux、Android、iOS等）。sherpa
2024-09-30VITS-Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
论文原文：具有对抗性学习的条件变分自动编码器用于端到端文本到语音的转换github：论文源码摘要最近提出了几种支持单阶段训练和并行采样的端到端文本转语音(TTS)模型，但它们的样本质量与两阶段TTS系统不匹配。在这项工作中，我们提出了一种并行端到端TTS方法，该方法可生成比当
2024-06-22CVPR2023论文速览Transformer
Paper1TrojViT:TrojanInsertioninVisionTransformers摘要原文:VisionTransformers(ViTs)havedemonstratedthestate-of-the-artperformanceinvariousvision-relatedtasks.ThesuccessofViTsmotivatesadversariestoperformbackdoorattacksonVi
2024-06-08vits-simple-api搭建
根据vits-simple-api中文文档指南自行搭建后端以下步骤均在windows平台cpu推理搭建为例选择你的vits模型(注意是vits!不是So-VitsBertVits2GptVits)建议去抱脸网搜索或者b站搜素以及自己训练.在vits-simple-api的路径的model目录下新建你下载模型的名字的文件夹将
2024-06-07vits-simple-api搭建与使用
根据vits-simple-api中文文档指南自行搭建后端以下步骤均在windows平台cpu推理搭建为例选择你的vits模型(注意是vits!不是So-VitsBertVits2GptVits)建议去抱脸网搜索或者b站搜素以及自己训练.在vits-simple-api的路径的model目录下新建你下载模型的名字的文件夹将
2024-05-12操作系统基础设施
打开未打开：搜索fsearchfzf已打开：导航传统堆栈，前进后退标签页管理保存截图/剪贴板跨应用/跨系统文转声/声转文edge的大声朗读在linux不适用whisper实时字幕翻译/提取文字/素材逐字(音节)分段so-vits朗读故障恢复刷新快照(ai)处理文生图、图生图图生视频插
2024-04-07基于So-VITS-SVC4.1声音克隆几种不同的推理方法
之前一直没时间整理，现在抽了点时间整理一下这个声音克隆的几种非webui的启动方式。文章目录命令行方式API调用方式命令行方式这里需要在inference_main.py中将参数都修改成在页面点击操作时候对应的即可。defmain():importargparseparser=argpars
2024-02-08Python进行AI声音克隆的端到端指南
人工智能语音克隆是一种捕捉声音的独特特征，然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音，还可以创造全新的声音。它是一种彻底改变内容创作的工具，从个性化歌曲到自定义画外音，开辟了一个超越语言和文化障碍的创意世界。本文的将提供利用AI语音克隆技术-通过训练
2024-02-06So-VITS-SVC 课程笔记
课程地址，https://www.bilibili.com/video/BV1uj411v7zW/?spm_id_from=pageDriver&vd_source=1eb6e5015a1f70daa97080d8ee786d5d So-VITS-SVC：SoftVCVITSSingingVoiceConversionSoftVC，编码技术，用soft聚类来消除说话人的音色特征VITS，核心技术SingingVoiceConversion，
2024-02-02VITS课程学习笔记
课程地址，https://www.bilibili.com/video/BV1wV411j7zG/?spm_id_from=333.788&vd_source=1eb6e5015a1f70daa97080d8ee786d5d VITS，VariationalInferencewithadversariallearningforend-to-endText-to-Speech论文，VITS:ConditionalVariationalAutoencoderwithAd
2024-01-22SO-VITS-SVC使用
https://zhuanlan.zhihu.com/p/630115251?utm_id=0https://www.bilibili.com/read/cv22206231/ python版本，3.10开个python虚拟环境python-mvenv升级pip，否则会报错用pipinstall-rrequirements.txt按照依赖打开webUI，pythonwebUI.py下载孙燕姿的模型，模型文件，.pt配