• 2024-06-22CVPR2023论文速览Transformer
    Paper1TrojViT:TrojanInsertioninVisionTransformers摘要原文:VisionTransformers(ViTs)havedemonstratedthestate-of-the-artperformanceinvariousvision-relatedtasks.ThesuccessofViTsmotivatesadversariestoperformbackdoorattacksonVi
  • 2024-06-08vits-simple-api搭建
    根据vits-simple-api中文文档指南自行搭建后端以下步骤均在windows平台cpu推理搭建为例选择你的vits模型(注意是vits!不是So-VitsBertVits2GptVits)建议去抱脸网搜索或者b站搜素以及自己训练.在vits-simple-api的路径的model目录下新建你下载模型的名字的文件夹将
  • 2024-06-07vits-simple-api搭建与使用
    根据vits-simple-api中文文档指南自行搭建后端以下步骤均在windows平台cpu推理搭建为例选择你的vits模型(注意是vits!不是So-VitsBertVits2GptVits)建议去抱脸网搜索或者b站搜素以及自己训练.在vits-simple-api的路径的model目录下新建你下载模型的名字的文件夹将
  • 2024-05-12操作系统基础设施
    打开未打开:搜索fsearchfzf已打开:导航传统堆栈,前进后退标签页管理保存截图/剪贴板跨应用/跨系统文转声/声转文edge的大声朗读在linux不适用whisper实时字幕翻译/提取文字/素材逐字(音节)分段so-vits朗读故障恢复刷新快照(ai)处理文生图、图生图图生视频插
  • 2024-04-07基于So-VITS-SVC4.1声音克隆几种不同的推理方法
    之前一直没时间整理,现在抽了点时间整理一下这个声音克隆的几种非webui的启动方式。文章目录命令行方式API调用方式命令行方式这里需要在inference_main.py中将参数都修改成在页面点击操作时候对应的即可。defmain():importargparseparser=argpars
  • 2024-02-08Python进行AI声音克隆的端到端指南
    人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。本文的将提供利用AI语音克隆技术-通过训练
  • 2024-02-06So-VITS-SVC 课程笔记
    课程地址,https://www.bilibili.com/video/BV1uj411v7zW/?spm_id_from=pageDriver&vd_source=1eb6e5015a1f70daa97080d8ee786d5d So-VITS-SVC:SoftVCVITSSingingVoiceConversionSoftVC,编码技术,用soft聚类来消除说话人的音色特征VITS,核心技术SingingVoiceConversion,
  • 2024-02-02VITS课程学习笔记
    课程地址,https://www.bilibili.com/video/BV1wV411j7zG/?spm_id_from=333.788&vd_source=1eb6e5015a1f70daa97080d8ee786d5d VITS,VariationalInferencewithadversariallearningforend-to-endText-to-Speech论文,VITS:ConditionalVariationalAutoencoderwithAd
  • 2024-01-22SO-VITS-SVC使用
    https://zhuanlan.zhihu.com/p/630115251?utm_id=0https://www.bilibili.com/read/cv22206231/ python版本,3.10开个python虚拟环境python-mvenv升级pip,否则会报错用pipinstall-rrequirements.txt按照依赖打开webUI,pythonwebUI.py下载孙燕姿的模型,模型文件,.pt配