chatTTS系列之-apiServer

时间：2024-06-14 23:58:56浏览次数：25

标签：chatTTS 系列 FastAPI apiServer seed chat path audio local

文章目录

背景
技术方案
方案实现
总结

背景

在之前文章中我们对chattts有了一个大致的了解并对webui进行了一定的优化。然而,还有很多情况下我们还需要进行api调用。gradio虽然也提供了sdk,但只有python和node两种语言,远远不如http接口来的泛用。因此，我们来对chatts更近一步优化,来编写一个apiServer。

技术方案

技术方案我们选用FastAPI。

我们对FastAPI做一个简要的介绍

fastapi，一个用于构建 API 的现代、快速（高性能）的web框架。

fastapi是建立在Starlette和Pydantic基础上的，Pydantic是一个基于Python类型提示来定义数据验证、序列化和文档的库。Starlette是一种轻量级的ASGI框架/工具包，是构建高性能Asyncio服务的理性选择。

快速：可与 NodeJS 和 Go 比肩的极高性能（归功于 Starlette 和 Pydantic），是最快的 Python web 框架之一。
高效编码：提高功能开发速度约 200％至 300％。
更少bug：减少约 40％的人为（开发者）导致错误。
智能：极佳的编辑器支持。处处皆可自动补全，减少调试时间。
简单：设计的易于使用和学习，阅读文档的时间更短。
简短：使代码重复最小化。通过不同的参数声明实现丰富功能。
健壮：生产可用级别的代码。还有自动生成的交互式文档。

方案实现

安装FastAPI

pip install "fastapi[all]"
pip install "uvicorn[standard]"

编写一个入口

 from fastapi import FastAPI  # FastAPI 是一个为你的 API 提供了所有功能的 Python 类。
 import uvicorn

 app = FastAPI()  # 这个实例将是创建你所有 API 的主要交互对象。这个 app 同样在如下命令中被 uvicorn 所引用
 
 @app.get("/")
 async def root():
     return {"message": "Hello yuan"}
    
if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=8087)

一个简单案例就做好了,和其它很多框架一样,我们需要引入路由分组

app = FastAPI()
app.include_router(prefix="/chat", router=audio_router)

不同分组就不再是通过app来修饰

router = APIRouter()

@router.post("/generate_audio")
async def generate_audio(request: GenerateAudioRequest):
    ...

逻辑实现

全局只维护一个chat对象

如何每次创建一个chat对象,显存将很快被耗完。每创建完一个对象大约消耗1GB显存,小于4GB显存将强制使用CPU进行推理

def create_chat(local_path=None):
    """创建ChatTTS实例"""
    if "chat" in cf:
        logging.info("cached chat")
        return cf['chat']
    local_model_path = os.getenv('MODEL_LOCAL_PATH', None)
    # 导入模型实例
    chat = ChatTTS.Chat()
    if local_model_path is None:
        chat.load_models()
    else:
        logging.info('local model path:', local_model_path)
        chat.load_models('local', local_path=local_model_path)
    cf['chat'] = chat
    return chat

生成随机音色

def determine_seed(seed):
    """限定模型使用的种子值"""
    torch.manual_seed(seed)
    np.random.seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False



def build_random_speaker(chat, request: GenerateAudioRequest):
    """
    生成随机音色
    :param chat:
    :param request:
    :return:
    """
    # 使用音色种子值创建音色
    audio_seed_input = request.audio_seed_input
    determine_seed(audio_seed_input)
    return chat.sample_random_speaker()

合成一个完整音频

# 将所有的语音片段合并成一个完整的音频
audio_data_all = np.concatenate(audio_data_all)
sample_rate = 24000
# 写入WAV文件
file_name = wav_utils.build_wav_name()
file_path = str(Path(global_info.AUDIO_TEMP_PATH).joinpath(file_name).resolve())
wavfile.write(file_path, sample_rate, audio_data_all)

返回结果

在每次音频生成结束后,返回音频名称,并将tensor等参数一并返回,方便保存

return {
        "out_put_text": "\n".join(text_data_all),
        "audio_name": file_name,
        "tensor": speak_tensor.tolist()
 }

总结

我们可以根据这些核心需求编写chattts的服务端,满足自己的接口调用需求。本文代码见

chatts-manger




# 总结

我们可以根据这些核心需求编写chattts的服务端,满足自己的接口调用需求。本文代码见

[chatts-manger](https://github.com/MaterialShadow/ChatTTS-manager/tree/master/apiServer)

标签：chatTTS,系列,FastAPI,apiServer,seed,chat,path,audio,local
From： https://blog.csdn.net/u012399690/article/details/139690829

模拟集成电路设计系列博客——7.1.6 多比特SAR ADC
7.1.6多比特SARADC我们目前讨论的逐次逼近型ADC在每个周期都通过单次的比较将搜索空间一分为二。这个搜索可以通过在每个周期进行多次比较来实现加速，每次将搜索空间切分为更小的区域。例如，如果我们想要猜测一个1到128之间的数时，我们除了提问“这个数是否大于64”，还可以同时提问......
模拟集成电路设计系列博客——7.1.5 SAR ADC中的错误纠正
7.1.5SARADC中的错误纠正片上部件的最佳匹配精度可以达到百分之0.1，但是这对于有着10比特及以上精度的SARADC来说仍然不够，因此需要一种校正手段。其中一种用于获得16比特线性ADC的错误纠正方式如下图所示[Lee,1984]：在这种方式中，MSB部分通过二进制权重电容阵列来实现，例如，这个......
模拟集成电路设计系列博客——7.1.4 电荷重分布SAR ADC的速度估计
7.1.4电荷重分布SARADC的速度估计电荷重分布SARADC的主要速度限制来自于电容阵列和开关构成的RC时间常数。为了估计这个时间，考虑电容阵列复位后的简化模型，如下图所示：此处\(R\)，\(R_{s1}\)和\(R_{s2}\)表示位线，\(S_1\)和\(S_2\)开关上的开态电阻，相对的，尽管这个电路很容易就可......
模拟集成电路设计系列博客——7.1.3 电阻电容混合SAR ADC
7.1.3电阻电容混合SARADC在DAC中组合使用电阻串和电容阵列的方式同样可以在ADC中使用，一种实现[Fotouhi,1979]如下图所示：第一步是将所有的电容都充电到\(V_{in}\)并重置比较器，接着，通过逐次逼近的方式来查找两个相邻的电阻节点具有大于和小于\(V_{in}\)的电压。使用两根总线，分......
模拟集成电路设计系列博客——7.1.2 基于电荷重分布的SAR ADC
7.1.2基于电荷重分布的SARADC实现SARADC最直接的方式是使用一个独立的DAC，并将其设置等于输入电压（在一个LSB范围内）进而修改流程图如下：首个用这种方式实现的开关电容模拟系统即所谓的电荷重分布MOSADC[McCreary,1975]。通过这个转换器，采样和保持电路，DAC，以及比较器被组合在了......
【SpringBoot整合系列】SpringBoot整合kinfe4j
目录kinfe4j与Swagger的区别SpringBoot2.x整合kinfe4j1.添加依赖2.启动类注解3.创建Knife4J配置类4.实体类5.接口admin访问api访问常用注解汇总SpringBoot3.x整合Kinfe4j启动报错解决1.更换依赖2.启动类3.配置4.配置类5.参数实体类6.接口admin访问api访问各版......
一文读懂多模态大模型的LLM主干(1)：ChatGLM系列
〔探索AI的无限可能，微信关注“AIGCmagic”公众号，让AIGC科技点亮生活〕本文作者：AIGCmagic社区刘一手前言AI多模态大模型发展至今，每年都有非常优秀的工作产出，按照当前模型设计思路，多模态大模型的架构主要包括以下几个部分：模态编码器(ModalityEncoder,ME)：负责将不同......
软考系统架构设计师系列知识点之杂项集萃（35）
接前一篇文章：软考系统架构设计师系列知识点之杂项集萃（34）第56题遗留系统的演化可以采用淘汰、继承、改造和集成四种策略。若企业中的遗留系统技术含量较高，业务价值较低，在局部领域中工作良好，形成了一个个信息孤岛时，适合于采用（）演化策略。A.淘汰B.继承C.改造D.集成正......
3个月搞定计算机二级C语言！高效刷题系列进行中
前言大家好，我是梁国庆。计算机二级应该是每一位大学生的必修课，相信很多同学的大学flag中都会有它的身影。我在大学里也不止一次的想要考计算机二级office，但由于种种原因，备考了几次都不了了之。这一次我想换个目标！备考计算机二级C语言今天山东省考试院发布了关于2024年9月全......
【Git系列】Git LFS常用命令的使用
前言LFS是LargeFileStorage的缩写，是一个Git扩展，用于管理大型二进制文件，它允许将这些文件存储在单独的存储库中，以便更有效地处理Git仓库。常用命令LFS安装gitlfs要求git>=1.8.2linux环境：gitlfsinstall执行显示UpdatedGithooks.GitLFSinitialized.......