首页 > 其他分享 >实用模型推荐(一)相似度,文本向量化:text2vec-base-chinese

实用模型推荐(一)相似度,文本向量化:text2vec-base-chinese

时间:2023-06-27 11:33:18浏览次数:64  
标签:chinese app list text2vec base result import data

1.开源地址:https://github.com/shibing624/text2vec

2.使用场景:文本相似度计算,文本转指令

3.API封装:

import uvicorn
from fastapi import FastAPI
from loguru import logger
from pydantic import BaseModel
from starlette.middleware.cors import CORSMiddleware
from text2vec import Similarity

sim_model = Similarity("shibing624/text2vec-base-chinese")
# define the app
app = FastAPI()
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"]
)


@app.get('/')
async def index():
    return {"message": "index, docs url: /docs"}


class InputData(BaseModel):
    sentences1: list
    sentences2: list


@app.post('/emb')
async def emb(data: InputData):
    try:
        scores = sim_model.get_scores(data.sentences1, data.sentences2)
        
        result_list = []
        for i in range(len(data.sentences1)):
            for j in range(len(data.sentences2)):
                result_list.append(float(scores[i][j]))
        
        result_dict = {'emb': result_list}
        return result_dict
    except Exception as e:
        logger.error(e)
        return {'status': False, 'msg': str(e)}, 400



if __name__ == '__main__':
    uvicorn.run(app=app, host='0.0.0.0', port=11020)

 

标签:chinese,app,list,text2vec,base,result,import,data
From: https://www.cnblogs.com/AmbitiousMice/p/17508240.html

相关文章

  • 分布式事务、CAP理论、BASE理论
    分布式事务、CAP理论、BASE理论什么是分布式事务?首先理解什么是本地事务?平常我们在程序中控制事务是利用数据库本身的事务特性来实现的,比如spring中的@Transactional注解,因此叫数据库事务。由于应用主要靠关系数据库来控制事务,此数据库只属于该应用,所以基于本应用自己的关......
  • HBase应用方案
    HBase性能优化方法: ......
  • h2database BTree 设计实现与查询优化思考
    h2database是使用Java编写的开源数据库,兼容ANSI-SQL89。即实现了常规基于BTree的存储引擎,又支持日志结构存储引擎。功能非常丰富(死锁检测机制、事务特性、MVCC、运维工具等),数据库学习非常好的案例。本文理论结合实践,通过BTree索引的设计和实现,更好的理解数据库索引相关的......
  • 前端 js 获取 baseurl
    如果部署一个网站到网络需要知道对应的ip,这个时候前端的baseurl需要动态调整,一般是在public里面写个config.js,部署的时候改这个config.js里面的内容有一种偷懒的方式就是用户是知道你的ip的,这个时候可以用window.location.host获取当前浏览器的host网址拿这个当bas......
  • 强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函
    强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)1.核心词汇策略(policy):在每一个演员中会有对应的策略,这个策略决定了演员的后续动作。具体来说,策略就是对于外界的输入,输出演员现在应该要执行的动作。一般地,我......
  • 强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函
    强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)1.核心词汇策略(policy):在每一个演员中会有对应的策略,这个策略决定了演员的后续动作。具体来说,策略就是对于外界的输入,输出演员现在应该要执行的动作。一般地,我们......
  • BASE最终一致性
    BASE(BasicallyAvailable,SoftState,EventuallyConsistent)是一种分布式系统设计原则,它与传统的ACID(Atomicity,Consistency,Isolation,Durability)模型相对应。在构建大规模、高可用性的分布式系统时,BASE的设计原则被广泛采用。BASE所强调的最终一致性,是指系统中的数据最终......
  • 【源码阅读】2. Catalog和Database
     Catalog创建|KW_CREATEKW_CATALOGopt_if_not_exists:ifNotExistsident:catalogNameopt_properties:properties{:RESULT=newCreateCatalogStmt(ifNotExists,catalogName,null,properties);:}|KW_CREATEKW_CATALOGopt_if_not_......
  • ORA-15061 reported while doing a file operation with 11.1 or 11.2 ASM after PSU
    ORA-15061reportedwhiledoingafileoperationwith11.1or11.2ASMafterPSUappliedindatabasehome[ID1070880.1]--------------------------------------------------------------------------------修改时间26-OCT-2011类型PROBLEM状态PUBLISH......
  • How to restore ASM based OCR after complete loss of the CRS diskgroup on Linux/U
    HowtorestoreASMbasedOCRaftercompletelossoftheCRSdiskgrouponLinux/Unixsystems[ID1062983.1]--------------------------------------------------------------------------------修改时间12-FEB-2012类型HOWTO状态PUBLISHEDInthis......