首页 > 其他分享 >模型部署 — PaddleNLP 基于 Paddle Serving 快速使用(服务化部署 - Docker)— 图像识别 + 信息抽取(UIE-X)

模型部署 — PaddleNLP 基于 Paddle Serving 快速使用(服务化部署 - Docker)— 图像识别 + 信息抽取(UIE-X)

时间:2023-07-25 13:12:22浏览次数:43  
标签:Serving 图像识别 ppnlp 部署 -- home model root localhost

目录
图像识别 + 信息抽取(UIE-X),部署接口供别的应用调用
最终在自己部署的环境中识别时报错,不知道是不是和GPU有关,还在尝试中

流程

  • 在百度 BML CodeLab 中跑好模型(免费算力,玩玩够了)
  • 下载模型 (比较大,我这个有10G了,可以适当做裁剪)
  • Linux 上安装 Docker ,所以的事项在 Docker 中运行

版本

虚机配置:CentOS 7 、 内存:12G、CPU:4核
本文版本号:
Python 3.7.13 Docker 镜像已经集成
PaddlePaddle 2.4.0 Docker 镜像已经集成
PaddleNLP 2.5.2
PaddleOcr 2.6.1.3

注意: Python 版本 (Docker 镜像中的 Python 已经集成好)
PaddlePaddle 2.4.0 - => Python 3.7.4
PaddlePaddle 2.4.1 + => Python 3.9.0

查看版本 注意各个应用的版本关系
https://hub.docker.com/r/paddlepaddle/paddle/tags/?page=1&name=cpu
image

安装

虚机配置:CentOS 7 、 内存:12G、CPU:4核
镜像中集成好了 Python 3.7.12 比较方便

Docker 安装

# 切换进 opt/ppnlp 目录,后面 $PWD 挂载时会用到当前的路径
[root@localhost ~]# cd /opt/ppnlp/
[root@localhost ppnlp]# pwd
/opt/ppocr
[root@localhost ppnlp]# 

# 获取镜像 -- 没有GPU环境,使用CPU跑了玩玩
[root@localhost ppnlp]# docker pull registry.baidubce.com/paddlepaddle/paddle:2.4.0-cpu
# 创建一个名字为 ppnlp 的docker容器,并将当前目录映射到容器的/paddle目录下
[root@localhost ppnlp]# docker run --name ppnlp -v $PWD:/paddle --network=host -it registry.baidubce.com/paddlepaddle/paddle:2.4.0-cpu /bin/bash
# --name ppnlp:设定 Docker 的名称,ppnlp 是自己设置的名称;
# -it:参数说明容器已和本机交互式运行;
# -v $PWD:/paddle:指定将当前路径(PWD 变量会展开为当前路径的绝对路径--Linux宿主机的路径,所以执行命令的路径要选好)挂载到容器内部的 /paddle 目录;(相当于 /opt/ppnlp 挂载到容器内)
# registry.baidubce.com/paddlepaddle/paddle:2.4.0-cpu:指定需要使用的 image 名称,您可以通过docker images命令查看;/bin/bash 是在 Docker 中要执行的命令

# ctrl+P+Q可退出docker 容器,重新进入docker 容器使用如下命令
[root@localhost ppocr]# docker exec -it ppnlp /bin/bash
λ localhost /home

[root@localhost 开头的都是在Linux 服务器上执行
以下命令都是在容器中执行,防止混淆,下面命令省掉了 λ localhost /home

PaddleNLP 安装

# 升级 pip 
pip install -U pip -i https://mirror.baidu.com/pypi/simple
# 容器中已经包含了 paddlepaddle 2.4.0
pip list
# 安装 PaddleNLP
pip install paddlenlp -i https://mirror.baidu.com/pypi/simple
# 安装 PaddleOCR
pip install paddleocr -i https://mirror.baidu.com/pypi/simple

环境准备

模型准备

前面已经训练好了:https://aistudio.baidu.com/aistudio/projectdetail/6518069?sUid=2631487&shared=1&ts=1689903307978

压缩模型

image

# 先重命名 mv checkpoint checkpoint2 # 创建目录 mkdir -p checkpoint/model_best # 复制需要的文件 cp checkpoint2/model_best/model.pdiparams model.pdiparams cp checkpoint2/model_best/model.pdiparams.info model.pdiparams cp checkpoint2/model_best/model.pdmodel model.pdiparams cp checkpoint2/model_best/model_state.pdparams model.pdiparams cp checkpoint2/model_best/sentencepiece.bpe.model model.pdiparams
# 压缩文件 --大概要10G左右
tar cf checkpoint.tar checkpoint

image

下载模型

文件有点大,10G左右
image

模型部署

image

[root@localhost ~]# cd /opt/ppnlp
# 将模型,复制到容器中
[root@localhost ppnlp]# docker cp checkpoint.tar ppnlp:/home
# 进入容器
[root@localhost ppnlp]# docker exec -it ppnlp /bin/bash
λ localhost /home ll
total 9.5G
drwxr-xr-x. 1 root root   55 Jul 21 02:58  ./
drwxr-xr-x. 1 root root   66 Jul 21 02:58  ../
-rw-r--r--. 1 root root 9.5G Jul 21 02:24  checkpoint.tar
drwxr-xr-x. 6 root root   52 Aug 17  2022  cmake-3.16.0-Linux-x86_64/
λ localhost /home
λ localhost /home tar -xvf checkpoint.tar
# 容器中安装 tree
λ localhost /home apt-get install tree 

环境配置

https://gitee.com/paddlepaddle/PaddleNLP/tree/v2.5.2/applications/information_extraction/document/deploy/simple_serving
将 server.py、client.py、test.jpg 根据环境修改配置后,上传至容器中
test.jpg
image

server.py

from paddlenlp import SimpleServer, Taskflow

# The schema changed to your defined schema
schema = ["开票日期", "名称", "纳税人识别号", "开户行及账号", "金额", "价税合计", "No", "税率", "地址、电话", "税额"]
# The task path changed to your best model path
uie = Taskflow(
    "information_extraction",
    schema=schema,
    task_path="/home/checkpoint/model_best", # 注意路径
)
# If you want to define the finetuned uie service
app = SimpleServer()
app.register_taskflow("taskflow/uie", uie)

client.py


import json

import requests

from paddlenlp.utils.doc_parser import DocParser

# Define the docuemnt parser
doc_parser = DocParser()

image_paths = ["/home/test.jpg"] # 注意路径
image_base64_docs = []

# Get the image base64 to post
for image_path in image_paths:
    req_dict = {}
    doc = doc_parser.parse({"doc": image_path}, do_ocr=False)
    base64 = doc["image"]
    req_dict["doc"] = base64
    image_base64_docs.append(req_dict)

url = "http://0.0.0.0:8189/taskflow/uie"
headers = {"Content-Type": "application/json"}
data = {"data": {"text": image_base64_docs}}

# Post the requests
r = requests.post(url=url, headers=headers, data=json.dumps(data))
datas = json.loads(r.text)
print(datas)

将文件传到容器内

# 将文件传至容器
[root@localhost ppnlp]# docker cp client.py ppnlp:/home
[root@localhost ppnlp]# docker cp server.py ppnlp:/home
[root@localhost ppnlp]# docker cp test.jpg ppnlp:/home
# 进入容器
[root@localhost ppnlp]# docker exec -it ppnlp /bin/bash
λ localhost /home ll
total 9.5G
-rw-r--r--. 1 root root   77 Jul 20 09:27 '='
drwxr-xr-x. 1 root root  105 Jul 21 05:24  ./
drwxr-xr-x. 1 root root   66 Jul 21 05:24  ../
drwxr-xr-x. 3 1000 1000   24 Jul 18 09:36  checkpoint/
-rw-r--r--. 1 root root 9.5G Jul 21 02:24  checkpoint.tar
-rw-r--r--. 1 root root 1.3K Jul 21 04:02  client.py
drwxr-xr-x. 6 root root   52 Aug 17  2022  cmake-3.16.0-Linux-x86_64/
-rw-r--r--. 1 root root 1.2K Jul 21 03:57  server.py
-rw-r--r--. 1 root root 1.4M Jul 21 03:55  test.jpg
λ localhost /home

启动服务

# 进入容器
[root@localhost ppnlp]# docker exec -it ppnlp /bin/bash
# 启动服务
λ localhost /home paddlenlp server server:app --workers 1 --host 0.0.0.0 --port 8189
# 后台运行 -- 测试时不要用后台运行,中间会报很多错误,开两个窗口,调试时方便
# λ localhost /home nohup paddlenlp server server:app --workers 1 --host 0.0.0.0 --port 8189 &>log.txt &

image

测试 -- 暂时还没通过

# 再开一个窗口执行
# 进入容器
[root@localhost ppnlp]# docker exec -it ppnlp /bin/bash
λ localhost /home python client.py

image

百度的环境重现了,问题就是我的服务器没有GPU

from pprint import pprint
from paddlenlp import Taskflow
schema = {
    '项目名称': [
        '结果',
        '单位',
        '参考范围'
    ]
}
my_ie = Taskflow("information_extraction", model="uie-x-base", schema=schema, task_path='./checkpoint/model_best')

# 加上device_id=0,使用CPU,会就报
my_ie = Taskflow("information_extraction", model="uie-x-base", schema=schema, device_id=0, task_path='./checkpoint/model_best')

百度 BML CodeLab 环境中,加上device_id=0, 使用CPU,会就报下面错误 推测我的虚机里面错误,应该是没有GPU环境有关
image

重启

# 如果容器停止,重启容器
[root@localhost ppocr]# docker restart ppnlp
# 进入容器
[root@localhost ppocr]# docker exec -it ppnlp /bin/bash

# 启动服务
λ localhost /home paddlenlp server server:app --workers 1 --host 0.0.0.0 --port 8189
# 后台运行 -- 测试时不要用后台运行,中间会报很多错误,开两个窗口,调试时方便
# λ localhost /home nohup paddlenlp server server:app --workers 1 --host 0.0.0.0 --port 8189 &>log.txt &

标签:Serving,图像识别,ppnlp,部署,--,home,model,root,localhost
From: https://www.cnblogs.com/vipsoft/p/17568862.html

相关文章

  • 分布式存储在云环境下的应用和部署
    随着互联网数据规模越来越大,并发请求越来越高,传统的关系数据库系统在性能、价格、可扩展性方面已经不能很好地满足需求。谷歌、亚马逊等互联公司率先在后台基础设施中引入超大规模分布式存储系统,用来解决海量数据的存储问题。与传统的集中式存储技术不同,分布式存储没有将数据存储在......
  • Redis 集群偶数节点跨地域部署之高可用测试
    笔者目前所在公司存在多套Redis集群:A集群主+从共60个分片,部署在3+3台物理机上,每台机器各承载10个端口主库30个端口在广州,从库30个端口在中山B集群共72个端口,部署架构一模一样上云后,均为广东的某个云厂商的2个可用区,不再使用IDC数据中心,部署架构一......
  • Redis部署和基本的应用
    数据库的类型常见关系数据库产品常见非关系数据库Redis的优势和数据类型一:安装redis服务器端1挂载redis光盘2解压移动redis3编译安装4初始化配置Redis服务器5停止服务6修改服务配置文件(1)监听ip地址(2)监听端口号(3)守护进程运行服务(4)redis进程文件(6)日志安全级别(7)redis日志(8)redi......
  • Redis部署和基本的应用
    一:安装redis服务器端1挂载redis光盘2解压移动redis3编译安装4初始化配置Redis服务器5停止服务6修改服务配置文件(1)监听ip地址(2)监听端口号(3)守护进程运行服务(4)redis进程文件(6)日志安全级别(7)redis日志(8)redis密码7启动服务8使用免交互式登录redis9查看redis所有配置信息二:redi......
  • 阿里云k8 部署 yml 自动部署
    apiVersion:extensions/v1beta1kind:Deploymentmetadata:name:opssvr-deploymentnamespace:ops-prodspec:selector:matchLabels:app:opssvrreplicas:2revisionHistoryLimit:5template:metadata:labels:app:opssvrspec:containers:......
  • kubernets(k8s) 部署1.23.6版本
    kubernets(k8s)部署1.23.6版本环境准备环境介绍操作系统:CentOSLinuxrelease7.6.1810(Core)k8s组件版本:1.23.6docker版本:Dockerversion24.0.4,build3713ee12核CPU、2G内存、20G硬盘节点:(本实验采用虚拟机)k8s-master172.16.100.130    k8s-node1172.16.......
  • 博客园部署
    博客侧边栏<scripttype="text/javascript">window.cnblogsConfig={info:{name:'Linnyx',//用户名startDate:'2023-3-22',//入园时间,年-月-日。入园时间查看方法:鼠标停留园龄时间上,会显示入园时间avatar:'https://cdn.......
  • Spring Boot集成Docker部署教程
    前言Docker有时候确实易用,但SpringBoot官方好像并不推荐这种方式,按照个人理解应该是SpringBoot已经做了一个很优秀的集成,对于Docker这种容器化让开发人员不能专注于开发...附文为SpringBoot官方教程:https://spring.io/guides/topicals/spring-boot-docker/ 正文环境是J......
  • zookeeper部署
    下载官网路径:https://dlcdn.apache.org/zookeeper/单机部署#解压tar-zxfapache-zookeeper-3.8.1.tar.gz#进入配置文件目录cdapache-zookeeper-3.8.1/conf#拷贝模板文件cp-azoo_sample.cfgzoo.cfg#编辑文件vimzoo.cfg    tickTime=2000    initL......
  • WINPE(Windows Preinstallation Environment)是一个基于Windows操作系统的轻量级预安装
    WINPE(WindowsPreinstallationEnvironment)是一个基于Windows操作系统的轻量级预安装环境。它主要用于系统部署、故障排除、数据恢复和维护等任务。以下是一些常见的WINPE版本:WindowsPE2.0:也称为Vista版,基于WindowsVista操作系统。具有较高的兼容性,并提供了各种工具和驱动程序......