PaddleNLP命名实体识别环境搭建&推理测试

时间：2024-02-18 10:15:10浏览次数：47

标签：schema pprint 实体 PaddleNLP 命名识别推理搭建

引子最近手上接了一个活儿，基于文本语料的实体抽取任务，调研了一圈发现目前开源轮子做的比较好的也就是PaddleNLP（大模型那种巨废资源，且幻觉严重的，不予考虑）。OK，那就让我们开始吧。一、命名实体识别概念命名实体识别（Named EntitiesRecognition，NER）是自然语言处理的一个基础任务。其目的是识别语料中人名、地名、组织机构名等命名实体。由于命名实体数量不断增加，通常不可能在词典中穷尽列出，且其构成方法具有各自的一些规律性，因而，通常把对这些词的识别从词汇形态处理（如汉语切分）任务中独立处理，称为命名实体识别。命名实体识别技术是信息抽取、信息检索、机器翻译、问答系统等多种自然语言处理技术必不可少的组成部分。二、PaddleNLP环境搭建 conda create -n PaddleNLP python==3.9 conda activate PaddleNLP pip install paddlepaddle-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple pip install --upgrade paddlenlp -i https://pypi.tuna.tsinghua.edu.cn/simple 参考文档 https://github.com/PaddlePaddle/PaddleNLP?tab=readme-ov-file 根据官方文档命名实体识别，基于百度解语，内置91种词性及专名类别标签，具体如下：三、测试 1、官方测试代码 from pprint import pprint from paddlenlp import Taskflow schema = ['时间', '选手', '赛事名称'] # Define the schema for entity extraction ie = Taskflow('information_extraction', schema=schema) pprint(ie("2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以188.25分获得金牌！")) 2、CCTV新闻测试新闻内容 “由日中经济协会、经济团体联合会（经团联）、日本商工会议所（日商）等日本经济界团体组成的日中经济协会联合访华代表团（以下简称日本经济界访华团）于1月23日至26日访问北京。25日晚间，日本经济界访华团最高顾问、经团联会长十仓雅和（住友化学董事长）对《环球时报》记者表示，虽然日中之间存在不同，但也可开展互惠互利的合作，日方正在和中方共同努力。去年11月在旧金山举行的日中领导人会晤重新确认全面推进战略互惠关系的两国关系定位，则有助于构建具有建设性的、稳定的日中关系。”

标签：schema,pprint,实体,PaddleNLP,命名,识别,推理,搭建
From： https://www.cnblogs.com/nick-algorithmer/p/18018818

机器视觉-使用C#进行Yolov8推理
Windows窗体应用可以使用一些现成的C#类库实现yolov8的predict功能,本文使用https://github.com/dme-compunet/YoloV8项目的nuget包.集成方法非常简单,但发现这种方式预测准确度下降了很多,看来还是使用PythonAPI预测更好一些.GPU版环境准备选定Onnxruntime版本,htt......
Skywalking-Aop Docker单机环境搭建
本次搭建是基于MySQL进行持久化，因此需要提前准备好一个MySQL容器(MySQL容器部署略过)。如有错误还请指正。OAP服务搭建拉取skywalking-oap镜像dockerpullapache/skywalking-oap-server:8.9.0接下来可以进行一个简单的启动，目的是拷贝出config目录到宿主机后进行挂载(docke......
使用 Docker 搭建 Jenkins 与 GitLab 环境，实现触发 Webhooks 构建
参考https://blog.csdn.net/xueqinglalala/article/details/120883554https://blog.csdn.net/anqixiang/article/details/104968469https://dirask.com/questions/Gitlab-Jenkins-how-to-fix-Error-403-No-valid-crumb-was-included-in-the-request-DWewGjhttps://www.zhih......
离线AI聊天清华大模型(ChatGLM3)本地搭建指南
随着人工智能技术的飞速发展，聊天机器人成为了一个热门的研究领域。清华大学研发的ChatGLM3模型，作为其中的佼佼者，为开发者提供了强大的自然语言处理能力。本文将指导您如何在本地搭建ChatGLM3模型，实现离线AI聊天功能。一、前置准备在开始搭建之前，您需要准备以下物品：一台性能良......
九、Django环境搭建（基于anaconda环境）
Django特点：具有完整的封装，开发者可以高效率的开发项目，Django将大部分的功能进行了封装，开发者只需要调用即可，如此，大大的缩短了开发的时间，同时也因为太多封装导致开发灵活度和项目的运行效率不足。通常在工作中，开发者可以使用Django快速的搭建项目，然后基于项目进行个别部分的效率优......
国产AI训练卡，对标美国NVIDIA公司的A100，华为昇腾Atlas 300T A2（Ascend 910B4）高性能GPU/N
ChinahassuccessfullyachievedthelocalizationofAIchips,breakingthroughthetechnologicalrestrictionsimposedbytheU.S.governmentandrealizingindependentdesignandproductionofdomesticAIchips.Huawei'sAscend910modelAIchiphass......
使用sing-box搭建socks5转爱快路由器
/etc/sysctl.confnet.ipv4.ip_forward=1/etc/sing-box/config.json{"log":{"level":"error"},"inbounds":[{"tag":"0","type":"tun",&qu......
分布式事务(七)：Seata-Server的搭建
1、Seata-Server下载官方文档地址：https://seata.io/zh-cn/docs/ops/deploy-guide-beginner.html。下载地址：https://github.com/seata/seata/releases，这里下载的是1.5.1版本，seata-server-1.5.1.tar.gz。解压文件目录如下 2、注册中心配置Seata支持的注......
如何选择CentOS 7.6系统bc平台搭建组件安装包
在选择CentOS7.6系统bc平台搭建组件安装包时，可以遵循以下几个步骤：了解需求和依赖关系：首先，要明确自己的需求，即需要搭建什么样的bc平台，并了解该平台所需的组件和依赖关系。这将有助于确定需要安装哪些软件包。选择可靠的软件源：从官方源或可信赖的第三方源获取软件包。官方源通常提......
linux下进行MCU开发环境搭建
why为什么要搭建此开发环境?在linux环境下开发可以利用shell命令实现对文件的批处理伟大的程序员应该都用类unix系统!可以实现对底层编译技术的了解,以便于更好的掌握嵌入式技术通用性,采用开源工具,从底层开发项目,可以不受制于特定厂商的ide工具.可以实现通用架构!what......

PaddleNLP命名实体识别环境搭建&推理测试

相关文章

赞助商

阅读排行