spaCy简介
spaCy是一个用于高级自然语言处理的Python库。它由Matthew Honnibal和Ines Montani于2015年创立。spaCy的设计目标是高性能、易于使用和可扩展性。spaCy内置了多种预训练模型,可用于处理多种语言,包括英语、法语、德语、中文等。它还提供了许多工具和接口,以便用户能够轻松地开发自定义NLP应用程序。
安装库
国内清华镜像
pip install -U spcay -i https://pypi.tuna.tsinghua.edu.cn/simple
安装模型
https://github.com/explosion/spacy-models/releases
我选的中文最大的模型 zh_core_web_trf-3.7.2 。注意此处要和spacy的版本一致
396M的体积,官网下载有点慢,建议复制链接,用迅雷下载。
实体识别
import spacy
nlp = spacy.load("zh_core_web_sm")
text = '广东省广州市'
doc = nlp(text)
for ent in doc.ents:
print(ent.text, ent.label_)```
广东省 GPE
广州市 GPE
标签:nlp,spacy,text,ent,使用,spaCy,安装
From: https://www.cnblogs.com/duoba/p/17933117.html