首页 > 编程语言 >c# HanLP 分词,主要是为了 更好的搜索数据,便于搜索文章,对文章进行统一的分词

c# HanLP 分词,主要是为了 更好的搜索数据,便于搜索文章,对文章进行统一的分词

时间:2023-05-16 22:05:12浏览次数:48  
标签:java 配置文件 HanLP 搜索 https 文章 hanlp 分词


c# HanLP  分词,主要是为了  更好的搜索数据,便于搜索文章,对文章进行统一的分词

HanLP框架搭建

IKVM 是一个c#端的java 虚拟机

下载地址:https://sourceforge.net/projects/ikvm/files/

HanLP由三部分组成,类库hanlp.jar包、模型data包、配置文件hanlp.properties

主要用来,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析

https://github.com/hankcs/HanLP/releases

修改配置

配置文件的作用是告诉HanLP数据包的位置,只需修改第一行

root=D:/JavaProjects/HanLP/ 

//以下是我自己的网盘的保存的资源。

链接:https://pan.baidu.com/s/1xAV4-K00KX55ocSoOPzmsg 
提取码:cxtv 

c# HanLP  分词,主要是为了  更好的搜索数据,便于搜索文章,对文章进行统一的分词_java

c# HanLP  分词,主要是为了  更好的搜索数据,便于搜索文章,对文章进行统一的分词_java_02

其中主要是从 这个 “实际开发中需要的” 进行下载一个配置文件一个DLL库文件

java.lang.System.getProperties().setProperty("java.class.path", @"C:\Users\Administrator\Desktop\HanLP\hanlp-1.7.4-release");
            var list = HanLP.segment("你好,欢迎在CSharp中调用HanLP的API!");
            Console.WriteLine(list);
            Console.ReadLine();

c# HanLP  分词,主要是为了  更好的搜索数据,便于搜索文章,对文章进行统一的分词_c# HanLP_03

效果如上.

标签:java,配置文件,HanLP,搜索,https,文章,hanlp,分词
From: https://blog.51cto.com/kesshei/6287428

相关文章