c# HanLP 分词,主要是为了 更好的搜索数据,便于搜索文章,对文章进行统一的分词
HanLP框架搭建
IKVM 是一个c#端的java 虚拟机
下载地址:https://sourceforge.net/projects/ikvm/files/
HanLP由三部分组成,类库hanlp.jar包、模型data包、配置文件hanlp.properties
主要用来,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析
https://github.com/hankcs/HanLP/releases
修改配置
配置文件的作用是告诉HanLP数据包的位置,只需修改第一行
root=D:/JavaProjects/HanLP/
//以下是我自己的网盘的保存的资源。
链接:https://pan.baidu.com/s/1xAV4-K00KX55ocSoOPzmsg
提取码:cxtv
其中主要是从 这个 “实际开发中需要的” 进行下载一个配置文件一个DLL库文件
java.lang.System.getProperties().setProperty("java.class.path", @"C:\Users\Administrator\Desktop\HanLP\hanlp-1.7.4-release");
var list = HanLP.segment("你好,欢迎在CSharp中调用HanLP的API!");
Console.WriteLine(list);
Console.ReadLine();
效果如上.
标签:java,配置文件,HanLP,搜索,https,文章,hanlp,分词 From: https://blog.51cto.com/kesshei/6287428