Lucene分词报错：”TokenStream contract violation: close() call missing”

时间：2022-12-19 17:02:46浏览次数：74

标签：java violation wltea analyzer call org close 报错 tokenStream

Lucene使用IKAnalyzer分词时报错：”TokenStream contract violation: close() call missing” 解决办法是每次完成后必须调用关闭方法。

如果报错：java.lang.illegalstateexception: tokenstream contract violation: reset()/close() call missing,则要在tokenStream.incrementToken()，原因是lucene从4.6.0开始tokenstream使用方法更改的问题，在使用incrementtoken方法前必须调用reset方法，详见api http://lucene.apache.org/core/4_6_0/core/index.html 。

以下正确示例代码(第10行和22行调用reset()和close()方法)：

public Set<String> slicing(String text){
    Set<String> result = new HashSet<>();
    StringReader reader = null;
    TokenStream tokenStream = null;
    try {
        reader = new StringReader(text);
        tokenStream = analyzer.tokenStream("", reader);  
        CharTermAttribute charTermAttribute  = tokenStream.getAttribute(CharTermAttribute.class); 
        OffsetAttribute offsetAttribute = tokenStream.addAttribute(OffsetAttribute.class);  
        tokenStream.reset();
            while (tokenStream.incrementToken()) {  
                int startOffset = offsetAttribute.startOffset();  
                int endOffset   = offsetAttribute.endOffset();
                if((endOffset - startOffset) > 1){
                    String term = charTermAttribute.toString(); 
                    result.add(term);
                }
            }  
    } catch (IOException e) {
        e.printStackTrace();
    } finally{
        IOs.close(tokenStream, reader);
    }
    return result;
}

http://www.lizi.pw/archives/56

org.wltea.analyzer.lucene.IKAnalyzer

Exception in thread "main" java.lang.IllegalStateException: 词典尚未初始化，请先调用initial方法
at org.wltea.analyzer.dic.Dictionary.getSingleton(Dictionary.java:137)
at org.wltea.analyzer.core.CJKSegmenter.analyze(CJKSegmenter.java:80)
at org.wltea.analyzer.core.IKSegmenter.next(IKSegmenter.java:116)
at org.wltea.analyzer.lucene.IKTokenizer.incrementToken(IKTokenizer.java:88)

标签：java,violation,wltea,analyzer,call,org,close,报错,tokenStream
From： https://blog.51cto.com/u_15147537/5953065

数据库文件导入报错"MySQL server has gone away"
今天mysql从一个mysql库中导入另一个mariadb库中是总是报：ERROR2006(HY000)atline176infile:'xxx.sql':MySQLserverhasgoneaway但我是在当前服务器上导入的......
docker login 私有仓库时报错
连接私有harbor报错如下：#dockerlogin192.168.1.88-uadmin-pHarbor12345WARNING!Using--passwordviatheCLIisinsecure.Use--password-stdin.Errorrespons......
maven编译报错 -source 1.5 中不支持 lambda 表达式
在用maven编译项目是由于项目中用了jdk1.8,编译是报错 -source1.5中不支持lambda表达式，Google找到这篇解决方案，记录一下：编译时报如下错误：[ERROR]COMPILATIONERR......
Exchange management Shell连接失败，报错超过负载配额
现象打开ExchangeManagementshell报错不能连接某个服务器：WS-management服务无法处理该请求，已经超过系统的负载配额，以较慢速率发送将来的请求或提高系统配额。（TheWS-Manag......
IDEA中编译报错【java: 程序包lombok不存在】
一、lombok问题没有正确引入lombok检查是否在pom中引入lombok依赖<dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId>......
springboot项目打包报错：Type org.springframework.boot.maven.RepackageMojo not pres
折磨了好久的一个问题，换过spring-boot-maven-plugin版本，但不见效。今天参考这篇文章：springboot打包RepackageMojonotpresent，版本改成2.6.2，不行。就想，可能是我用的idea......
VMware安装没网报错：设备“VMnet0”上的网桥暂时关闭，因为桥接的以太网接口已关闭。 x该
设备“VMnet0”上的网桥暂时关闭，因为桥接的以太网接口已关闭。x该虚拟机可能无法与此主机或网络上的其他主机进行通信如果不能操作的话 ......
（原创亲测终极解决方法）场景报错Error -27492: "HttpSendRequest" failed, Windows erro
网上的解决方法，总是千篇一律，能解决还好，就怕不找原因，转来转去还解决不了问题，我也对这个网友很无奈，即然不能解决，你转载他干嘛？不想看罗说的直接去下面看我的解决方法。网上解决......
M1 MacBook 使用conda安装paddle 报错illegal hardware instruction
按照paddle官网要求安装后，在importpaddle时会报错illegalhardwareinstructionpython3 重新安装低版本的paddle，问题解决（原来的版本是2.4.1） #CPUonlypy......
hive初始化报错Exception in thread " main" java.lang.classNotFoundException: org.
问题：hive初始化报错解决方法：https://blog.csdn.net/weixin_51946865/article/details/128020686?spm=1001.2014.3001.5502原因：在我的hadoop配置文件hadoop-env.sh（......

Lucene分词报错：”TokenStream contract violation: close() call missing”

相关文章

赞助商

阅读排行