首页 > 编程语言 >Java 实现结巴分词

Java 实现结巴分词

时间:2023-10-21 11:55:21浏览次数:38  
标签:Java 结巴 collect 托特 单肩 strList 分词

pom.xml 引入结巴分词maven依赖

<dependency>
	<groupId>com.huaban</groupId>
	<artifactId>jieba-analysis</artifactId>
	<version>1.0.2</version>
</dependency>

测试

@Test
    public void test() {
        String goodsName = "设计小众托特包女大容量通勤包高级手提大包时尚单肩包";
        TokenizerEngine engine = TokenizerUtil.createEngine();
        Result result = engine.parse(goodsName.replaceAll("\\s*", ""));
        ArrayList<String> strList = new ArrayList<>();
        for (Word word : result) {
            strList.add(word.getText());
        }
        String collect = strList.stream()
                .distinct()
                .collect(Collectors.joining("|"));
        System.out.println(collect);
    }

最终输出

设计|小众|托特|包女|大容量|通勤|包|高级|手提|大包|时尚|单肩

看得出来实现简易分词还是没问题的,复杂的情况就不适用了

标签:Java,结巴,collect,托特,单肩,strList,分词
From: https://www.cnblogs.com/Linzj5950/p/17778726.html

相关文章

  • 10.17 Java异常处理1
     eg:importjavax.swing.*;classAboutException{publicstaticvoidmain(String[]a){inti=1,j=0,k;k=i/j;try{k=i/j;//Causesdivision-by-zeroexception//thrownewException("Hello.Exception!&quo......
  • 从零开始的Java编程:教你如何实现“超级马里奥”游戏!
    引言超级马里奥,这个名字对于游戏迷来说一定不陌生。它是一款经典的游戏系列,以一个勇敢的水管工人——马里奥为主角,讲述了他在蘑菇王国中的冒险故事。在这个充满挑战和刺激的游戏中,玩家需要控制马里奥跳跃、躲避障碍物,并与邪恶的蘑菇和食人花敌人战斗,最终抵达城堡的胜利之地。游......
  • Java 自定义脱敏注解实现
    自定义注解packagecom.yunmeng.iot.common.desensitization.annotation;importcom.fasterxml.jackson.annotation.JacksonAnnotationsInside;importcom.fasterxml.jackson.databind.annotation.JsonSerialize;importcom.yunmeng.iot.common.desensitization.enums.Secr......
  • java基础漏洞学习----基础命令执行漏洞
    java基础漏洞学习----基础命令执行漏洞基础命令执行常见方法1.ProcessBuilderpackagecom.example.servletdemo;importjava.io.BufferedReader;importjava.io.IOException;importjava.io.InputStreamReader;importjavax.servlet.ServletException;importjavax.servl......
  • Java Stream流实现递归查询
    MySql数据库表结构模拟数据查询出所有数据,用父节点递归查询出所有子节点数据/***封装备注分类集合**@paramremarkTypeList备注分类集合*@return递归好的集合*/@OverridepublicList<RemarkType>queryRemarkTypeList(......
  • 小程序底层技术机制解读 - JavaScript编程语言
    JavaScript是小程序的核心编程语言之一,它在小程序中起着至关重要的作用。本文将深入探讨JavaScript在小程序底层技术机制中的作用,以及如何利用JavaScript来构建小程序应用。同时,我们还将提供一个简单的代码演示,以帮助读者更好地理解JavaScript在小程序中的应用。JavaScript在小程序......
  • javaweb-会话跟踪技术
    首先了解什么是会话?会话:用户打开浏览器,访问web服务器的资源,会话建立,直到有一方断开连接,会话结束,在一次会话中可以包含多次请求和响应 上述图例就是会话。会话跟踪:一种维护浏览器状态的方法,服务器需要识别多次请求是否来自同一浏览器,以便在同一次会话的多次请求中共享数据 ......
  • java基础漏洞学习----文件操作漏洞
    java基础漏洞学习----文件操作漏洞前置基础知识https://www.cnblogs.com/thebeastofwar/p/17760812.html文件上传漏洞文件上传的方式1.通过文件流index.jsp<%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%><!DOC......
  • Java类加载器
    Java中的类加载器Java中的类加载器大致可以分成两类,一类是系统提供的,另外一类则是由Java应用开发人员编写的。系统提供的类加载器主要有下面三个:引导类加载器(bootstrapclassloader):它用来加载Java的核心库,是用原生代码来实现的,并不继承自java.lang.ClassLoa......
  • 关于JAVA项目中的常用的异常处理情况
    JAVA项目中的常用的异常处理情况总结   在Java应用程序开发中,异常处理是至关重要的,因为它可以帮助您的程序应对各种不可预测的情况和错误。无论是在开发新项目还是在维护现有项目时,了解如何有效地处理异常是确保您的应用程序稳定性和可靠性的关键。本文将深入探讨Java项......