首页 > 编程语言 >中文地址分词算法-Java版

中文地址分词算法-Java版

时间:2024-03-29 13:32:16浏览次数:40  
标签:汉阳区 Java 10 算法 地址 words 101 分词 road

addresstool用于处理中文地址的分词和匹配,采用NLP分词算法进行中文地址分词 ,在中文地址分词基础上对垃圾地址进行识别,过滤,标记等。根据杂乱的业务地址自动化生成标准中文地址库,并支持随机业务地址关联到标准地址操作,实测速度达到25000条/每秒

今天我们测试一下addresstool的地址分词功能
上代码

    public static void main(String[] args) {
        AddressTool ss = new AddressTool();
        List<String> words;
        //正常地址
        words = ss.cutAddress("湖北省武汉市汉阳区汉阳大道10号花果山5号楼1单元101室");
        System.out.println(words);
        //城市名补全
        words = ss.cutAddress("湖北省武汉汉阳区汉阳大道10号花果山5栋1单元101户");
        System.out.println(words);
        // 省份补全 城市补全
        words = ss.cutAddress("湖北武汉汉阳区汉阳大道10号花果山5号楼1单元101室");
        System.out.println(words);
    }

打印结果

[province:湖北省, city:武汉市, county:汉阳区, road:汉阳大道, road_no:10, aoi:花果山, building:5, unit:1, room:101]
[province:湖北省, city:武汉市, county:汉阳区, road:汉阳大道, road_no:10, aoi:花果山, building:5, unit:1, room:101]
[province:湖北省, city:武汉市, county:汉阳区, road:汉阳大道, road_no:10, aoi:花果山, building:5, unit:1, room:101]

完美!

标签:汉阳区,Java,10,算法,地址,words,101,分词,road
From: https://blog.csdn.net/u011024436/article/details/137052842

相关文章

  • Java:实验三类的继承与派生
    第1关:什么是封装,如何使用封装编程要求根据提示,在右侧编辑器补充代码。定义一个Person类,包含姓名(name)、性别(sex)、年龄(age)等字段;定义一个Teacher类继承Person类,增加职称(pro)、部门(department)等字段;定义一个Student类继承Person类,增加学号(no)、入学时间(enter)、专业(major)等字段;定......
  • 动态规划 选择dp:多重背包+多重背包puls----中专生刷算法
    不了解动态规划和选择dp的同学先看一下这两篇文章动态规划:选择dp及优化01背包问题-CSDN博客动态规划:完全背包问题----中专生刷算法-CSDN博客然后我们来做题普通题+进阶题,图文详解,化零为整的解决多重背包puls问题!!!多重背包输入格式输出格式输出一个整数,表示最......
  • 【LeetCode】LeetCode 547. 省份数量(Java版 什么是并查集)
      ......
  • java.sql.BatchUpdateException: Date truncation: Out of range value for column xx
    报错:java.sql.BatchUpdateException:Datetruncation:Outofrangevalueforcolumnxxxxx原因:xxx列ddl中为stock_num(12,2)数据库值为0.06需要更新为:0.06-0.21就会出现该错误参考:https://www.jb51.net/article/158166.htmhttps://blog.csdn.net/stone_tomca......
  • java毕业设计玩具租借系统(Springboot+mysql+jdk1.8+maven3.39)
    本系统(程序+源码)带文档lw万字以上 文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景:在当今社会,随着人们生活水平的提升和消费观念的变化,儿童教育和娱乐逐渐成为家庭支出的重要部分。玩具作为儿童日常生活中不可或缺的元素,伴随着孩子的成长,......
  • java毕业设计微社区综合服务疫情防控管理系统(Springboot+mysql+jdk1.8+maven3.39)
    本系统(程序+源码)带文档lw万字以上 文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景:自新冠疫情爆发以来,社区作为疫情防控的第一线,承担着居民健康监测、防疫物资分配、疫情信息宣传等重要职责。传统的社区疫情防控多依赖人力进行,存在着信息......
  • 【matlab】【2024年】【优化算法】【黑风筝算法】【BKA】【附带论文中英翻译网页版】
            本文创新性地提出了黑风筝算法(BKA),这是一种受黑风筝迁徙和掠食行为启发的元启发式优化算法。BKA集成了柯西突变策略和Leader策略,增强了算法的全局搜索能力和收敛速度。这种新颖的组合在探索全球解决方案和利用本地信息之间取得了良好的平衡。在CEC-2022和CEC-20......
  • java毕业设计无偿献血服务平台(Springboot+mysql+jdk1.8+maven3.39)
    本系统(程序+源码)带文档lw万字以上 文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景:无偿献血是一项社会公益活动,对于挽救生命、维护人类健康具有极其重要的意义。然而,在实际操作过程中,献血者往往面临信息不对称、献血地点不便、献血后服务......
  • java毕业设计企业员工自助管理系统(Springboot+mysql+jdk1.8+maven3.39)
    本系统(程序+源码)带文档lw万字以上 文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景:在现代企业管理中,提高管理效率和员工满意度是企业发展的重要目标。随着企业规模的扩大和管理层次的增加,传统的人力资源管理方式已无法满足快速反应和高效......
  • AI预测福彩3D第21弹【2024年3月29日预测--第4套算法重新开始计算第7次测试】
       今天继续对第4套算法进行测试,测试的目的主要是为了记录统计两套方案的稳定性和命中率,昨天的第一套和第二套方案均已命中。今天是第7次测试,同样测试两个方案。废话不多说,直接上结果。     2024年3月29日福彩3D的七码预测结果如下    第一套:  ......