首页 > 其他分享 >HanLP — HMM隐马尔可夫模型 -- 语料库

HanLP — HMM隐马尔可夫模型 -- 语料库

时间:2023-12-13 16:56:14浏览次数:30  
标签:词语 -- 语料库 HMM HanLP 分词

BMES => B:词语开始、M:词语中间、E:词语结束、S:单独成词
并非所有中文任务都需要分词
image
语料库

  • 每行是一篇“文章”
  • 每篇文章用空格分开
  • 语料库的准确性,严重影响分词结果
  • 理论上,语料库越大越好

每个字都有一个标识(隐藏状态),可以根据语料库得到所有标识

中文分词就是为了得到状态

B M M E S B E S

根据已知状态进行分词,即在"E"和"S"后面输出空格即可

将已分好的词 得到 每个字的状态
image

https://www.bilibili.com/video/BV1aP4y147gA?p=3

标签:词语,--,语料库,HMM,HanLP,分词
From: https://www.cnblogs.com/vipsoft/p/17899436.html

相关文章

  • TSINGSEE青犀基于opencv的安全帽/反光衣/工作服AI检测算法自动识别及应用
    安全帽/反光衣/工作服自动识别检测算法可以通过opencv+yolo网络对现场画面中人员穿戴着装进行实时分析检测,判断人员是否穿着反光衣/安全帽。在应用场景中,安全帽/反光衣/工作服检测应用十分重要,通过对人员的规范着装进行实时监测与预警,可以降低安全隐患,提高安全性。Tips:OpenCV......
  • MyBatis-Plus雪花算法实现源码解析
    1.雪花算法(SnowflakeAlgorithm)雪花算法(SnowflakeAlgorithm)是一种用于生成唯一标识符(ID)的分布式算法。最初由Twitter公司开发,用于生成其内部分布式系统中的唯一ID。雪花算法的设计目标是在分布式系统中生成全局唯一的ID,同时保证ID的有序性和趋势递增。雪花算法生成的ID是64......
  • 将value值是true、false的转为1、0,然后将yData数组里的值全部加个2
         ......
  • excel 速成
     【文本】:查找、替换、截取、拼接数字:加、减、乘、除、保留小数位数【日期】:日期加减、时分秒加减【逻辑】:if、and、or、not【异常】:对计算过程中产生的错误进行处理,如:1/0,N/A【分组聚合】:无条件聚合,有条件聚合、最大值、最小值 1.if(and/or/not)2. iferror()3. text(......
  • 使用element 2.14 实现表格虚拟滚动组件
    下述代码为组件实现代码复制即可食用,默认只展示一屏数据加两条全选存在些许问题,使用row-key时,如果行过多滚动时会不会很流畅特别需要注意的是行高必须要保持一致<template><divclass="t-table":id="TTableId"><el-tableref="el-table":tooltip-......
  • BEV感知综述(转)
    1前言本文介绍了基于视觉传感器的一些感知算法,包括2D感知,3D感知,多目感知,以及基于注意力机制的感知。其中一些文章里提到了BEV感知,也介绍了其基本原理和近期相关的进展。从目前的发展趋势来看,BEV感知已经成为了一个相对独立的研究课题,在自动驾驶系统中的应用潜力也很大。因此,本专......
  • Spring Boot应用启动 java -jar
    1.系统参数的标准格式为:-Dargname=argvalue,多个参数之间用空格隔开,如果参数值中间有空格,则用引号括起来#1.基本java-jarrun.jar#2.指定java路径nohup/opt/mdw/jdk1.8.0_241/bin/java-jarrun.jar#3.如果中文乱码,指定jar包的运行环境的编码java-Dfile.encoding=utf-8-......
  • 跨团队沟通与协作
    一、课程介绍发言人  00:02你好,我是XXX。欢迎来到职场沟通与表达系列之跨团队沟通与协作。你会不会有这样的疑惑?不知道为什么公司里总是会自然而然的形成所谓的部门墙。平时大家相谈甚欢,一到协作的时候这堵墙就自动出现了,沟通上各种不顺,甚至引发争吵,分配的任务也不知道谁来负......
  • 将第2层数据中的数组对象中的ts属性、value属性遍历单独存放到一个新数组中xData、yDa
          ......
  • Mac cocoapods管理
    查看pod版本pod--version移除指定版本sudogemuninstallcocoapods-v1.9.1如果报权限错误,可使用sudogemuninstall-n/usr/local/bincocoapods-v1.12.0安装指定版本sudogeminstallcocoapods-v1.12.0如果报权限错误,可使用sudogeminstall-n/usr/loc......