首页 > 其他分享 >HanLP — HMM隐马尔可夫模型 -- 训练和预测

HanLP — HMM隐马尔可夫模型 -- 训练和预测

时间:2023-12-13 17:47:34浏览次数:42  
标签:概率 词语 -- 矩阵 0.333 HMM 马尔可夫 0.667 HanLP

BMES => B-begin:词语开始、M-middle:词语中间、E-end:词语结束、S-single:单独成词

训练的过程,就是求三个矩阵的过程

  • 初始概率矩阵
  • 转移概率矩阵
  • 发射矩阵
    image
    每个字有4种可能性,上图中有7个字,就是 4^7 种可能性

维特比算法,从众多路径中,挑出最优的那条,他和隐马尔可夫没有强关联

image

初始概率矩阵

今天 天气 真 不错。
麻辣肥牛 好吃 !
我 喜欢 吃 好吃 的!
=> BE BE S BE S (标点也是一个独立的S)
BMME BE S
S BE S BE S S

统计每篇文章(每行)第一个字是什么状态(统计的数值都是频次)

B M S E
2 0 1 0

如果 M、E 有值,那代码 100% 是写错了,因为 第一个字,不可能是中间,也不可能是结束

根据频率得到概率

B M S E
0.667 0 0.333 0

2/3 = 0.667
1/3 = 0.333

转移概率矩阵

发射矩阵

https://www.bilibili.com/video/BV1aP4y147gA?p=4

标签:概率,词语,--,矩阵,0.333,HMM,马尔可夫,0.667,HanLP
From: https://www.cnblogs.com/vipsoft/p/17899569.html

相关文章

  • python3源码方式安装
    系统默认的python3版本过低,得自己安装高版本python3。步骤主要为:1、删除旧版本。2、安装依赖。3、下载源码。4、配置。5、编译。参考链接:CentOS7安装python3超详细教程1、删除旧版pyhton3,执行:rpm-qa|greppython3|xargsrpm-ev--allmatches--nodeps2、安装依赖,执行:yum-......
  • Java GC日志分析
    阅读分析虚拟机和垃圾收集器的日志是处理Java虚拟机内存问题必备的基础技能。一、JDK统一日志格式垃圾收集器日志是一系列人为设定的规则,多少有点随开发者编码时的心情而定,没有任何的“业界标准”可言,换句话说,每个收集器的日志格式都可能不一样。除此以外还有一个麻烦,在JDK9以前......
  • 简单使用
    publicclassStateListenerimplementsApplicationListener<ContextRefreshedEvent>{@ResourceprivateConnectionFactoryconnectionFactory;@BeanpublicQueueserviceQueue(){returnnewQueue(SERVICE_QUEUE);}/**......
  • 2023.12.13日报
    最近事情比较多,写日报也有点怠惰了,主要是偶尔会忘记,简单总结一下这两天的工作首先是使用jfinal做大作业,实话说这玩意一开始我觉得并不好用,因为页面也很简陋,后端也有点看不懂但是在实际体验并且调用百度翻译和图像处理的api后,感觉用起来还可以,其实和springboot有点类似现在是已......
  • ArgoCD ApplicationSet CRD
    ApplicationSet概述ApplicationSetcontroller是一个Kubernetescontroller,添加了对ApplicationSetCustomResourceDefinition(CRD)的支持。该controller/CRD实现了跨大量集群和monorepos内管理ArgoCDApplication的自动化和更大的灵活性,此外,它还使多租户Kubernetes......
  • 除了Promise.all(),使用Promise.allSettled()方式请求,避免使用循环请求
    constgetFilePromises:Promise<any>[]=[];fileIds.forEach((item)=>{getFilePromises.push(getFileInfoApi({id:item}));});Promise.allSettled(getFilePromises).then((res)=>{this.fileList=res.map((item,index)=>......
  • Alpha阶段项目复审
    软件工程计科1班作业要求团队作业6——复审与事后分析作业目标复审与事后分析Alpha阶段项目复审小组优点缺点最终名次六佬带一坑具有高度技术性,并拥有专业的数据集和模型支持,同时可在多个终端上使用。从代码和性能图表来看,其速度快且质量高。......
  • 实验四
    task5源代码:1#pragmaonce23#include<iostream>4#include<string>56usingnamespacestd;78classTextCoder{9public:10TextCoder()=default;11TextCoder(stringstr);12stringget_ciphertext(......
  • I2S基础知识
    I2S(Inter-ICSound)总线,又称集成电路内置音频总线,是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准。采用了独立的导线传输时钟与数据信号的设计,通过将数据和时钟信号分离,避免了因时差诱发的失真。I2S总线特点如下:支持全双工和半双工模式;支持主、从模式。1、......
  • 四、搭建Ansible环境
    四、搭建Ansible环境4.1安装ansibleyum安装yuminstallansibleansibleversion源码编译安装二进制安装4.2配置ansible拷贝ansible目录(这里我们使用当前路径去加载ansible的配置文件)cp-a/etc/ansible//opt配置主机清单[redhat@masteransible]$ca......