首页 > 其他分享 >NLP基础:HMM

NLP基础:HMM

时间:2023-02-06 16:37:43浏览次数:45  
标签:NLP 概率 Inference Algorithm 硬币 基础 HMM 参数 序列


文章目录

  • ​​问题场景-扔不均衡硬币​​
  • ​​Q1 Inference Problem​​
  • ​​Q2 估计参数的过程​​
  • ​​Q3:预测序列​​
  • ​​应用场景:词性标注Pos​​
  • ​​问题一:给定模型参数,找出最适合的z​​
  • ​​问题二:Inference Problem​​
  • ​​Forward Algorithm​​
  • ​​Backward Algorithm​​
  • ​​问题三:Estimate​​


(6号上午整理完毕)

问题场景-扔不均衡硬币

假设现在有两枚质地不均匀的硬币A和B,硬币A为正的概率是NLP基础:HMM_应用场景,硬币B为正的概率为NLP基础:HMM_机器学习_02。那么现在有这样一种情况:小明在扔硬币,我不知道小明扔的什么硬币(A或B),我只能看到硬币抛出后得到的结果正反的观测序列。

在这个场景下,有三个不确定的要素:小明第一次扔时选择扔硬币A还是扔硬币B的概率;小明当下选了某硬币后接下来可能要选扔哪枚硬币的转移概率;扔出的硬币得正反面的概率。

NLP基础:HMM_自然语言处理_03


上述隐变量生成观测序列的过程,即称为隐马尔可夫模型。隐马有三个基本问题:

Q1 Inference Problem

假如知道模型参数的情况下,如何去根据观测值来反推背后隐藏变量的值? --> 维特比算法

(通过硬币的正反来推出这个硬币是A还是B)

Q2 估计参数的过程

知道观测到的序列值,估计模型的参数; --> EM算法
(通过硬币的正反序列来推出硬币A和B的正反面的概率,以及第一次选硬币是A还是B的概率)

Q3:预测序列

已知模型参数的情况下,如何计算一个观测序列的概率?
(求硬币某一个正反序列发生的概率)

应用场景:词性标注Pos

问题一:给定模型参数,找出最适合的z

方案一:考虑所有可能的值;

方案二:FB Algorithm

方案三:维特比

问题二:Inference Problem

Forward Algorithm

Backward Algorithm

问题三:Estimate


标签:NLP,概率,Inference,Algorithm,硬币,基础,HMM,参数,序列
From: https://blog.51cto.com/u_15955938/6039469

相关文章

  • NLP基础-准确分词(使用工具分词)
    关于NLP相关包安装配置,可以参考:​NLP工具包安装配置​​关于分词的原理可以参考:自然语言处理NLP-隐马尔科夫)1.加载字典来保证词可以分准对一些专业的名词来说,使用原有的词......
  • NLP基础-词性标注应用去除停用词
    词性标注-去除停用词词性标注就是对分词后的词性进行标识,通常分词后其词性也就直接输出了,而词性标注的应用就是可以通过词性来进行过滤(去除助词停用词等),从而得到更有效的......
  • NLP基础-命名实体识别(一)基于规则
    命名实体识别命名实体识别(NamedEntityRecognition,简称NER)与自动分词,词性标注一样,命名实体识别也是自然语言处理中的一个基础任务,其目的是识别语料中的人名、地名、组织机......
  • 计算机多媒体应用基础
    计算机基础(03)多媒体应用基础3多媒体应用基础3.1多媒体技术概述3.1.1多媒体基础概念@1媒体与多媒体:从一般意义上讲,在计算机或通讯领域,媒体是指信息的载体或者信息的......
  • 技术工作中怎么去提高基础
    技术工作中怎么去提高基础公众号:diting_dapeng,关注我领取更多学习资料做技术,我们经常听到的一句话是:基础很重要,一定要打好基础啊。我们都知道基础很重要,那么对于我们来说,什......
  • RT-Thread stm32 基础记录
    准备工作安装RT-ThreadStudio。新建Nano工程打开IDE,点击【文件】-【新建】-【RT-Thread项目】:进入新建工程的配置向导:注:可以通过修改board.c的 ​​SystemClock_Co......
  • 软件测试基础(一)
    一.测试相关概念IT:InformationTechnology,即信息科技和产业的意思。软件:一系列按照特定顺序组织的计算机数据和指令的集合,程序+数据+文件。产品:能够供给市场,被人们使用......
  • 《区块链基础知识25讲》-第九讲-记录所有权
    把交易历史记录作为当前所有权的证明依据。需要:找到一份不仅是声称某人是某物所有者的账本记录,而且还提供所有权的证据文件,从而作为所有权的证明。每一次所有权的交易通过交......
  • 《区块链基础知识25讲》-第十讲-哈希算法
    无论输入数据的大小及类型如何,均可以将输入数据转换成固定长度的输出加密哈希算法拥有的特征能为任意类型的数据快速创建哈希值确定性:相同输入必定产生相同哈希值,换句话说,......
  • 《区块链基础知识25讲》-第十二讲-确保账户安全
    区块链使用非对称加密技术是为了确认所有者跟资产的对应关系,确保只有合法所有者才能获取他的资产用户使用公钥来确认给某账户转移资产,只有拥有私钥的人才能获取这些资产加密......