首页 > 其他分享 >机器翻译的评价指标

机器翻译的评价指标

时间:2022-11-15 12:57:50浏览次数:51  
标签:BLEU grams 机器翻译 指标 groundtruth 评价 句子

BLEU

BLEU方法是对待评价的句子和groundtruth的n个grams进行比较,并计算出匹配片段的个数,这些匹配片段与它们在句子中的位置无关,匹配片段数越多越好。在BLEU方法中,首先逐个句子计算n-grams的匹配个数,然后将经过裁剪的n-grams匹配数加和,再除以待评价句子的n-grams总数。

ROUGE

ROUGE算法的基本思路和BLEU差不多,不过它统计的是召回率,也就是对于groundtruth中的短语,统计一下它们有多少个出现在机器翻译的译文中,其实就是看机器翻译有多少个翻译对了,这个评价指标主要在于groundtruth中的短语都出现过,那么机器翻译的译文越长结果越好。

METEOR

METEOR放大考虑了同义词,它用知识扩充了同义词集,同时考虑了单词的词形,也就是说词干相同的词也认为是部分匹配,也应该给予一定的奖励。在评价句子流畅性的时候,用了chunk的概念,即待评价句子与groundtruth能够对齐的、空间排列上连续的单词形成一个chunk,chunk数目越少意味着每个chunk的平均长度越长,也就是说两者的语序更加一致。该方法还是用了F值作为评价指标,同时考虑了准确率和召回率。

Cider

Cider这是为图像描述任务设计的评价指标,它是BLEU和空间模型的结合。它把每个句子看文档,然后计算TF-IDF向量的余弦夹角,据此得到待评价句子和groundtruth之间的相似度,不同长度的n-grams相似度取平均值得到最终结果。图像描述任务的评价要点是看有没有抓住关键信息,比如一幅图中【白天一个人撑着一把伞】,其中的关键信息是【伞】,生成描述时如果漏掉了一些别的信息,如【白天】,其实是不重要的,所以需要对非关键词的降权操作。

标签:BLEU,grams,机器翻译,指标,groundtruth,评价,句子
From: https://www.cnblogs.com/mumuzeze/p/16887699.html

相关文章

  • python量化指标计算talib函数功能一览表
    安装talib库:pipinstalltalib 1#取个数据验证一下2set_token('')3data=history(symbol='SHSE.600519',frequency='1d',start_time='2015-01-01',......
  • 评价及实验二总结
    本次编程过程中,领航员为李金泽,他为我的工作做出了很大的帮助,因为我的编程工作几乎都是在家里完成的,所以与领航员的但部分交流也是在网上进行的。这次编程过程中,我编写了不......
  • 17个DevOps指标
         软件开发的生产力一直是很难衡量的。与其他行业不同,编程行为并不容易并行化。开发过程是独特的,因为它需要技术和沟通技能的多样化组合,这就要求有一套专门的指标......
  • 股票指标
    atr真实波幅 obv累计成交量,通过量和价格对比,可以看出主资金动向。如果有背离,一般是交易最佳时间 ad指标(散户和专业投资)SUM((CLOSE-OPEN)/(HIGH-LOW)*VOL,0) ......
  • 一个米农对 百度  与 谷歌 的评价 …
    记得之前写过几编关于百度很小气的文章,文中写道了,百度因为真的很小气,连自已相对应的baidu.net这个域名只卖十多万都没有舍得出钱买回.而被广大域名抢注者评为,​......
  • 亚马逊方法论:可控输入指标
    我们在做运营时,经常会被挑战下面问题:这些指标够了吗?你做这些事情的业务价值如何度量?未来应该如何迭代?...上面问题的答案就在亚马逊的可控输入指标方法论中:亚马逊的......
  • 评价统计量优劣的几个标准——统计学(十二)
    在推断性统计中,我们需要从样本中加工提取其反映总体的信息,这就需用到统计量,发挥统计量的作用。这就提出了一个问题,什么样的统计量能达成我们的述求,能完美地提取出总体的规......
  • 图像清晰度评价与实现方法
    图像清晰度是衡量图像质量的一个重要指标,对于相机来说,其一般工作在无参考图像的模式下,所以在拍照时需要进行对焦的控制。对焦不准确,图像就会变得比较模糊不清晰。相机对焦时......
  • 拓端tecdat|R语言代写如何找到患者数据中具有差异的指标?(PLS—DA分析)
    从海量数据中发现潜在标志指标,需要借助多变量模式识别方法.无监督的模式识别方法包括主成分分析(PCA、聚类分析(HCE)等,根据模式识别模型抽提出对分类有重要贡献的指标后,......
  • Metric评价指标及损失函数
    Error系列的指标及loss损失函数,该系列有:均方误差(MeanSquareError,MSE)平均绝对误差(MeanAbsoluteError,MAE)均方根误差(RootMeanSquareError,RMSE)均方对数误差(MeanSq......