机器翻译的评价指标

时间：2022-11-15 12:57:50浏览次数：55

标签：BLEU grams 机器翻译指标 groundtruth 评价句子

BLEU

BLEU方法是对待评价的句子和groundtruth的n个grams进行比较，并计算出匹配片段的个数，这些匹配片段与它们在句子中的位置无关，匹配片段数越多越好。在BLEU方法中，首先逐个句子计算n-grams的匹配个数，然后将经过裁剪的n-grams匹配数加和，再除以待评价句子的n-grams总数。

ROUGE

ROUGE算法的基本思路和BLEU差不多，不过它统计的是召回率，也就是对于groundtruth中的短语，统计一下它们有多少个出现在机器翻译的译文中，其实就是看机器翻译有多少个翻译对了，这个评价指标主要在于groundtruth中的短语都出现过，那么机器翻译的译文越长结果越好。

METEOR

METEOR放大考虑了同义词，它用知识扩充了同义词集，同时考虑了单词的词形，也就是说词干相同的词也认为是部分匹配，也应该给予一定的奖励。在评价句子流畅性的时候，用了chunk的概念，即待评价句子与groundtruth能够对齐的、空间排列上连续的单词形成一个chunk，chunk数目越少意味着每个chunk的平均长度越长，也就是说两者的语序更加一致。该方法还是用了F值作为评价指标，同时考虑了准确率和召回率。

Cider

Cider这是为图像描述任务设计的评价指标，它是BLEU和空间模型的结合。它把每个句子看文档，然后计算TF-IDF向量的余弦夹角，据此得到待评价句子和groundtruth之间的相似度，不同长度的n-grams相似度取平均值得到最终结果。图像描述任务的评价要点是看有没有抓住关键信息，比如一幅图中【白天一个人撑着一把伞】，其中的关键信息是【伞】，生成描述时如果漏掉了一些别的信息，如【白天】，其实是不重要的，所以需要对非关键词的降权操作。

标签：BLEU,grams,机器翻译,指标,groundtruth,评价,句子
From： https://www.cnblogs.com/mumuzeze/p/16887699.html

python量化指标计算talib函数功能一览表
安装talib库：pipinstalltalib 1#取个数据验证一下2set_token('')3data=history(symbol='SHSE.600519',frequency='1d',start_time='2015-01-01',......
评价及实验二总结
本次编程过程中，领航员为李金泽，他为我的工作做出了很大的帮助，因为我的编程工作几乎都是在家里完成的，所以与领航员的但部分交流也是在网上进行的。这次编程过程中，我编写了不......
17个DevOps指标
软件开发的生产力一直是很难衡量的。与其他行业不同，编程行为并不容易并行化。开发过程是独特的，因为它需要技术和沟通技能的多样化组合，这就要求有一套专门的指标......
股票指标
atr真实波幅 obv累计成交量，通过量和价格对比，可以看出主资金动向。如果有背离，一般是交易最佳时间 ad指标（散户和专业投资）SUM((CLOSE-OPEN)/(HIGH-LOW)*VOL,0) ......
一个米农对百度与谷歌的评价 …
记得之前写过几编关于百度很小气的文章,文中写道了,百度因为真的很小气,连自已相对应的baidu.net这个域名只卖十多万都没有舍得出钱买回.而被广大域名抢注者评为,......
亚马逊方法论：可控输入指标
我们在做运营时，经常会被挑战下面问题：这些指标够了吗？你做这些事情的业务价值如何度量？未来应该如何迭代？...上面问题的答案就在亚马逊的可控输入指标方法论中：亚马逊的......
评价统计量优劣的几个标准——统计学（十二）
在推断性统计中，我们需要从样本中加工提取其反映总体的信息，这就需用到统计量，发挥统计量的作用。这就提出了一个问题，什么样的统计量能达成我们的述求，能完美地提取出总体的规......
图像清晰度评价与实现方法
图像清晰度是衡量图像质量的一个重要指标，对于相机来说，其一般工作在无参考图像的模式下，所以在拍照时需要进行对焦的控制。对焦不准确，图像就会变得比较模糊不清晰。相机对焦时......
拓端tecdat|R语言代写如何找到患者数据中具有差异的指标？（PLS—DA分析）
从海量数据中发现潜在标志指标,需要借助多变量模式识别方法.无监督的模式识别方法包括主成分分析（PCA、聚类分析(HCE)等，根据模式识别模型抽提出对分类有重要贡献的指标后,......
Metric评价指标及损失函数
Error系列的指标及loss损失函数，该系列有：均方误差（MeanSquareError，MSE）平均绝对误差（MeanAbsoluteError，MAE）均方根误差（RootMeanSquareError，RMSE）均方对数误差（MeanSq......

机器翻译的评价指标

BLEU

ROUGE

METEOR

Cider

相关文章

赞助商

阅读排行