首页 > 其他分享 >声纹识别的评价指标(读书笔记)

声纹识别的评价指标(读书笔记)

时间:2022-12-27 15:00:39浏览次数:46  
标签:right 读书笔记 boldsymbol 余弦 相似 声纹识别 评价 left

目录

对于声纹识别技术,需要有统一的指标来衡量这些系统之间的优劣。声纹识别领域中通常使用等错率等指标来衡量一个系统的识别性能。

常见的声纹识别系统在识别阶段主要包括特征提取、声纹建模、相似匹配和判别这四个模块。

相似匹配模块通常有两个输入:

  1. 来自验证音频的声纹模型;
  2. 来自目标说话人的声纹模型;

输出:一个实数,称为匹配分数(score)。

假设需要匹配的声纹模型可以表示为两个嵌入码向量\(e_1\)与\(e_2\),那相似匹配可以采取以下几种形式:

1. 余弦相似度(cosine similarity)

\[\cos \left(\boldsymbol{e}_{1}, \boldsymbol{e}_{2}\right)=\frac{\boldsymbol{e}_{1} \cdot \boldsymbol{e}_{2}}{\left\|\boldsymbol{e}_{1}\right\|_{2} \cdot\left\|\boldsymbol{e}_{2}\right\|_{2}} \]

该相似度表示\(e_1\)与\(e_2\)这两个向量在多维空间中的夹角的余弦值。如果\(e_1\)和\(e_2\)是单位向量,则余弦相似度简化为这两个单位向量的点积。余弦相似度的取值范围在\([-1,1]\),便于选取全局的判别阈值,因此余弦相似度是声纹识别中最常用的相似匹配方法。

2. 欧式距离(Euclidean distance)

\[d\left(\boldsymbol{e}_{1}, \boldsymbol{e}_{2}\right)=\left\|\boldsymbol{e}_{1}-\boldsymbol{e}_{2}\right\|_{2} \]

最终的匹配分数可以取欧式距离的倒数或其它单调递减的变换。

3. 神经网络

通过可训练的神经网络或者支持向量机等机器学习模型实现更复杂的相似匹配函数\(f\left(e_{1}, e_{2} \mid \theta\right)\),这里\(\theta\)表示机器学习模型\(f(\cdot)\)的参数集合。

标签:right,读书笔记,boldsymbol,余弦,相似,声纹识别,评价,left
From: https://www.cnblogs.com/AccompanyingLight/p/17007050.html

相关文章

  • 【《硬件架构的艺术》读书笔记】09 电磁兼容性能设计指南(2)
    这一节就大致浏览一下,不细看了。9.6减少EMC/EMI的技术三个方法:1、在源头抑制发射。2、耦合路径尽可能低效。3、受体几乎不受发射影响。9.6.1系统级技术9.6.1.1展频......
  • 声纹识别技术初步了解(阅读笔记)
    目录1.声纹识别分类1.1按任务分类1.1.1声纹验证(speakerverification)1.1.2声纹辨认(speakeridentification或speakermatching)1.2按文本内容分类1.2.1文本相关1.2.......
  • 12月份读书笔记1
    对于程序员修炼之道的阅读与感悟出了问题后,要提出各种解决方案的选择,而不是找借口;不要说事情做不到,要说明接下来做什么来挽回局面;我们看到过整洁、运行良好的系统,一旦窗......
  • 12月读书笔记2
    学习与阅读《程序员修炼之道》,以下为我的感受与他人交流时,你需要了解你的听众:你想他们学到什么?他们对你讲的什么感兴趣?他们有多富有的经验?他们想要多少细节?你如何促使他们......
  • 不止Oracle 读书笔记
    Oracle由实例和数据库组成,上半部的直角方框为实例instance,下半部的圆角方框为数据库Database。实例是由一个共享内存区SGA(SystemGlobalArea)和一系列后台进程组成的,其中......
  • 梦断代码读书笔记01
    看到这本书的封面就给我一种气势磅礴的感觉——两打程序员,三年时间,4732个bug,只为打造超卓软件。看起来像是要搞一个多么伟大的工程一样,没看这本书之前,倒是对这本书有一些了......
  • 梦断代码读书笔记02
    卡普尔的团队开始问自己一个看似简单的问题:我们如何组织信息?如何对这种信息组织法建模——需要怎样的数据结构才能让计算机也能回答这个问题?软件没有磁芯。它就像洋葱般层......
  • 【《硬件架构的艺术》读书笔记】09 电磁兼容性能设计指南
     9.1简介电子线路易于接收来自其他发射器的辐射信号,这些EMI(电磁干扰)使得设备内毗邻的元件不能同时工作。这就有必要进行电磁兼容设计以避免系统内有害的电磁干扰。确保......
  • 羊城地区heyTea部分门店顾客评价数据可视化挖掘分析
    羊城地区HeyTea门店顾客评价数据可视化挖掘分析开题背景众所周知,HEYTEA,曾名“皇茶”,是一家由深圳美西西餐饮管理有限公司运营的中国连锁茶饮品牌。2012年,喜茶HEYTEA起源于......
  • 【《硬件架构的艺术》读书笔记】08 消抖技术
    8.1简介在电子设备中两个金属触点随着触点的断开闭合便产生了多个信号,这就是抖动。消抖使用来确保每一次断开或闭合触点时只有一个信号起作用的硬件设备或软件。(说人话就......