标签:定位 声源 麦克风 阵列 算法 信号 波束
特点
声源定位是一种被动式定位,与雷达相反,不需要传感器主动发出探测信号。
应用场景
在民用领域,声源定位技术广泛应用于大型会议、智能机器人和安防监控等场景。在大型音视频会议场景中,通过声源跟踪和语音增强可以获得更好的会议拾音效果。
改进方向
- 从麦克风阵列入手(比如改变阵列的形状)
- 从定位算法入手,针对不同的场景去改进算法。
麦克风阵列
其中URA为均匀矩形阵列,ULA是均匀线性阵列
一维阵列(线阵)
一维阵列能接收到的时空信息较少,只能定位水平方向的方位角,而不能得到声源俯仰角的信息
二维阵列
二维麦克风阵列改善了一维麦克风阵列只能给出声源方位角的缺点,它还能够计算出俯仰角。
二维麦克风相对于一维麦克风在算法复杂度和计算量上有了一定提高。
三维阵列
三维麦克风阵列是一种立体阵列,它可以对声源进行三维定位。
然三维阵列没有定位盲区且定位精度很高,但是适合该阵列的算法较少,且结构设计复杂,成本高, 计算量很大,相关研究较少。
基于到达时间差的声源定位方法(TDOA)
-
如果目标声源只有一个,外加一些环境噪声,那么TDOA可以用来指导beamformer对该方向的信号进行增强。
-
如果存在多个说话人,且说话人的方位不同,比如圆桌会议这种,那么:
- 估计的TDOA的数目可以认为是说话人的数量(speaker counting)
- 通过跟踪TDOA的变化,追踪特定的说话人
- 对同一段语音,对估计的DOA方向进行增强,增强说话人
DOA 是到达方向差,在麦克风拓扑结构已知时,DOA和TDOA可以互相转换,DOA表示信号源相对麦克风的到达角度,一般用 表示,如果是线阵的话,范围在0到180度之间。
- 到达时间差就是声源信号到达不同麦克风阵元的时间差。该算法就是利用这个时间差和麦克风阵列的结构运用几何算法来得到声源位置。
- TDOA方法用少量的麦克风即可实现声源定位
影响定位的因素:
时延估计算法
得到广泛应用的主要是广义互相关法(GCC)和自适应的最小均分算法(LMS)
指标:时延标准差
各个麦克风接收的信号会有很强的延时相关性,互相关函数可以很好的描述这些信号的延迟相关性。
方法:基本互相关法、广义互相关法、二次互相关算法、二次互相关改进算法。
基本互相关法
前提:
- 假定阵列中声传感器采集到的信号来自同一个声源
- 信号和噪声不存在相关,不同的噪声之间也不存在相关
将信号进行互相关处理,互相关函数取得最大值时的t就是所求时延。
广义互相关法(在基本互相关法的基础上,与频域加权函数相结合)(GCC)
傅里叶变换,将其从时域变换到频域,而后进行求互功率
谱、频域加权以及傅里叶反变换的运算转回时域,在时域中
找相互关方程的峰值
加权函数 |
函数表达式 |
基本特性 |
基本互相关 |
1 |
受环境噪声、接受信号长度影响大 |
PHAT |
1
标签:定位,声源,麦克风,阵列,算法,信号,波束
From: https://www.cnblogs.com/chenmo100/p/17817082.html
相关文章
- 快速SRP-PHAT多声源定位算法
目的:相位变换加权指向响应功率(SRP-PHAT)算法在低信噪比和强混响环境下具有较好的鲁棒性,但是空间遍历带来的海量计算给其声源实时定位带来了挑战。方法:提出了一种适用于多声源的随机区域收缩SRP-PHAT算法,通过最小描述长度(MDL)准则确定声源数量,利用K-means聚类算法进行空间区域划分,...... - 基于改进的MUSIC的声源定位算法
目的:针对MUSIC其分辨率低且在麦克风数目较少时DOA估计精度较差的问题。方法:利用广义互相关算法估计出声源信号到达各麦克风之间的时间差,并据此构建出对应的矢量信号,最后通过计算谱函数确定DOA估计值。结果:优化后的MUSIC算法可以得到更加尖锐的指向性波束,更低的旁瓣,并且能使方位角的...... - 关于XML浮动和定位
一、浮动浮动是指将元素从文档的正常流中移动到左侧或右侧,直到它的外边缘触碰到包含它的元素或者另一个浮动元素的边缘为止。浮动元素可以向左或向右浮动,也可以同时向左右两侧浮动。浮动元素的语法如下: <elementstyle="float:left/right/none;"></element>其中,float属性可...... - 智能安全帽_EIS智能防抖摄像头4G定位生命体征监测气体检测
智能安全帽是一种集成了多种智能功能的设备,可以在工作场景中提供全方位的安全保障和高效管理。它具备实时定位、语音对讲、健康监测和AI智能预警等多种功能,能够协助工人进行工作并提高安全保障水平。智能安全帽的应用范围越来越广泛,包括建筑、钢铁、能源、采矿、电力、通信和交...... - 移动端元素定位辅助神器-WEditor
WEditor可以做什么?编辑器能够提供辅助编写脚本,查看组件信息,调试代码等功能。移动端除了用Appium来做元素定位外,还可以通过WEditor来完成。前置环境依赖按照以win系统示例进行说明windows需要前置安装tidevice(推荐)tidevice工具链接python环境进行安装tidevice...... - Slint 中的元素定位 (Positioning) 和布局 (Layout)
基本逻辑Slint当中进行元素定位的基本逻辑是这样的:所有的可见元素都需要放置在窗口(window)中,每个元素都有x和y属性,这两个属性表示当前元素相对父元素的位置偏移。Slint计算某个元素在整个窗口中的位置时,会按照层级关系,一级一级将这个x和y的值进行累加,最终得到元素...... - spring boot智慧工厂人员定位系统源码,可寻、可视、可防、可控的一体化管控平台
随着经济的高速发展,现代制造业规模不断扩大,生产车间面积广阔,生产设备日益繁多,生产工人数量多且分散作业,难以进行有效管理和实施全方位风险管控。现代工厂安全管理极需向智慧工厂转型,通过科技手段提升安全及经济效益,成为企业生存发展的关键。智慧工厂人员定位系统通过在作业现场部署...... - css的浮动和定位
CSS是前端开发中不可或缺的一部分,其中浮动和定位是常用的布局方式。本篇博客将详细介绍浮动和定位的概念、用法和注意事项,适合新手学习。一、浮动1.概念浮动是指将元素从正常的文档流中移除,使其脱离文档流并向左或向右移动,直到其外边缘碰到包含块或另一个浮动元素的边缘为止。...... - 智能安全帽功能介绍_实时对讲/视频通话/RTK定位/气体检测
智能安全帽是一款具备工业级高清晰度摄像头和4G/WIFI网络功能的创新产品。在传统安全帽的基础上,智能安全帽集成了摄像头、语音和通信主板等模块,提供高清视频采集、语音通讯、对讲和本地视频存储等功能。通过这种穿戴式设备,不仅可以实现数据采集和实时通信,还能真正解放现场操作...... - Linux【CPU100% 问题定位】
一、场景 在我们项目部署上线的时候,我们是不是会经常去Linux服务器上查查服务器的CPU使用率,或者是运维经常会盯Linux的CPU使用率。如果CPU使用率一直100%,如何查找并解决问题?二、步骤 2.1、定位到进程 使用top和ps分析工具报告......
|