首页 > 编程语言 >python3解析wav文件获取dtmf值

python3解析wav文件获取dtmf值

时间:2024-08-03 11:39:35浏览次数:16  
标签:文件 dtmf DTMF 获取 按键 wav python3

操作系统 :Windows 10_x64

Python版本:3.9.2

从事FreeSwitch相关工作,大概率会遇得到DTMF,DTMF的传递方式有三种:
  • In-band
  • RFC2833
  • SIP-INFO

使用RFC2833或SIP-INFO传递方式的DTMF,FreeSwitch可以在日志中打印出来,但遇到inband模式的DTMF,FreeSwitch的日志就打印不出来了。

如果是会议场景,使用In-band模式(比如固话)发送DTMF,DTMF按键的声音和音频流混合在一起发送到对端:

1)在传输过程转换为2833格式dtmf后,会添加2833格式的DTMF按键信息,混合在音频流里面的DTMF按键未移除;

2)会出现在会议系统中可以听到座机传来的DTMF按键音。

这个问题目前没有比较好的解决办法,这里记录一下。但这个问题引发了我的思考:

In-band模式的DTMF能识别吗?如果可以识别,怎么识别?

今天整理下In-band模式DTMF识别的笔记。我将从以下几个方面进行展开:

  • DTMF介绍

  • 如何生成包含DTMF按键音的wav文件

  • 如何使用python脚本解析wav文件获取DTMF按键值

  • 运行效果截图及配套资源下载

一、DTMF介绍

DTMF信号即双音多频信号,网上介绍的资料比较多,这里主要关注的是频率信息,可以参考下pypi上关于DTMF的介绍:
https://pypi.org/project/dtmf/

二、生成包含DTMF按键音的wav文件

1、使用Audacity生成wav文件

Audacity版本:3.1.3这里使用Audacity进行噪音文件的生成,如果不了解Audacity软件,可参考这篇文章:

https://www.cnblogs.com/MikeZhang/p/audacity2022022.html

1)选择"生成->DTMF音..."

2)生成0123456789音频

3)导出音频

这里使用8000hz导出音频。

如果想直接使用导出的音频文件(dtmf-au.wav),可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

2、使用软电话模拟inband模式生成wav文件

1)配置软电话,使用inband模式

 2)用会议室模拟通话过程的DTMF按键

conference test bgdial user/1001
conference test bgdial user/1002

1001按键,在会议室的1002可以听见按键音(按键值:123456789*0#)。

3)执行会议室录音

命令如下:

conference test recording start /tmp/dtmf-fs.wav

这里描述下大概流程,如果想直接使用导出的音频文件(dtmf-fs.wav),可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

三、python解析wav文件获取DTMF按键值

在GitHub上找到一个解析dtmf的库:

https://github.com/ribt/dtmf-decoder

 如果无法打开,可从文末提供的渠道获取下载的源码压缩包。

其核心是 dtmf.py 文件,运行效果如下:

 也可直接使用我修改过的代码(dtmf2.py):

完整代码可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

运行效果如下:

四、资源下载

本文涉及源码及相关文件,可从如下途径获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

 好,就这么多了,别忘了点赞哈! 

标签:文件,dtmf,DTMF,获取,按键,wav,python3
From: https://www.cnblogs.com/MikeZhang/p/18340275/pyDecodeDtmf20240803

相关文章

  • python3之语音合成pyttsx3库使用
    pyttsx3pyttsx3是一个Python库,‌用于将文本转换为语音输出。‌它支持多种操作系统,‌包括Windows和macOS,‌并且提供了丰富的功能来控制文本到语音的转换过程。‌importpyttsx3msg="HelloWorld!"pyttsx3.speak(msg)engine=pyttsx3.init()engine.say(msg)engine.run......
  • 戴尔电脑驱动更新/(声卡驱动错误)The Waves audio driver is not supported by vour cur
    1.问题我这里的声卡驱动发生了一些问题,导致了MaxxAudioPro报错:TheWavesaudiodriverisnotsupportedbyvourcurrentaudiocodec.的报错2.解决参考:Fix-maxxaudiopronotworkingwindows11|"thewavesaudiodriverisnotsupportedbyaudiocodec"不要用驱动精......
  • 【视频讲解】Python用LSTM、Wavenet神经网络、LightGBM预测股价
    原文链接:https://tecdat.cn/?p=37184原文出处:拓端数据部落公众号 分析师:YuyanYe在金融科技的浪潮中,量化投资方法以其数据驱动和模型导向的特性,日益成为资本市场分析的重要工具。特别是,长短期记忆网络(LSTM)、Wavenet以及LightGBM等先进的机器学习算法,因其在时间序列预测中的卓......
  • python3 unittest+BeautifulReport单个进程输出多个测试报告
    最近一个项目中需要由于输出的案例内容非常多(上万条),导致BeautifulReport输出的报告内容非常大(几百兆)。浏览器无法正常处理这么大的测试报告,就算打开了,也不方便阅读和处理,因此需要将报告分成多个输出。经修改代码,发现单个进程内输出多个测试报告出现问题:第一个测试报告能正常数据......
  • Centos7 安装 Python3环境,兼容python2
     一、安装Python3查看是否已经安装Python。Centos7默认安装了python2.7.5.因为一些命令要用它比如yum它使用的是python2.7.5。使用python-V命令查看一下是否安装Python。 然后使用命令whichpython查看一下Python可执行文件 安装依赖yuminstallzlib-develbz......
  • 我正在制作一个可以打开wav文件的python程序,我想知道wav文件的格式是什么
    因此,我已经通过此网站的研究编写了验证并读取wav标头的代码。但我想知道,data段中的数据是如何存储的?它们位于16位部分中,彼此相邻放置。我认为在Audacity中制作440hz正弦波,然后导出它,会显示一些结果,并且字节确实看起来更整齐,但仍然像废话一样接缝。相信我,我已经......
  • Python\Python312\Lib\site-packages\torch\lib\fbgemm.dll
    在此处输入图像描述我正在尝试从HuggingFace导入GPT-2变压器模型,但当我尝试导入它时,遇到错误。即使当我尝试仅导入Torch时,我也会收到相同的错误。我已尝试重新安装Torch并完成了所有操作,包括更新VisualC++Redistributable软件包和更新我的驱动程序,但问题......
  • PCM与WAV
    PCM(PulseCodeModulation)原理与工作机制模拟信号采样:PCM的工作流程始于对模拟信号的采样。在固定的时间间隔内,对模拟信号的幅度进行测量,这个过程称为采样。采样的频率称为采样率。量化:将每个采样点的幅度值转化为一个离散的数字值。量化过程中会引入一定的误差,称为量化误......
  • 我没有 python 但我有 python3
    我最近格式化了我的笔记本电脑并安装了Ubuntu操作系统。我没有明确安装Python。为了检查它是否已预安装,我在终端中运行python--version并得到了这个:$python--versionCommand'python'notfound,butcanbeinstalledwith:sudoaptinstallpython3......
  • 在python3.8虚拟环境 执行pip 安装Excel的库
    1、在开始菜单打开Anacondaprompt(anaconda3) 2、查看环境列表 3、进入虚拟环境 4、在虚拟换进下使用清华源安装读取excel的库和写入excel的库读取Excel文件的库:pipinstallxlrd-ihttps://pypi.tuna.tsinghua.edu.cn/simple 写入Excel文件的库:pipinstallxlwt......