AI音箱的原理，小爱同学、天猫精灵、siri。

时间：2023-01-17 19:36:00浏览次数：45

AI音箱的原理

简单的说，音箱工作的时，麦列始终处于拾音状态（对声音进行采样，量化）。进过基本的信号处理（静音检测、降噪等），唤醒模块会判断是否出现唤醒词，是的话就进行更复杂的语音信号处理，开始真正的语音交互流程。

AI音箱的原理，小爱同学、天猫精灵、siri。_语音识别

1.前端信号的处理

1.1语音检测（VAD voice activity detection）
准确的检测音频信号的语音段起始位置，从而分离出语音段和非语音段
1.2降噪
现实环境中存在噪声，通过降低噪声的干扰，降低语音识别难度。
常用的有LMS和维纳滤波。
1.3声学回声消除（AEC）
麦克风收集声音的时候，去除自身播放的声音。否则在播放音乐的时候，人的声音可能被掩盖。
1.4去混响处理
避免声音的反射对音箱的干扰。
1.5声源定位
确定人的位置。
1.6波束形成
降噪去混响的作用

2唤醒

经过语音检测后的信息，只能音箱会在检测到唤醒词之后才开始复杂的信号处理（声源定位等）和后续的交互。

3语音交互

语音输入-语音识别-自然语言的理解-对话管理控制借口-对话管理-自然语言生出-语音合成-语音输出。

AI音箱的原理，小爱同学、天猫精灵、siri。_信号处理_02

3.1语音识别（ASR）

将语音信号转化成文本。

3.2自然语言理解（NLU）

要结合特定的使用场景和现有技术。

领域分类：根据识别命令所属领域，领域是封闭的集合。

意图分类：在相应的领域，识别用户的意图。

实体抽取：确定意图的参数。比如歌手名字和歌曲名称。

3.3对话管理：

对一些追加性的问题的优化。比如明天上海天气怎么样？北京呢？

3.4自然语音的生成（NLG）

采用预先设计的文本模块生成文本输出。

即将为您播放的歌曲是谁的什么歌。

3.5语音合成

TTS使机器能够像人一样朗读给定的文本。

标签：文本,AI,检测,音箱,siri,天猫,语音,识别,唤醒
From： https://blog.51cto.com/u_15601494/6017784

Service ‘VisualSVN HTTP Service‘ failed to start.Pleasecheck VisualSVN Serve
Service‘VisualSVNHTTPService’failedtostart.PleasecheckVisualSVNServe今天安装svn服务器端遇到的一点小问题主要是安装到最后启动svn服务的时候有点问题，因为......
Docker安装portainer图形化界面
Docker安装portainer图形化界面#拉取镜像dockerpullportainer/portainer#运行镜像dockerrun-d-p8080:9000\--restart=always-v/var/run/docker.sock:/var/run/do......
daily study 14
初识指针；指针是什么?在计算机科学中，指针(Pointer)是编程语言中的一个对象，利用地址，它的值直接指向(pointsto)存在电脑存储器中另一个地方的值。由于通过地址能找到所需......
【Azure Developer】在Github Action中使用Azure/functions-container-action@v1配置F
问题描述使用GithubAction，通过 Azure/functions-container-action@v1插件来完成yaml文件的配置，并成功部署FunctionImage的过程记录。操作步骤第一步：准备Function......
C#.Net开发chatGPT、openAI
C#/.Net开发chatGPT、openAI最近ChatGPT火爆了，自己使用了一下，确实厉害。但是使用官方网站不支持国内访问，好在国内可以使用API调用，所以自己折腾一番，使用C#来调用API。获取......
tailscal DERP服务搭建,解决netcheck: UDP is blocked问题
tailscalDERP服务搭建1.前言习惯了zerotier，但这个问题实在忍不了，就是跑不满千兆网卡，我这边最多120Mbps，这速度内网传文件真实太淡疼了，虽然有些办法可以临时解决，但总感觉......
snowboy 运行python3 examples/demo.py 报错bt_audio_service_open: connect() failed
问题：环境：虚拟机 Ubuntu14.04.6LTS(GNU/Linux4.4.0-148-genericx86_64)执行snowboyexamples案例demo.py录音之后没反应，如图：解决：sudoapt-getinstal......
The 2021 Shanghai Collegiate
D-Zztrans的班级合照如果没有对序列大小关系的限制，只需要考虑\(a_i\)应该放在第一个序列还是第二个序列，我们定义\(f_{i,j}\)表示前\(i\)个数，第二个序列放了\(j\)......
部署prysm mainnet
部署prysm下载prysmmkdir-pv/data/prysm&&cd/data/prysmcurlhttps://raw.githubusercontent.com/prysmaticlabs/prysm/master/prysm.sh--outputprysm.sh&&chm......
Portainer笔记-安装
新建数据卷[root@VM-24-9-centos~]#dockervolumecreateportainer_data拉取Portainer镜像[root@VM-24-9-centos~]#dockerpullportainer/portainer-ceUsingde......

AI音箱的原理，小爱同学、天猫精灵、siri。