首页 > 其他分享 >AI音箱的原理,小爱同学、天猫精灵、siri。

AI音箱的原理,小爱同学、天猫精灵、siri。

时间:2023-01-17 19:36:00浏览次数:45  
标签:文本 AI 检测 音箱 siri 天猫 语音 识别 唤醒


AI音箱的原理

简单的说,音箱工作的时,麦列始终处于拾音状态(对声音进行采样,量化)。进过基本的信号处理(静音检测、降噪等),唤醒模块会判断是否出现唤醒词,是的话就进行更复杂的语音信号处理,开始真正的语音交互流程。

AI音箱的原理,小爱同学、天猫精灵、siri。_语音识别

1.前端信号的处理

1.1语音检测(VAD voice activity detection)
准确的检测音频信号的语音段起始位置,从而分离出语音段和非语音段
1.2降噪
现实环境中存在噪声,通过降低噪声的干扰,降低语音识别难度。
常用的有LMS和维纳滤波。
1.3声学回声消除(AEC)
麦克风收集声音的时候,去除自身播放的声音。否则在播放音乐的时候,人的声音可能被掩盖。
1.4去混响处理
避免声音的反射对音箱的干扰。
1.5声源定位
确定人的位置。
1.6波束形成
降噪去混响的作用

2唤醒

经过语音检测后的信息,只能音箱会在检测到唤醒词之后才开始复杂的信号处理(声源定位等)和后续的交互。

3语音交互

语音输入-语音识别-自然语言的理解-对话管理控制借口-对话管理-自然语言生出-语音合成-语音输出。

AI音箱的原理,小爱同学、天猫精灵、siri。_信号处理_02


3.1语音识别(ASR)

将语音信号转化成文本。

3.2自然语言理解(NLU)

要结合特定的使用场景和现有技术。

领域分类:根据识别命令所属领域,领域是封闭的集合。

意图分类:在相应的领域,识别用户的意图。

实体抽取:确定意图的参数。比如歌手名字和歌曲名称。

3.3对话管理:

对一些追加性的问题的优化。比如明天上海天气怎么样?北京呢?

3.4自然语音的生成(NLG)

采用预先设计的文本模块生成文本输出。

即将为您播放的歌曲是谁的什么歌。

3.5语音合成

TTS使机器能够像人一样朗读给定的文本。


标签:文本,AI,检测,音箱,siri,天猫,语音,识别,唤醒
From: https://blog.51cto.com/u_15601494/6017784

相关文章

  • Service ‘VisualSVN HTTP Service‘ failed to start.Pleasecheck VisualSVN Serve
    Service‘VisualSVNHTTPService’failedtostart.PleasecheckVisualSVNServe今天安装svn服务器端遇到的一点小问题主要是安装到最后启动svn服务的时候有点问题,因为......
  • Docker安装portainer图形化界面
    Docker安装portainer图形化界面#拉取镜像dockerpullportainer/portainer#运行镜像dockerrun-d-p8080:9000\--restart=always-v/var/run/docker.sock:/var/run/do......
  • daily study 14
    初识指针;指针是什么?在计算机科学中,指针(Pointer)是编程语言中的一个对象,利用地址,它的值直接指向(pointsto)存在电脑存储器中另一个地方的值。由于通过地址能找到所需......
  • 【Azure Developer】在Github Action中使用Azure/functions-container-action@v1配置F
    问题描述使用GithubAction,通过 Azure/functions-container-action@v1插件来完成yaml文件的配置,并成功部署FunctionImage的过程记录。 操作步骤第一步:准备Function......
  • C#.Net开发chatGPT、openAI
    C#/.Net开发chatGPT、openAI最近ChatGPT火爆了,自己使用了一下,确实厉害。但是使用官方网站不支持国内访问,好在国内可以使用API调用,所以自己折腾一番,使用C#来调用API。获取......
  • tailscal DERP服务搭建,解决netcheck: UDP is blocked问题
    tailscalDERP服务搭建1.前言习惯了zerotier,但这个问题实在忍不了,就是跑不满千兆网卡,我这边最多120Mbps,这速度内网传文件真实太淡疼了,虽然有些办法可以临时解决,但总感觉......
  • snowboy 运行python3 examples/demo.py 报错bt_audio_service_open: connect() failed
    问题:环境:虚拟机  Ubuntu14.04.6LTS(GNU/Linux4.4.0-148-genericx86_64)执行snowboyexamples案例demo.py录音之后没反应,如图:  解决:sudoapt-getinstal......
  • The 2021 Shanghai Collegiate
    D-Zztrans的班级合照如果没有对序列大小关系的限制,只需要考虑\(a_i\)应该放在第一个序列还是第二个序列,我们定义\(f_{i,j}\)表示前\(i\)个数,第二个序列放了\(j\)......
  • 部署prysm mainnet
    部署prysm下载prysmmkdir-pv/data/prysm&&cd/data/prysmcurlhttps://raw.githubusercontent.com/prysmaticlabs/prysm/master/prysm.sh--outputprysm.sh&&chm......
  • Portainer笔记-安装
    新建数据卷[root@VM-24-9-centos~]#dockervolumecreateportainer_data拉取Portainer镜像[root@VM-24-9-centos~]#dockerpullportainer/portainer-ceUsingde......