阵列麦克风解决方案
01. AI智能语音解决方案
产品方向
●在语音交互中,大体可以分为目标信号拾取、语音增强、语音识别、语义理解、信息反馈这五个部分,其中语音识别技术已经比较成熟。我们产品的优势主要集中在语音增强部分。可提供语音交互应用中的信号拾取和语音增强技术;
●语音增强技术作为本产品的核心应用
√ 波束形成
√ 声源定位
√ 定向拾音
√ 声源分离
√ 波束形成
√ 回声抵消
√ 降噪、去混响等
AI智能语音方案:主板简介
◆ 产品采用核心板+底板结构,配置应需而变;
◆ 核心板采用TI AM57xx的ARM+DSP 多核高性能处理器;
◆ ARM核处理业务逻辑+DSP核处理音视频数据分析;
◆ DSP应用开发SDK,轻松实现音视频数据分析算法;
◆ 多路McASP 音频接口+ CSI/USB 摄像头视频输入;
◆ 可用于音视频处理,智能教育,智能机器人等AI应用领域
AI智能语音方案:阵列麦板简介
环形阵列麦克风
线形阵列麦克风
AI智能语音方案:核心板简介
SOM5728核心板
2*AMR Cortex-A15 +2*C66x DSP
AI智能语音方案:产品优势
声学指标 | ||
阵列MIC类型 | 环形阵列 | 线形阵列 |
麦克风数量 | 13麦(6+6+1)、7麦(6+1)、 8麦(4+4) | 8、4 |
波束方向 | 360° | |
有效拾音距离 | 0~10米 | 0~20米 |
有效波束宽度(3dB带宽) | 70° | 70° |
声源定位分辨率 | ≤ 20° | ≤ 30° |
声源分离数量 | 12组 | 2组 |
音频质量 | 360°高保真 | 高保真 |
语音识别率(5m、带噪) | ≥95% | ≥95% |
回声抵消 | ≥ 40 dB | ≥ 40 dB |
噪声抑制 | 信噪比提升 ≥ 10 dB | 信噪比提升 ≥ 10 dB |
AI 应用产品:AI5728产品优势
声源定位:通过获取准确的声源位置信息,可实现更多场景化应用
定向拾音:通过定向拾音技术可有效屏蔽范围外的噪音,提升语音纯净度。
波束成形:麦克风阵列的核心算法,通过波束形成算法可增强目标方向的声音指向性。
声源分离: 将音频按照发言人分离成多个声音并输出,适用更多的应用场景。
回声消除:在播放和拾音同时进行的场景,可以将扬声器的声音屏蔽,只接收用户的声音。
去混响:通过去混响算法,有效减小语音中混响的占比,得到更加纯净的声音。
噪声抑制:通过降噪算法,智能衰减拾取到的噪音,获得更清晰的音质。
AI 应用产品:AI57xx 产品应用场景
02. AM57xx的SOM核心板介绍
◆ SOM572x是信迈科技基于 TI AM5728处理器的工业级核心板。
◆ 业界超小尺寸:69mm*52mm
◆ 采用优质可靠的4*80PIN的精密BTB连接器,保证信号完整性,安装拆卸方便
◆ 两路千兆LAN, 支持EtherCAT主/从站,ProfiNet等多种工业以太网协议
◆ 最大支持10路视频输入
◆ 支持2路CAN接口
◆ 支持10路UART
◆ 支持1路USB 3.0 & 1路USB 2.0
◆ 支持3路LCD 接口
◆ 支持1路HDMI
◆ 支持8路McASP 音频接口
◆ 1路SATA接口
◆ 1路PCIe 3.0, 支持1*2-lanes 或2*1-lane
◆ 支持Linux 4.9.28、DSP RTOS系统,支持实时RT-Linux系统
◆ 工作温度范围:-40℃~85℃(工业级)
03. AM57xx处理器简介
AM5708 Cortex®-A15 based Processors
Benefits
● Single-core version of AM57x
● 3,500 ARM Cortex-A15 DMIPS
Sample Applications
● Human Machine Interface (HMI)
● Medical Imaging
● Test & Measurement
Key Features
● 1.0GHz* ARM Cortex-A15, Dual 213MHz ARM Cortex-M4; 750MHz** C66x DSP
● 1080p Video Decode/Encode
● 3D and 2D Graphics Acceleration
● Multiple Video Input Ports
● Display Subsystem
● Quad core Programmable Real-time Unit (PRU)/Industrial Communications Subsystem (2x dual core subsys.)
● USB3, PCIe
Power Estimates
● Typical Power: 1.5-3W (nominal voltage)
● Suspended Mode: <800mW
Package: 17x17mm, 0.65mm VCA
Availability:
● Samples: now
● Production: now
*Nominal voltage max freq. for Cortex-A15 is 1 GHz
**Nominal voltage max freq. for C66x DSP is 600 MHz
AM5728 Cortex®-A15 based Processors
Benefits
● Sitara’s highest performance ARM device w/DSP accelerators
● 10,500 ARM Cortex-A15 DMIPS
● Upgraded graphics performance with HD Video support
Sample Applications
● Human Machine Interface (HMI)
● Industrial PC
● Digital Signage
● High-end Navigation and Consumer
Key Features
● Dual 1.5GHz* Cortex-A15s, 213MHz M4s, and 750MHz** C66x DSPs
● 1080p Video Decode/Encode
● 3D (x2) and 2D acceleration
● Multiple Video Input Ports
● Display Subsystem
● Quad core Programmable Real-time Unit (PRU)/Industrial Communications Subsystem (2x dual core subsys.)
● USB3, PCIe, SATA
Power Estimates
● Typical Power: 2.5-4W (nominal voltage)
● Idle Power: ~650mW
Package: 23x23, 760 pin, 0.8mm
Availability:
● EVM: now
● Production: now
标签:A15,AI,DSP,Cortex,语音,AM5728,ARM From: https://blog.51cto.com/u_15812463/5725451