首页 > 其他分享 >智能语音技术新进展与发展趋势

智能语音技术新进展与发展趋势

时间:2022-12-09 20:32:31浏览次数:39  
标签:主讲人 摘要 新进展 发展趋势 智能 语音 聚类 识别

在深度学习、大数据和大算力的推动下,以语音增强、识别和合成为代表的智能语音技术已经在众多应用中落地。特为大家整理了一些比较前言的报名,文末可免费获取

No.1


智能语音技术新进展与发展趋势

主讲人:谢磊

西北工业大学教授,博导

西工大音频语音与语言处理实验室负责人


摘要:

本次报告将结合西工大音频语音与语言处理研究组的近期研究结果和大家交流智能语音技术的发展现状,重点关注语音增强、识别和合成等方面的最新进展。同时探讨随着场景和应用的不断拓展,智能语音技术的挑战性问题以及展望未来发展。

No.2


端到端声源分离研究进展

主讲人:罗艺

PhD student at Neural acoustic processing lab (Naplab),Columbia University.


摘要:

Recent progress in deep learning methods for the task of source separation have significantly advanced the state-of-the-art. 


Among all the recent proposals, end-to-end systems that take waveform as input and directly generate waveforms have shown their advantage on both the system performance and the flexibility. In this talk, I will briefly go through some of the recent advances in the problem of end-to-end neural source separation. I will start with the general problem definition of source separation, then introduce several single-channel and multi-channel approaches, and conclude with the challenges and future works in this area.


扫码免费领取全部报告
↓↓↓


智能语音技术新进展与发展趋势_语音识别


No.3


基于深度学习的多说话人分割聚类

主讲人:张超

剑桥大学Research Associate

京东技术顾问 


摘要:

本次公开课首先介绍剑桥大学的传统多说话人分割聚类系统,该系统曾获得ASRU 2015 MGB挑战赛说话人分割聚类任务的冠军,然后介绍团队最近在使用深度神经网络实现分割聚类系统不同部分的一些工作。最后还包括了对多说话人分割聚类研究的一些热点问题的探讨,包括如何实现完整的全神经网络端到端(可训练的)系统以及如何将分割聚类与语音分离和识别进行整合。

No.4


弱标注下的声音事件检测

主讲人:王赟 

Facebook 人工智能应用研究组研究科学家

卡内基梅隆大学(CMU)计算机学院技术研究所(LTI)博士


摘要:

声音事件检测(sound event detection),是指在音频中检测枪声、狗叫等事件,并标出它们的起止时间。由于为训练数据手工标准起止时间很麻烦,所以实际训练数据常常只带有弱标注——只标注了每段声音包含的事件类型,但未标注起止时间。本场讲座讨论如何使用「多样例学习」(multiple instance learning)方法,利用弱标注数据训练声音事件检测系统,重点在于如何选取聚合函数,保持误检和漏检的平衡。本场讲座得到的经验,也可以借鉴到其它使用「多样例学习」的任务中。

No.5


智能语音发展现状以及数据集介绍

主讲人:陈果果

SEASALT.AI联合创始人

约翰霍普金斯大学博士


摘要:

针对目前语音领域问题进行分享与探讨,例:智能语音在嵌入式设备端落地时,相比于服务器端有哪些需要考虑因素;同时结合自身科研及创业经验给到科研同行、在校学生、一些实用建议,让大家少走弯路!

No.6


口音与方言语音识别研究进展

主讲人:汤志远

中科院与清华联培博士

清华博士后


摘要:

语音识别技术已广泛应用于日常生活当中,然而其在口音或方言上的性能或体验仍不尽如人意。本次报告对近几年口音与方言语音识别上的研究进展进行了快速的回顾,并进一步介绍了口音或方言语音识别相关的数据、基准和竞赛,以及一些可行的研究方向。


扫码免费领取全部报告
↓↓↓


智能语音技术新进展与发展趋势_语音识别


标签:主讲人,摘要,新进展,发展趋势,智能,语音,聚类,识别
From: https://blog.51cto.com/u_12127193/5926464

相关文章

  • SDK 接入|游戏语音之“范围语音”接入实践
    语音是线上游戏用户的主要交流方式,大多数用户会通过游戏中的内置语音功能与其他玩家沟通,而一些用户在游戏没有内置语音功能的情况下,通过其他语音软件与玩家沟通。并且,游戏......
  • 文字转语音
    文字转语音方法有:1.百度TTS可直接用浏览器访问https://tts.baidu.com/text2audio?tex=helloworld&cuid=baike&lan=ZH&ie=utf-8&ctp=1&pdt=301&vol=9&rate=32&per=02.p......
  • 语音信号处理 代码运行
    1.在这个目录下运行PSD:\研一课程\语音信号处理\大作业\projectinstructions\gridspace-stanford-harper-valley-master\experiments\scripts> python.\run.py..\co......
  • 人机语音交互的原则
    ......
  • iOS开发之模仿语音聊天时,显示的音量图
    因为项目中有涉及到语音的内容,所以在这里实现一下说话时语音的音量图的展示具体内容查看代码,有注释语音内容的工具类:staticidinstance;#pragmamark-单例+(instancetyp......
  • 云边端协同EasyCVR语音对讲配置的注意事项汇总
    EasyCVR视频融合云服务基于云边端一体化架构,具有强大的数据接入、处理及分发能力,平台支持海量视频汇聚管理,可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告......
  • 【第7篇】AI语音交互原理介绍
    本章主要介绍AI语音交互的原理,包括语音交互的流程以及各流程节点所涉及的相关知识,如语音采集、语音识别、自然语言处理、语音合成等。2.1AI语音交互AI语音交互通俗点说......
  • 【语音SBC算法】基于正交滤波器组的语音SBC算法设计与实现
    数字语音编码是现代数字语音通信以及数字语音存储回放的前提和基础,对数字语音通信系统和数字语音存储回放系统的性能具有决定性的作用。目前,主要从编码速率、时延、语音回......
  • angularjs解决播放语音出错的问题
    首先是看了github上的这个​​https://github.com/angular/angular.js/issues/1352​​,知道了语音播放不了了,下面是正确的播放代码首先添加过滤器app.filter("trustUrl",['......
  • c语音全局变量与静态全局变量和静态局部变量代码区常量const
    1全局变量可以跨文件使用2、全局变量可以多次声明,但是定义值只能定义一次。3、静态全局变量只能限定本文件使用。4、局部静态变量只能再局部代码块里面才能访问。5、局......