在深度学习、大数据和大算力的推动下,以语音增强、识别和合成为代表的智能语音技术已经在众多应用中落地。特为大家整理了一些比较前言的报名,文末可免费获取。
No.1
智能语音技术新进展与发展趋势
主讲人:谢磊
西北工业大学教授,博导
西工大音频语音与语言处理实验室负责人
摘要:
本次报告将结合西工大音频语音与语言处理研究组的近期研究结果和大家交流智能语音技术的发展现状,重点关注语音增强、识别和合成等方面的最新进展。同时探讨随着场景和应用的不断拓展,智能语音技术的挑战性问题以及展望未来发展。
No.2
端到端声源分离研究进展
主讲人:罗艺
PhD student at Neural acoustic processing lab (Naplab),Columbia University.
摘要:
Recent progress in deep learning methods for the task of source separation have significantly advanced the state-of-the-art.
Among all the recent proposals, end-to-end systems that take waveform as input and directly generate waveforms have shown their advantage on both the system performance and the flexibility. In this talk, I will briefly go through some of the recent advances in the problem of end-to-end neural source separation. I will start with the general problem definition of source separation, then introduce several single-channel and multi-channel approaches, and conclude with the challenges and future works in this area.
扫码免费领取全部报告
↓↓↓
No.3
基于深度学习的多说话人分割聚类
主讲人:张超
剑桥大学Research Associate
京东技术顾问
摘要:
本次公开课首先介绍剑桥大学的传统多说话人分割聚类系统,该系统曾获得ASRU 2015 MGB挑战赛说话人分割聚类任务的冠军,然后介绍团队最近在使用深度神经网络实现分割聚类系统不同部分的一些工作。最后还包括了对多说话人分割聚类研究的一些热点问题的探讨,包括如何实现完整的全神经网络端到端(可训练的)系统以及如何将分割聚类与语音分离和识别进行整合。
No.4
弱标注下的声音事件检测
主讲人:王赟
Facebook 人工智能应用研究组研究科学家
卡内基梅隆大学(CMU)计算机学院技术研究所(LTI)博士
摘要:
声音事件检测(sound event detection),是指在音频中检测枪声、狗叫等事件,并标出它们的起止时间。由于为训练数据手工标准起止时间很麻烦,所以实际训练数据常常只带有弱标注——只标注了每段声音包含的事件类型,但未标注起止时间。本场讲座讨论如何使用「多样例学习」(multiple instance learning)方法,利用弱标注数据训练声音事件检测系统,重点在于如何选取聚合函数,保持误检和漏检的平衡。本场讲座得到的经验,也可以借鉴到其它使用「多样例学习」的任务中。
No.5
智能语音发展现状以及数据集介绍
主讲人:陈果果
SEASALT.AI联合创始人
约翰霍普金斯大学博士
摘要:
针对目前语音领域问题进行分享与探讨,例:智能语音在嵌入式设备端落地时,相比于服务器端有哪些需要考虑因素;同时结合自身科研及创业经验给到科研同行、在校学生、一些实用建议,让大家少走弯路!
No.6
口音与方言语音识别研究进展
主讲人:汤志远
中科院与清华联培博士
清华博士后
摘要:
语音识别技术已广泛应用于日常生活当中,然而其在口音或方言上的性能或体验仍不尽如人意。本次报告对近几年口音与方言语音识别上的研究进展进行了快速的回顾,并进一步介绍了口音或方言语音识别相关的数据、基准和竞赛,以及一些可行的研究方向。
扫码免费领取全部报告
↓↓↓