今天完成了歌声转换的第一阶段验收。
我们小组选择的服务外包杯课题是A13 的歌声转化,我们计划实现两个方面的功能。能够选择人声,然后根据导入的歌曲,替换原声,生成新的歌曲,这是我们计划的基础目标。但是考虑到条件的局限性,我们很难让用户自行导入音色素材直接转化为需要的音色,目前计划我们团队先把音色转换好递交给程序,以供用户选择。如果时间和技术条件允许,在保证音色音质的同时,我们还打算实现人物嘴型配对上歌词,我们认为这样能够在赛道中露出锋芒,增强竞争力。
目前我们小组已经完成对音频的采集、裁剪和优化工作,因为对于AI人声转换的了解不够多,还不利于下手实践,我们小组初期先制定了学习路线,目前已经完成了吴恩达的《深度学习》课程,正在学习PyTorch深度学习框架,后续我们还将了解音频信号处理的基本原理,包括采样和傅里叶变换等等,了解音频处理中常用的特征提取方法,如梅尔频谱系数等。然后阅读与歌声转换相关的学术论文,了解目前领域的最新研究,查找GitHub上的相关项目,学习和借鉴开源代码。最后开始实际动手实现歌声转换项目。可以使用已有的开源实现进行尝试,然后逐步修改和改进。
标签:总结,学习,转换,音色,音频,30,2024,歌声,我们 From: https://www.cnblogs.com/nashacjj/p/17997426