首页 > 其他分享 >每日总结2024年1月30日

每日总结2024年1月30日

时间:2024-01-30 16:44:57浏览次数:30  
标签:总结 学习 转换 音色 音频 30 2024 歌声 我们

今天完成了歌声转换的第一阶段验收。

我们小组选择的服务外包杯课题是A13 的歌声转化,我们计划实现两个方面的功能。能够选择人声,然后根据导入的歌曲,替换原声,生成新的歌曲,这是我们计划的基础目标。但是考虑到条件的局限性,我们很难让用户自行导入音色素材直接转化为需要的音色,目前计划我们团队先把音色转换好递交给程序,以供用户选择。如果时间和技术条件允许,在保证音色音质的同时,我们还打算实现人物嘴型配对上歌词,我们认为这样能够在赛道中露出锋芒,增强竞争力。

目前我们小组已经完成对音频的采集、裁剪和优化工作,因为对于AI人声转换的了解不够多,还不利于下手实践,我们小组初期先制定了学习路线,目前已经完成了吴恩达的《深度学习》课程,正在学习PyTorch深度学习框架,后续我们还将了解音频信号处理的基本原理,包括采样和傅里叶变换等等,了解音频处理中常用的特征提取方法,如梅尔频谱系数等。然后阅读与歌声转换相关的学术论文,了解目前领域的最新研究,查找GitHub上的相关项目,学习和借鉴开源代码。最后开始实际动手实现歌声转换项目。可以使用已有的开源实现进行尝试,然后逐步修改和改进。

标签:总结,学习,转换,音色,音频,30,2024,歌声,我们
From: https://www.cnblogs.com/nashacjj/p/17997426

相关文章

  • 题解 P7309 [COCI2018-2019#2] Kocka
    传送门。题意一个$N\timesN$的矩形,有从四周往内望去的第一个位置的距离,问是否存在一个矩形满足我们的观察。分析先说说我这个蒟蒻想出来的巨麻烦的方法。首先先判断最简单的矛盾,就是左右穿插,上下穿插,这是第一步。//-1变成nfor(inti=1;i<=n;++i)if(L[i]+R[i]>=n)......
  • python获取表格数据总结
    获取表格内容:图片中首先import了两个模块,一个os一个openyxl,然后指定表格路径,打开表格。os:这里os在Python中,os.chdir()方法用于改变当前的工作目录。工作目录是指当前正在执行的脚本所在的目录。通过使用os.chdir()方法,我们可以在脚本执行过程中切换到不同的目录。openy......
  • MySQL-8.0.30升级MySQL-8.0.34
    记录一次MySQL漏洞升级操作升级背景:OracleMySQL官方发布MySQL-8.0.30版本高危漏洞CVE-2022-32221、CVE-2022-37434等,受影响版本涉及到8.0.32,官方建议升级至8.0.33,最好使用8.0.34,这里我们将MySQL-8.0.30升级至MySQL-8.0.34版本方案:将原mysql目录重命名,解压新的程序目录软链接到......
  • 2024年獬豸杯 电子取证
    我使用的取证工具有取证大师,RStudioPortable,AXIOMv580,AXIOMv780根据自己情况来,多开几个一起看签到所以flag为:flag{We1c0me_t0_獬豸杯}计算机基本信息-1、计算机系统的安装日期是什么时候。(标准格式:20240120)系统痕迹-1、请问机主最近一次访问压缩包文件得到文件名称是什么......
  • 牛客周赛 Round 30
    牛客周赛Round30A代码:#include<bits/stdc++.h>usingnamespacestd;usingll=longlong;usingpii=pair<ll,ll>;#definefifirst#definesesecondusingi128=__int128_t;voidsolve(){strings;cin>>s;for(inti=0;......
  • 2024最新Win11专业版永久密钥
    Windows专业版是微软公司推出的操作系统,为商业和专业用户提供高级功能和安全性。它包括强大的管理工具、企业级安全性和支持专业应用程序的功能,满足专业用户的高级需求。Windows专业版适用于企业、组织和专业人士,提供稳定、可靠的计算环境。分享从互联网收集的密钥:5NXK3-IHHFW-......
  • 【2024.01.30】闪光灯漫展实践操作
    在漫展时候使用机顶闪的时候我常常觉得人物的曝光太大了即使是光圈开到100也是很亮结果后面基本上都是使用自然光进行拍摄场照的话,只有一项数值是固定的,光圈调到最大这样子的背景是虚化比较好看的,光会被打成好看的圆形所以我一般使用半自动光圈优先的挡位,然后ISO调整到100然......
  • 1月30日(外包杯第一阶段成果验收)
    赛题:【A25】基于大模型语料库问答背景:首先介绍一下赛题的背景,通用型大型语言模型(LLM)已经在许多任务上取得了令人瞩目的成果。一些开源的大模型知识分布虽然很全面,但是在许多特定的垂直业务领域中,由于其与通用领域之间存在较大差异,直接采用开源的通用型LLM经常无法满足该领域应用......
  • THUWC2024 游记
    前言S爆炸,去不了WC,呜呜呜。好在混给了个THUWC的名额,那还是去玩玩吧。day0t营小分队:我,@柳易辰,@tianhangj坑老师重回战场!其他高二的神仙都有约了。10点的飞机,川航。想买机上wifi,家长不让/fn/fn/fn飞机餐差评。下飞机打车直奔霸树。一进去就看见了zxx!但是我社恐......
  • Unity5.x shader打包AssetBundle总结
    unity5.x  shader打包AssetBundle总结最近比较忙,好久没有更新博客了,新项目切换到unity5.x后使用了新的打包机制,在打包shader的时候遇到了一些问题,这里来记录一下吧。 在上一个项目中,我们使用unity4.7,对于shader并没有进行依赖打包,而是由unity打包到了每个用到的AssetBundle......