首页 > 其他分享 >“我要做小小瑶大人的狗!”

“我要做小小瑶大人的狗!”

时间:2023-04-21 13:36:12浏览次数:44  
标签:小小 狗叫 音频 论文 benchmark 大人 我要 任务 Speak


“我要做小小瑶大人的狗!”_大数据

小轶:这真的是白鹡鸰写的

作为21世纪新时代人格健全精神独立心理健康的有志青年,总有那么几个时刻,会让我们情不自禁,眼泪从嘴角流下地呐喊着:

“我是XXX的狗!”

啊!这诚恳、真挚,热烈的情感真是令人动容!如此质朴的愿望,纯洁的心意,怎么能只是口头说说,而不进行实践呢?四肢着地匍匐前进确实不太符合人类的身体构造,但是狗叫呢?狗叫还是很容易的吧?

我们善解人意的岛国邻居,充分理解了羞涩内敛的大家,迫于矜持无法拉下面子狂吠的心理,于是,由日本学术振兴会赞助,立命馆大学隆重推出了“我不做人了!”任务第一弹:人狗语音转换!如何?惊不惊喜?意不意外?


“我要做小小瑶大人的狗!”_机器学习_02

论文题目:
Speak Like a Dog: Human to Non-human creature Voice Conversion

论文链接:
https://arxiv.org/abs/2206.04780

在看到这个任务的第一眼,我还试图用凡人的思路去揣测它的逻辑,还认真思考了一下目前动物语言学的发展程度。难道研究者已经完全理解了狗的语言,发现了它们真的有如此丰富的词汇,并且能够将人类的语言与之一一对应地翻译了?为什么人类的语言之间都还没有做到的事情,却能在人狗之间实现?怀揣着对黑科技的憧憬,我打开了论文。

对不起,是我唐突了。这是一个纯粹而高尚的变声任务。


“我要做小小瑶大人的狗!”_算法_03

任务的输入是人声音频,输出是合成的狗叫音频。数据音源中,包含503段人类的声音,自收集了成年犬792段和幼崽288段叫声。论文采用音频合成领域经典的StarGAN和ACVAE作为benchmark,并设计了三个主观定性指标:输出音频和狗叫声的相似度,音频质量,声音清晰度;还有一个量化指标,角色偏差程度用于评估模型的效果。目前为止,benchmark在测试中遥遥领先。


“我要做小小瑶大人的狗!”_人工智能_04

有没有可能,这是诡计多端的科研人员的新式诈骗经费方法?不,绝不可能!请不要以如此肤浅的想法来揣测这篇论文的作者们!他们雄心壮志,要建立“我不做人了!”系列任务的发布范式。你看,新鲜的数据集,完整的评估体系,健全的benchmark,这已经达成了一个新研究挑战的必备条件了啊!只要沿着这个模版一路走下去,未来Speak like a cat,Speak like a jellyfish等任务就可以层出不穷,绵延不绝了!来吧,前方是一片尚未开拓,广袤的研究空间,不要担心任务的意义和有效性,现在入坑,十年之后,你就是“我不做人了!”研究领域的学术泰斗!


标签:小小,狗叫,音频,论文,benchmark,大人,我要,任务,Speak
From: https://blog.51cto.com/xixiaoyao/6212582

相关文章

  • 5 加餐(一)| 大学毕业,我要不要留在一线城市互联网公司?
    你好,我是乔新亮。前面我们聊了许多有关职业发展的基础认知。在加餐部分,我想将这些认知串联起来,回答一些在成长中,你可能会实际遇到的问题。前段时间,我和团队内外许多年轻的同学们聊了聊,大家都在讨论“那位28岁退休的字节跳动程序员”,还引用了网络上比较火的一个词,叫做:“逃离北上广......
  • 【2023.04.06】我要否定“为善不欲人知”
    从小到大家人给我的教育就是做好事不要留名,这是做好事的最高境界,因为做好事留名的话,也许会让别人觉得你贪慕名声,你是个爱慕虚荣的人像我自己的话,每个月都会固定捐款给山区孩子,或许是“为善不欲人知”的想法,我从来没有炫耀过我自己做过的这些事,因为我不想将我的道德“强行”施加给......
  • 魔王大人的打工日常 (贪心) 2023年“华为”杯广东工业大学第十七届程序设计竞赛
      思路:去除无用信息, 贪心发现:不论数列是怎样的一个排序,当交换2个数的时候,一定会有r-l的变化,这个变化不管是+1,还是-1,转化为奇偶性的时候就可以全部当成+1就彳于了......
  • 如果我要开发一个中小学生学习的数学软件,我应该找谁去做用户调研
    如果我去开发一个中小学数学学习数学的软件,那么首先我会知道这个软件的绝大部分受众用户是中小学生,对于学习当然是自己对自己的学习情况和方法最为了解,因此我会用调查问卷并实地去询问一些中小学生的意见和学习方法。其次由于中小学生可能并不会具有较好的学习方法以及习惯,因此我......
  • 小小知识点-tag
    1、trunk是带着tag标识转发的,除了默认vlan可以不带tag标识2、access转发出去不带tag标识SW1:<sw1>displaycurrent-configuration #sysnamesw1#vlanbatch1020#clusterenablentdpenablendpenable#dropillegal-macalarm#diffservdomaindefault#drop-profil......
  • 头铁面试官:一个小小的 System.out.println 硬是考了我半个小时,被问懵了。。
    来源:cnblogs.com/blessing2022/p/16622118.html去年秋招面试我被问及:你如何理解System.out.println()?学了这么久的面向对象编程,那如何用一行代码体现呢?如果你能自......
  • 【PAT乙】1003 我要通过! (20分) 字符串条件判定
    problem“答案正确”是自动判题系统给出的最令人欢喜的回复。本题属于PAT的“答案正确”大派送——只要读入的字符串满足下列条件,系统就输出“答案正确”,否则输出“答案......
  • 练习:我要买票吗
    通过input语句获取键盘输入的身高判断身高是否超过120cm,萍通过print给出提示信息  1print("欢迎来到动物园。")2height=int(input("请输入您的身高(cm):"))3......
  • 60% 程序员大呼:我要远程办公!
    近几年数字化的普及,白领们从挤地铁、打卡、开会、写日报转变成“早上9点视频会议”,企业的办公场所也从写字楼、会议室、工位变成了手机、电脑中的线上会议室,远程办公已经成......
  • 《由弹簧垫片想到一个小小的问题》 回复
    《由弹簧垫片想到一个小小的问题》       https://tieba.baidu.com/p/8289440426       我在9楼 回复  “空间几何,如果是投影,应该是n......