首页 > 其他分享 >研究人员的AI技术能够实时匹配活页乐谱与MIDI音频

研究人员的AI技术能够实时匹配活页乐谱与MIDI音频

时间:2023-06-13 12:33:45浏览次数:53  
标签:乐谱 活页 MIDI AI 音频 音乐 系统 2020


研究人员的AI技术能够实时匹配活页乐谱与MIDI音频_大数据

正文字数:1165  阅读时长:2分钟

音乐AI技术正在快速发展。

作者 / Kyle Wiggers

原文链接 / https://venturebeat.com/2020/07/22/researchers-ai-aligns-sheet-music-with-midi-audio/

在预印平台Arxiv.org上发布的一项研究中,约翰内斯·开普勒大学林茨计算感知研究所和奥地利人工智能研究所的研究人员介绍了一个可以预测活页乐谱中和目标录音匹配度最高的的位置的AI系统。表面上,其对齐精度高于当前基于图像的最新乐谱追踪器。

乐谱追踪技术是很多应用程序的基础。这些应用包括自动伴奏、翻页以及将现场表演与可视化图像同步等等。现有的系统要么依赖于固定长短的小片段乐谱图像,要么需要光学音乐识别技术所提取出的计算机可读的乐谱。但是这些研究人员的AI系统可以以独特的方式观察整页乐谱,从而从头到尾地追踪任意长度的音乐表演。

这个研究团队将乐谱追踪当作一种图像分割任务。根据特定时间的某个音乐表演,他们的系统针对当前正在播放的音乐相对应的乐谱预测分段蒙版(即小片段)。研究人员说,仅仅利用固定大小音频输入的乐谱追踪器无法在超过特定环境的情况下区分重复的音符,然而他们提出的AI系统在处理较长时间的乐谱时都不会有问题。

在实验过程中,研究人员们从多模型乐谱数据集(MSMD)中获取了一些复音钢琴样本,其中包括巴赫、莫扎特、贝多芬等多个作曲家的作品。在手动识别并且纠正一些对齐上的错误后,他们通过353对乐谱和MIDI音频信息训练了AI系统。

该AI系统的另一位作者说,除了最高的门槛以外(没搞懂highest threshold是啥),他们的系统拥有比基准线更高的性能,并能在时间差方面得出更精确的结果(即对于更严格的容错率,百分比更高)。它偶尔也会产生一些错误,研究人员将其归因于系统可能会在图像纸上 “大幅跳跃”。但是他们断言,种种试验结果都表明这个AI系统在大多数情况下都是“非常精确的”。

“未来的工作会需要对扫描图像或照片进行测试,以评估该AI系统在视觉领域的泛化能力。”研究人员写道,“成就功能更强大的系统的下一步是显式或隐式地结合某种机制来处理乐谱和演奏中重复的音符。尽管我们也怀疑其性能会很大程度上取决于迄今为止音频的隐式编码。举例来说,循环网络中能够存储多大的听觉环境将成为很重要的一个因素,但我们相信,我们所提出的方法能够从合适的(经受过训练的)的数据中很自然地获得这种功能。”

音乐AI技术正在快速发展。OpenAI最近发布了一款叫做Jukebox的机器学习框架,它可以生成包括基本歌曲在内的音乐作为各种音乐类型和音乐风格的原始音频。在2018年末,Google Brain的“Project Magenta”项目致力于“探索机器学习在创作过程中的作用”,提出了一个叫做“Musical Transformer”的模型。该模型能够生成可识别的重复性歌曲。不仅如此,去年三月,谷歌发布了一种算法“Google Doodle”,让用户能够创造向巴赫致敬的旋律。

LiveVideoStackCon 2020 SFO(线上峰会)日程发布

无需漂洋过海,我们在线上等您!


LiveVideoStackCon 2020 美国旧金山站

北京时间:2020年12月11日-12月13日

标签:乐谱,活页,MIDI,AI,音频,音乐,系统,2020
From: https://blog.51cto.com/u_13530535/6468902

相关文章

  • x.ai还是OpenAI?埃隆·马斯克的AI帝国【2】
    上期内容咱们提到了埃隆马斯克的特斯拉是自动驾驶领域的领导者,大家可能近些年也都有从各类渠道听到过Tesla自动驾驶有关的新闻。不同于像包括Google子公司Waymo在内的大多数使用激光雷达来实现自动驾驶的公司,特斯拉采用的是只需要视频输入就能理解汽车周围环境,并实现自动驾驶的方......
  • 谷歌大模型云服务Vertex AI上线
    想让AI帮你解释代码为什么出错?用谷歌的大模型服务。 上周末,谷歌宣布基于VertexAI的生成式人工智能服务全面上线了。VertexAI是谷歌云提供的机器学习平台服务(MLPaaS)。随着本次发布,谷歌大模型的服务已普遍可用,企业和组织现在可以将该平台的功能与自身应用进行......
  • promise、async、await
    一、promise语法上:promise是一个对象,从它可以获取异步操作的消息本意上:它是承诺,承诺它过一段时间会给你一个结果【如果想通过异步方法先后检测用户名和密码,需要先异步检测用户名,然后再异步检测密码的情况下就很适合Promise】1、创建此构造函数包含一个参数和一个带有resolv......
  • OpenAI官方发布ChatGPT最佳实践
    策略一:写清楚指令要知道,模型可不会“读心术”,所以你得把你的要求明明白白地写出来。当模型输出变得太啰嗦时,你可以要求它回答简洁明了。相反地,如果输出太过简单,你可以毫不客气地要求它用专业水平来写。如果你对GPT输出的格式不满意,那就先给它展示你期望的格式,并要求它以同样的......
  • ubuntu failed to activate swap/swapfile
    Copyfrom https://www.makeuseof.com/fix-read-error-on-swap-device-ubuntu/ sudoswapoff/swapfileOncetheswapfilehasbeendisabled,youarereadytocreateanewswapfile.Forexample,tocreateaswapfileof4G,runthefollowingcommand.sudofa......
  • Altair绘图自学成材
    目录1。Altair介绍(全名:Vega-Altair)2。一步一步学画图3。样例一个用自定义图标显示在坐标轴里的图形1。Altair介绍(全名:Vega-Altair)它是一个专为Python编写的可视化软件包,它能让数据科学家更多地关注数据本身和其内在的联系。https://github.com/altair-viz/altair安装:Vega-Alta......
  • 函数exit,参数 EXIT_FAILURE,参数EXIT_SUCCESS
    1、函数:exit()所在头文件:stdlib.h功能:关闭所有文件,终止正在执行的进程exit(0)表示正常退出exit(x)都表示异常退出,这个x是返回给操作系统的,以供其他程序使用return和exit:无论在哪里使用main都会终止程序,return只是将控制权交给递归的前一级。return和exit的区别......
  • mybaits-plugs 连接orcale自动生成
    mybaits-plugs连接orcale自动生成calorca  20200516shmybatis-plugs是对mybatis框架进一步封装,今天尝试使用mybatis-plugs的逆向工程连接orcale/mysql数据库生成实体类以及dao1、遇到的问题有连接数据的时候抱错,拒绝连接一定要仔细检查orcalsid服务id是否正......
  • 英特尔公布 1 万亿参数 AI 模型
    导读在ChatGPT的推动下,如今有越来越多的公司开始参与生成式AI的开发了,大模型领域也“越来越卷”。英特尔是最新参与进来的玩家,并在近日公布了一个名为AuroragenAI的产品,它是一个主要用于科学领域的生成式AI模型。英特尔AuroragenAI模型以Megatron和DeepS......
  • The XOR Largest Pair
    #include<iostream>#include<cstdio>#include<cmath>#include<algorithm>#include<cstring>usingnamespacestd;intbit[32];intn,num[5211314];structTrie{ inttrie[5211314][2],tot=1; inlinevoidInsert(inta){ ......