首页 > 其他分享 >音乐生成模型 Music generation

音乐生成模型 Music generation

时间:2023-03-07 19:44:24浏览次数:45  
标签:Transformer generation Demo 模型 音乐 Pop Music

目录

-CoCoNet(2017)

CoCoNet(2017)

模型特点:

  1. 使用卷积
  2. Orderless NADE (Neural Autoregressive Distribution Estimators)
  3. 吉布斯采样(Gibbs Sampling)

XiaoIce Band(2018)

A Melody and Arrangement Generation Framework for Pop Music
https://ldzhangyx.github.io/2018/09/26/xiaoice-band/

Music Transformer(2019)

【Demo】【Demo2】
Motivations:

  1. Transformer的长期一致性(coherence)在生成任务效果好。
  2. 相对时间(relative timing)重要,但基于距离的算法复杂度太高

Applications

  • 生成长为一分钟的具有出色结构的音乐
  • 根据给定主题续写音乐
  • 在seq2seq情境下根据给定旋律生成伴奏

Contribution

  1. 将需要的存储空间缩小到序列长度的数量级
  2. 更具有结构一致性

Method

  1. 相对位置自注意力机制:其中R为包含所有Query与Key的相对距离嵌入的中间张量
    image
  2. 节省存储空间:中间张量R节省计算
    image
  3. 长序列处理:将一个音乐事件多种属性的相对位置也加入
    image

Evaluation

  • 显著提升负对数似然(negative log-likelihood, NLL)
  • 局部上,保留了必要的时间/声部网格结构
  • 整体上,捕捉到了全局结构,体现出了有规律的分段
    image

Jukebox(2020)

模型特点:基于VQ-VAE
image

Pop Music Transformer(2020)

【解读】

  • 提出新的音乐数据表示方式REMI,通过在数据表示中加入度量结构以刻画节拍-小节-乐句的层次结构
    image

Symbolic music generation with diffusion models(2021)

【Paper】【Code】
image

Compound Word Transformer (2021)

Generate Pop Piano Music of Full-Song Length
【Demo】
Backbone model:

  • linear transformer (Linear)
  • transformer-XL (XL)

MuseFormer(2022)

Transformer with Fine- and Coarse-Grained Attention for Music Generation
【Demo】

标签:Transformer,generation,Demo,模型,音乐,Pop,Music
From: https://www.cnblogs.com/rayinfos/p/17189353.html

相关文章