代码编织梦想

介绍与研究动机

在这里插入图片描述
论文链接:AN EXPLORATION OF GENERATING SHEET MUSIC IMAGES
传统的音乐生成任务的输出格式以MIDI、WAV为主,本文研究的格式却是乐谱,那么乐谱形式的音乐相较MIDI格式的音乐有哪些优势呢?
1、作曲家的首选格式,音乐专业的学生对于打谱软件早已习以为常;
2、拥有MIDI格式音乐中没有的信息,例如time signature, measure boundaries, harmonic information。
3、MIDI的嵌入编码会十分在意低层次的信息,例如note velocity,基于乐谱的作曲则不会在这里钻牛角尖;

数据集

在这里插入图片描述
本文作者探究了三种格式,分别是Image format, Semantic encoding, XML code。

方法

在这里插入图片描述
作者对三种格式都运用了相同的语言模型,分别是AWD- LSTM,GPT-2

实验结果

作者选择的评价指标主要是一致性(cohesion)。
在这里插入图片描述
可以发现基于语义编码的数据格式在两个语言模型上表现差不多,而GPT在XML上的time signature cohesion表现的要好一些。但是总体结果不大理想。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_25594177/article/details/130913113