AI再挑战音乐创作:索尼开发机器学习模型生成鼓点音轨
2019年08月07日 由 马什么梅 发表
923880
0
人工智能可能很快成为音乐家们青睐的工具。
在找不到创作灵感时,让人工智能来帮忙,将是一件多么方便又轻松的事情。
今年早些时候,OpenAI和谷歌推出了利用音乐生成算法的在线创作工具。7月,Landr筹集了2600万美元用于分析音乐风格的产品,以创建定制的音频处理器。
受到这项和其他近期工作的启发,索尼的研究人员研究了一种用于条件式鼓点轨迹生成的机器学习模型。
训练模型
考虑到现有的歌曲和低维编码编码了该歌曲和将要生成的新材料之间的关系,人工智能可以从一首歌曲到另一首歌曲创建各种音乐上可信的鼓模式,而不考虑节奏和时间变化的差异,即改变速度或持续时间。
团队提出了一种模型架构,它可以对底鼓与低音和snare模式的节奏互动进行编码。每个映射代码都捕获了三者输入之间的局部关系,这样整个音轨就与一系列映射代码相关联它不是直接控制生成材料的特性,而是控制生成的材料与调理材料的关系。
为了训练人工智能系统,研究人员编制了一个由665首流行歌曲,摇滚歌曲和电子歌曲组成的数据集,其中节奏乐器作为单独的44.1kHz音轨提供。
接下来,通过在阈值处理后的所有振幅峰值上放置鼓样来渲染鼓的音频文件。
在一系列实验中,他们利用AI系统有条件地生成鼓模式和传送风格,或应用从一首歌推断的节奏模式以在另一首歌中引入类似的模式。此外,他们分别以原始速度的80%,90%,110%和120%创建时间延长版本的歌曲,并确定了映射代码。
该团队指出,重建并不完美,部分原因在于模型的“不变性”,但他们指出验证集的准确性与训练集的准确性相似。
“我们已经证明,映射代码主要是速度和时间不变的,并且通过采样映射代码或通过样式传输,推断来自另一首歌曲的映射代码,可以生成合适的底鼓音轨。”未来,他们希望能够生成军鼓和低音音轨。
音轨:
sites.google.com/view/drum-generation