谷歌希望利用人工智能将你的脑电波转化为音乐

导读 月复一月,新产品、程序和实验向我们展示了生成式人工智能的潜力有多大。为此,谷歌与日本研究人员合作,找到了一种方法,利用功能性磁共振

月复一月,新产品、程序和实验向我们展示了生成式人工智能的潜力有多大。为此,谷歌与日本研究人员合作,找到了一种方法,利用功能性磁共振成像(fMRI)捕获的人脑活动来制作音乐,并使用谷歌的MusicLM音乐生成模型进行重建。

正如谷歌在题为“Brain2Music:从人脑活动中重建音乐”(来自ZDNet)的研究论文中所解释的那样,从涵盖10个不同流派的540首音乐作品中随机选择了15秒的剪辑。五名参与者通过一对兼容MRI的插入式耳机收听了这些片段,在此期间他们的大脑活动被扫描。

研究人员将数据输入MusicLM,以“预测和重建人类受试者接触到的音乐类型”。最终,生成的音乐确实与测试对象最初“在语义层面上”听到的音乐有相似之处。

如果你想听一些重建的大脑活动音乐,谷歌为该研究建立了一个网页,其中包含原始刺激和重建的内容。

研究团队还揭示了限制AI音乐质量的三个因素:

fMRI数据中包含的信息在时间和空间上都非常稀疏(观察到的区域大小为2×2×2mm3,比人类神经元大许多数量级)。

音乐嵌入中包含的信息,我们从中重建音乐(我们使用了MuLan,其中10秒的音乐仅由128个数字表示)。

我们的音乐生成系统的局限性。当我们研究MusicLM时,我们发现它在遵循文本提示的方式和生成的音频的保真度方面都有改进的空间。

与大多数语言模型一样,仍有大量工作要做。也就是说,很明显人工智能可以有效地利用你的大脑活动来重现你听到的声音。但如果你担心陌生人会扫描你的脑电波并窃取你的想法,那么你可能是安全的(目前)。研究小组指出,为了这项研究,志愿者必须在大型功能磁共振成像扫描仪上花费数小时。因此,请避免在大型功能磁共振成像扫描仪中进行第一次约会。