AI 創(chuàng)作音樂越來越熱門。
剛剛,OpenAI 發(fā)布了其 AI 音樂創(chuàng)作的深度神經(jīng)網(wǎng)絡(luò)—MuseNet,可以使用 10 種不同樂器、風(fēng)格如鄉(xiāng)村樂、莫扎特、披頭士樂隊(duì)等,生成出 4 分鐘的音樂。
OpenAI 博客最新發(fā)布文章指出,MuseNet 不是依靠人類明確地對(duì)音樂進(jìn)行編程,而是通過學(xué)習(xí)預(yù)測(cè) token 來學(xué)習(xí)和聲、節(jié)奏、風(fēng)格的模式,他們從許多來源收集 MuseNet 的訓(xùn)練數(shù)據(jù),像是 ClassicalArchives、BitMidi 網(wǎng)站上的文件、MAESTRO 數(shù)據(jù)集,還有爵士、流行、非洲、印度和阿拉伯風(fēng)格的音樂,總共利用了數(shù)十萬個(gè) MIDI 文件。
OpenAI 也指出,MuseNet 使用與 GPT-2 相同的通用無監(jiān)督技術(shù),GPT-2 為先前 OpenAI 提出的一個(gè)大規(guī)模 Transformer 模型,訓(xùn)練 AI 可預(yù)測(cè)序列中的下一個(gè) token,包括音頻和文本,用在 MuseNet 上則是給定一組音符后,要求 AI 預(yù)測(cè)后面會(huì)出現(xiàn)的音符。另外,MuseNet 使用 Sparse Transformer 的重新計(jì)算和優(yōu)化核來訓(xùn)練一個(gè)具有 24 個(gè)注意力頭(attention head)的 72 層網(wǎng)絡(luò),其全部注意力都放在 4096 個(gè) token 的語境中。
當(dāng) MuseNet 知道許多不同的風(fēng)格之后,就能混合生成新的音樂,舉例來說,提供機(jī)器肖邦夜曲(Chopin Nocturne)的前 6 個(gè)音符,但是,要求機(jī)器生成一段流行樂,并要有鋼琴、鼓、bass 和吉他,而機(jī)器生成的音樂就完美融合了肖邦和 Bon Jovi 兩種風(fēng)格。
圖| MuseNet 音樂生成神經(jīng)網(wǎng)絡(luò)(來源:OpenAI)
之前 OpenAI 提出的 GPT-2,使用近 40 GB 的網(wǎng)頁文字訓(xùn)練而成,主要具備了生成文本、預(yù)測(cè)下一個(gè)文字的能力,例如只給機(jī)器一段文字,就會(huì)因應(yīng)前后文的風(fēng)格創(chuàng)造內(nèi)容、編寫故事,但因?yàn)樗傻膬?nèi)容有條有理,仿真技術(shù)高,反而讓外界擔(dān)心助長假新聞、網(wǎng)絡(luò)假消息的泛濫,在考量該技術(shù)可能遭惡意使用后,OpenAI 決定不放出訓(xùn)練好的模型,只公開一小部分模型和范例。
現(xiàn)在用在音樂創(chuàng)作上,可能引起的爭(zhēng)議相對(duì)小,倒是為 GPT-2 找到了不錯(cuò)的應(yīng)用場(chǎng)景。
另外,OpenAI 剛剛還在 Twitch 上舉辦了 MuseNet 實(shí)驗(yàn)音樂會(huì),并預(yù)計(jì)在 5 月中旬放出該音樂轉(zhuǎn)換器的工具——MuseNet共同作曲家(MuseNet-powered co-composer),讓一般大眾和音樂家用來創(chuàng)作。
MuseNet 共同作曲家有幾種模式:簡(jiǎn)單模式下,用戶會(huì)聽到已經(jīng)預(yù)先生成的隨機(jī)樣本,然后選擇一個(gè)作曲家或風(fēng)格,就可以開始生成音樂;高級(jí)模式,則可讓用戶有更多的選擇,像是選風(fēng)格、樂器等,打造全新的音樂作品。
圖|MuseNet 在 Twitch 上舉辦一場(chǎng)音樂會(huì)(來源:Twitch)
OpenAI 研究人員 Christine Payne 指出,MuseNet 仍有局限性,因?yàn)樗峭ㄟ^計(jì)算所有可能的音符和樂器的概率來產(chǎn)生每個(gè)音符,所以偶爾會(huì)做出不和諧的選擇,做出奇怪的配對(duì),例如把肖邦風(fēng)格配上 bass 和鼓。
今年 3 月,谷歌為慶祝知名音樂家巴赫的生日,在 Google Doodle 放了一個(gè)小游戲,用戶在 Doodle 按下音符及節(jié)奏,就會(huì)以巴赫的風(fēng)格演奏用戶創(chuàng)作的作品。這是使用人工智能作曲的另一個(gè)案例。
不僅谷歌、OpenAI,唱片業(yè)、音樂人本身也都在探究 AI 的應(yīng)用,在 MuseNet 于 Twitch 上舉辦音樂會(huì)之前,音樂技術(shù)專家 CJ Carr 和 Zack Zukowski 就在 YouTube 頻道上播放重金屬音樂,這些死亡金屬串流音樂就是由他們開發(fā)的 AI 樂團(tuán) Dadabots 所生成的,而且 24 小時(shí)不間斷。他們使用加拿大的死亡金屬樂團(tuán) Archspire 的樣本訓(xùn)練 SampleRNN 神經(jīng)網(wǎng)絡(luò),進(jìn)而可自動(dòng)生成重金屬音樂。
毫無疑問,人工智能將持續(xù)融入創(chuàng)意音樂領(lǐng)域。
圖|重金屬音樂不間斷播放,背后其實(shí)是一個(gè) AI 樂團(tuán)(來源:YouTube)
-
轉(zhuǎn)換器
+關(guān)注
關(guān)注
27文章
8709瀏覽量
147277 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4772瀏覽量
100823 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24716
原文標(biāo)題:OpenAI發(fā)布音樂生成神經(jīng)網(wǎng)絡(luò) MuseNet,可創(chuàng)作4分鐘音樂,剛剛還辦了場(chǎng)音樂會(huì)
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論