1
研究背景 研究目的 従来研究では、自動作曲におけるニューラルネットを用いたアプローチは自然言語処理などでも良い結果を出して いるRNN(Recurrent Neural Network)が主流であった。 また、これまで画像認識で主に使われていたCNN(Convolutional Neural Network)が自然言語処理の分野でもRNN 系列のネットワークよりも良い結果を出している。本研究では自動作曲に対してCNNを応用することによって、 これまでよりも高精度でかつ人間が聞いて違和感のない楽曲の生成を行うこと目的とする。 提案 手法 CNN を用いた自動作曲システムの構築と検証 Construction and verification of automatic composing system using CNN 東京 電機大学 IoE/M2M ソリューション 研究室 大学院理工学研究科情報学 専攻 藤原 健弘 Takehiro Fujiwara 指導教員: 大学院理工学研究科 情報学専攻 神戸 英利 Kambe Hidetoshi 作曲行為にコンピュータを用いることは1950年代から行われてきた。代表的な例を挙げるとLejaren HillerLeonard Isaacsonによる、「イリアック組曲(1957)」等が挙げられる。こうした自動作曲を行うシステムは近年まで、音楽理論 に基づき確率的に楽譜を生成していくものが主流であった。しかし、処理能力の向上によりニューラルネットワーク (特に深層学習)を用いた作曲システムが注目されつつある。 本研究の要件 本研究で生成した楽曲が満たすべき要件が以下の2つである。 生成した楽曲が教師データをある程度踏襲している 生成した楽曲が教師データの完全な模倣になってはいない 上記は相反するものであり、両方を完全に満たすことはない。 そのため中庸であるものが好ましい。 したがって、特定の作曲家の曲を教師データとして学習し、 それに対してどの程度踏襲できているかで評価を行う。 自動作曲システムの概要 例) 音符の系列を読み込む 学習したモデルから次の音を予測 学習アルゴリズム 従来手法:LSTM(Long Short Term Memory) 学習に用いるデータ J. S.BachChoraleMIDIデータ180曲を 学習に用いる。 MIDIデータをベクトルデータに変換して 学習する手法は従来研究でも行われて おり、良い結果を出している。 そのため本研究もそれに倣う。 Johann Sebastian Bach RNNの一種であり、LSTMは単純なRNNで発 生してしまう長期依存性の問題を回避するよ うに4つのゲートを設けている。 学習アルゴリズム 本研究で使う手法:CNN 畳み込み層とプーリング層を交互に重ねたネット ワーク。画像認識の分野で主に使われている。

CNNを用いた自動作曲システムの構築と検証いるRNN(Recurrent Neural Network)が主流であった。 また、これまで画像認識で主に使われていたCNN(Convolutional

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CNNを用いた自動作曲システムの構築と検証いるRNN(Recurrent Neural Network)が主流であった。 また、これまで画像認識で主に使われていたCNN(Convolutional

研究背景

研究目的従来研究では、自動作曲におけるニューラルネットを用いたアプローチは自然言語処理などでも良い結果を出しているRNN(Recurrent Neural Network)が主流であった。また、これまで画像認識で主に使われていたCNN(Convolutional Neural Network)が自然言語処理の分野でもRNN系列のネットワークよりも良い結果を出している。本研究では自動作曲に対してCNNを応用することによって、これまでよりも高精度でかつ人間が聞いて違和感のない楽曲の生成を行うこと目的とする。

提案手法

CNNを用いた自動作曲システムの構築と検証Construction and verification of automatic composing system using CNN

東京電機大学 IoE/M2Mソリューション研究室

大学院理工学研究科情報学専攻

藤原 健弘Takehiro Fujiwara

指導教員:大学院理工学研究科情報学専攻

神戸 英利Kambe Hidetoshi

作曲行為にコンピュータを用いることは1950年代から行われてきた。代表的な例を挙げるとLejaren HillerとLeonard Isaacsonによる、「イリアック組曲(1957)」等が挙げられる。こうした自動作曲を行うシステムは近年まで、音楽理論

に基づき確率的に楽譜を生成していくものが主流であった。しかし、処理能力の向上によりニューラルネットワーク(特に深層学習)を用いた作曲システムが注目されつつある。

本研究の要件本研究で生成した楽曲が満たすべき要件が以下の2つである。

• 生成した楽曲が教師データをある程度踏襲している• 生成した楽曲が教師データの完全な模倣になってはいない

上記は相反するものであり、両方を完全に満たすことはない。そのため中庸であるものが好ましい。

したがって、特定の作曲家の曲を教師データとして学習し、それに対してどの程度踏襲できているかで評価を行う。

自動作曲システムの概要例)

音符の系列を読み込む

学習したモデルから次の音を予測

学習アルゴリズム従来手法:LSTM(Long Short Term Memory)

学習に用いるデータJ. S.BachのChoraleのMIDIデータ180曲を学習に用いる。MIDIデータをベクトルデータに変換して

学習する手法は従来研究でも行われており、良い結果を出している。そのため本研究もそれに倣う。

Johann Sebastian Bach

RNNの一種であり、LSTMは単純なRNNで発

生してしまう長期依存性の問題を回避するように4つのゲートを設けている。

学習アルゴリズム本研究で使う手法:CNN

畳み込み層とプーリング層を交互に重ねたネットワーク。画像認識の分野で主に使われている。