ポピュラー音楽で「歌詞」は、感情やメッセージを伝えるための重要な要素です。しかし歌詞には、ふつうの文章にない難しさがあります。歌詞の情報処理技術に取り組む渡邉研斗先生は、コンピュータに歌詞特有の性質を教え、人間と協調して作詞を支援する技術を開発します。
歌詞を理解し、作詞を支援するコンピュータ
歌いやすさ、メロディ・リズムも考えて作詞
みなさん音楽をどうやって聴いていますか。ほとんどの人はインターネット経由の音楽配信を楽しんでいるかと思います。今や楽曲や歌詞を世界中へ発信できるようになりました。
ただし、誰でも曲や歌詞を作れるようになったというわけではありません。音楽を作るのは簡単ではないからです。
なぜでしょう。歌詞にはAメロ、Bメロ、サビのような、普通の文章にはない構造があります。テーマやストーリーを考慮する必要もあります。押韻や比喩など特殊な表現もあり、歌いやすいようにメロディやリズムを考慮する必要があります。これら全てを考えながら作詞をしなければなりません。
切ない歌詞、希望の持てるストーリーも自動生成
私はコンピュータと協調することで、作詞を支援する技術を開発してきました。
例えば、曲の構造やストーリー、メロディなどの条件を考えてみましょう。
コンピュータはその条件を満たした単語列を自動的に生成します。生成された歌詞を見て、ちょっとここは良くないなって思ったところを見直しながら、さらに良くしていくことで作詞をしていきます。
では実際にコンピュータが生成した歌詞を紹介しましょう。
まずAメロでは情景的に、Bメロではなんか切なく、そしてサビでは希望的な内容のストーリーにしたいなと考え、サビの始まりは5音符4音符で歌うことのできる歌詞を作りたいなと思ったら、その条件を入力します。
コンピュータは、Aメロでは「♪思い出の坂道は~」といった情景的な感じの歌詞を生成しました。同様にBメロでは、「♪世界中でこんなにすれちがい~」のような切ない感じの歌詞を、そしてサビでは「♪永遠の光に~」のような希望的な内容で、しかも5音符、4音符で歌うことのできる歌詞を自動的に生成できるようになりました。
数万曲分の楽譜データから歌詞作りを学習
どうしてコンピュータがこういった歌詞を生成できるのでしょう。コンピュータは、数万種類の単語の中から順番に1単語ずつ歌詞を生成しています。しかしコンピュータは、何も適当に単語を生成しているわけではありません。
状況に合わせた適切な単語を選択しているのです。
歌詞生成の仕組みはこうです。例えば、単語「光」というのは、「永遠の~」の次に続く言葉として使うことができます。そして「光」は希望的な意味で、しかも4音符以内で歌うことができる単語である。
――そのようにコンピュータがあらかじめ理解しているからこそ、単語「光」を選択することができるのです。
もっと言えば、コンピュータは、単語の使われ方、意味、歌いやすさというものをあらかじめ理解しているから、適切な単語を選択して歌詞を生成することができるということです。
どうしてコンピュータはこういった単語の使われ方や意味や歌いやすさを理解できるのでしょう。
実はコンピュータは、大量の楽譜データから、単語の使われ方、意味、こういうふうに歌えば歌いやすいんだなという歌いやすさを自動的に学習している。だから歌詞が自動生成できるのです。
実際に私は楽譜データ数万曲分をコンピュータに学習させました。
これからも歌詞情報処理で、人々の音楽体験をより豊かにできるよう研究活動を続けていきたいと思っています。
◆先生は研究テーマをどのように見つけたのでしょうか。
両親が音楽関連の仕事をしていることもあり、幼いことから音楽で生活する厳しさを理解していました。そのため音楽の道は諦め、東北大の工学部に進学し自然言語処理の研究室に所属しました。そんな時に音楽分野の研究者と運命的に出会いました。彼らとともに共同研究を始め「言語と音楽の中間領域である歌詞を扱った情報技術の研究」に可能性を感じ、一度は諦めた音楽関連の仕事ができることになったのは、信じられないほどの幸運でした。
Jポップの日本語研究 創作型人工知能のために
伊藤雅光(朝倉書店)
難しい数式などは一切使わず、歌詞を定量的に分析し、直感的にも理解しやすい内容です。普段なんとなく聞いている歌詞を別の視点から感じることができると思います。