音楽生成AI
去年の11月、suno が v3.5 から v4 になった。それが今年の5月にはv4.5がリリースされた。無課金でも v4 のエンジンで何曲か作れるので、試しに作ってみた。
AIに心はないと一般的には言われている。そして私もそうだと思っているが、心を持たないAIが人間を感動させる曲を作ることが出来てしまっている。正直、作曲を趣味としてきた私にとっては、人生がひっくり返るぐらいの衝撃を受けた。
SUNO公式サイト
suno は 音楽を作るAIで、膨大な楽曲を学習して、それらを基に楽曲を作るのですが、ユーザーのプロンプトの出し方や歌詞の書き方で結果が変わって来ます。suno公式サイトには、ユーザーが作成したたくさんの曲がありますので、何曲か何曲か聴いてみて下さい。
楽曲の制作
今回作ってみたのは、次の校内公演のエンディングテーマ。校内公演の脚本は今年入ったばかりの1年生が書き下ろしました。そこで、稽古を見ながら、歌詞を考え、suno に曲を作らせてみました。
こういった曲を自分が作れるかどうかは置いておいて(多分無理)オケを作ってレコーディングして・・・とやってたら1か月はかかるだろうと思います。それをものの十数秒で作ってしまうのです。
発音とか、細かい所にミステイクはあるし、音質はお世辞にも良いとは言えない。しかし、私には世界を感じられた。歌っているのもAIの音声。
いったいどんな仕組みなのか。日本語もちゃんと理解している。AIが発音をミスったら、ひらがなに直してやれば、ちゃんと発音できる。ヒット曲の要素をしっかり取り入れて、ピアノの伴奏から始まり、ドラムやベースがちゃんと楽曲を盛り上げている。一番大切なメロディや譜割りも無理がなく自然。
音質以外の部分については、勉強になることだらけで、suno のエンジニアは一体どんなヤバいやつなのだろう。まぁそれは置いておいて、こんなAIが出来ちゃった事は信じられないが、これが現実である。
sunoとの付き合い方
では、この音楽生成AIとどうやって付き合って行くべきなのか。
さしあたって、AIがパンドラの扉を開けたのは確かな事だと思う。だから、この扉をくぐらない者は時代に取り残されることになる。
suno の弱点が音質であるなら、そこを私がカバーすれば最強じゃないか!?というのが、基本的な考え方。しかし、いずれ近いうちに更に suno のバージョンが上がり、音質は良くなっていくだろう。しかし、使われている楽器一つ一つのクオリティを上げる事には限界があるのではないだろうか。
sunoの内部考察
AIが作成した楽曲をステム分離して聴いてみると、楽器が鳴っているというより、音の雰囲気みないたものを組み合わせているように感じる。つまり、suno は高性能な全部入りの DAW ではないという事。楽曲を学習する際に、曲を分解して学習していると思うのですが、分解については、MIXからある特定の楽器や音声のみを抽出してそれを学習するという事をやっているのだと思う。そしてその楽器や音声のモデル(内部モデル)を使って、ユーザーの求める曲を生み出している。そして、その内部モデルは、これからもどんどん多岐にわたって作られていくだろう。ピアノ、ギター、フルート、尺八、レコードに記録されたありとあらゆる楽器が学習対象になっていく。しかし、エンジニアがMIXの際に加えた要素(コンプやEQやエフェクト)も一緒に学習している。なぜなら、suno が学習しているのはマスタリングされた音源であり、その前の段階のデータではないからだ。つまり、suno は楽器のパート1つ1つを作ってMIXしているのではなく、大まかな内部モデルを使って組み立てられた音がMIXされているのだと思う。内部モデルについては、ある程度グルーピングされて、平均化されているんだと思う。そうすることで、ボーカルを聴いても、誰の声かというのは判断できないようになっていて、それが著作権違反対策になっているんだと思う。
終わりに
sunoは、それ自体で完成された曲を目指していて、気に入った曲は外部に公開もできます。
著作権的には、有料プランに入って作った曲だけが作成者に著作権が付与され、無料プランで作った曲はsunoに著作権があります。しかし、あの膨大な曲をsuno自らが著作権を管理できるはずもないので、自分が気に入った曲のエラーを修正し、DAWを使って勝手に編曲し、マスタリングしてリリースしてもsunoは気づかないと思います。
だから、私は suno を一つのアイデアツールとして使っていこうと思いました。
コメント