動画生成AI「Runway」でMV制作に挑戦!理想と現実の体験談

音楽制作

音楽活動とMV制作の悩み

これまでにいくつかのオリジナル楽曲をYouTubeにアップしてきました。
ただ、正直に言うと「音楽を作るだけでも精一杯で、動画まで作り込む余裕がない」のが現実です。
MVをゼロから作るとなると、撮影や編集にとにかく時間がかかる

結局、ジャケット写真に歌詞をつけただけの“ペライチ動画”になってしまうことが多いんです。

そんなときに出会ったのが、動画生成AI「Runway」でした。
ブログ記事やYouTubeで紹介されているのを見て、「もしAIでMVを作れるなら、コストを抑えつつクオリティの高い映像を手軽に出せるかもしれない」と大きな期待を抱きました。

サンプルペライチ動画

本記事では、動画生成AIでMV制作を目指した動画制作初心者DTMerの体験談をまとめています。

この記事はこんな人に役立ちます
  • Runway AIでMVを作れるのか気になっている人
  • 動画生成AIを使ってみたいが、実際のクオリティやコストが不安な人
  • 音楽活動をしていてMV制作に時間やお金をかけられない人
  • AIを映像制作の補助ツールとして活用したいクリエイター
  • Runwayの評判や実際の使用感を知りたい人

Runway AIとの出会いと期待感

Runwayは色々なメディアで素晴らしいAIだとおすすめされていました。
AIが文章を理解してイメージ映像を作ってくれるなら、MV制作のハードルがぐっと下がる。

そんな未来を想像して、「これは試すしかない」と思ったんです。


Runway AIでMV制作に挑戦した手順

私が実際に取った手順は次の通りです。

  1. コンテ作成
    歌詞や楽曲のテーマをChatGPTに説明し、MVのコンテを生成。
  2. プロンプト生成
    コンテをもとに、各シーンの英語プロンプトをChatGPTで用意。
  3. Runwayで映像生成
    そのプロンプトをRunwayに入力し、クリップを生成。
  4. 編集ソフトで仕上げ
    生成した動画を組み合わせて一本のMVに仕上げる予定。

コンテは以下の通り
私的にはなんとなく頭の中に映像が浮かぶくらいには作れていて、期待感は膨らむばかりでした。

時間(目安)歌詞セクション映像イメージリリック表示
0:00–0:10イントロ(Hook先出し)手のアップ、スマホをスクロール → 光が顔を照らす「NETETA」(小さめに中央下)
0:10–0:30Verse 1デスク・家事・子育てシーンを早送り → ソファに倒れ込む歌詞を1〜2行ずつ表示
0:30–0:45Pre-chorus 1SNSに吸い込まれる/画面に没入歌詞を短く1行ずつ表示
0:45–1:15Chorus 1カラフルなショート動画風映像、分割画面、踊るスタンプ「NETETA」大きめ+残りの行は字幕風
1:15–1:35Verse 2街中を歩く主人公、周りは無表情な群衆1〜2行ずつ表示
1:35–1:50Pre-chorus 2夜更けのベッド、時計の針が高速回転 → 部屋がノイズに満ちる1行ずつ、淡くフェードイン/アウト
1:50–2:20Chorus 2SNSの渦に飲まれる、グリッチエフェクト、無意味な動画断片「NETETA」強調表示、その他は小さめ
2:20–2:50Bridge夜空にSNSコメントが星のように浮かぶ幻想シーン歌詞を透明感ある文字で
2:50–3:20Final Chorus主人公が笑ってスマホを閉じる → 背後に画面が漂う「NETETA」文字を大きめで揺らす
3:20–3:40Outro暗転、「NETETA…」が残像のように揺らめき → フェードアウト「NETETA…」だけ表示して消える
Shuhey
Shuhey

AIをフル活用して効率よくMVを作ろう!という狙いでした。


Runway AIの理想と現実のギャップ

しかし、実際に出てきた映像は期待とはかけ離れたものでした。

  • 想像していたようでしていない、中途半端な動画
  • 突如として人物が消えたり、背景が歪んだりする
  • まさに「ザ・AI動画」という感じで、とてもクリップとして使えるものではない
スマホを使用している男性が、帰宅しソファに座り込む様子

Runwayはイメージがなければプロンプトから「まず静止画を生成し、そこから動画化する」という仕組み。
既存の映像を編集したりエフェクトを加えたりする用途には強そうですが、ゼロからMVを生み出すのは難しいと感じました。

Runwayの料金とクレジット消費の現実

モデル別の消費クレジット表

コスト面でも現実は厳しく、Standardプランで始めたものの、10秒動画1回の生成でクレジットを約20%を消費。

気づけばあっという間に使い果たしてしまいました。
モデルによって消費量が違うことも後から知り、「これは気軽には試せないな」と痛感しました。

標準で設定されている“Gen-4 Video”は1秒で12クレジット消費
Standardプランは625クレジットなので、単純計算で52秒分の動画が生成できます。

個人的な感想としては、コンテンツを作る上では全然足りず、もう少しクレジットを増やしてほしいところです。

Shuhey
Shuhey

使うべきはGen-4 Turbo Video一択。もしくはPro(2250クレジット)以上のプランで始めましょう


Runwayを使って学んだことと今後の方針

イメージとして生成してくれる画像もかなり個性的

今回の経験から学んだのは、「AIはゼロから全部作らせるのではなく、補助的に活用する方がいい」ということです。

  • 構図の下地を用意する
    ラフでもいいので動画の構図を作っておけば、AIで人物や背景を差し替えるといった形で活用できそう。
  • クレジットは余裕を持つ
    試行錯誤を重ねる前提なら、StandardよりProプラン(2250クレジット)の方が現実的。
  • 人間とAIの役割分担
    今のところ「AIが全部やってくれる」は幻想。人間が下地を整え、AIに部分的に任せるのがベスト。
Shuhey
Shuhey

動画の表現をテキストのみで指示するのは難しすぎるということに気づくことができました。


まとめ:AI映像制作で得られた気づき

今回Runwayを使ってみてわかったのは、AIの性能不足というより「指示の難しさ」が最大の壁だということです。
テキストから任意の動画を作ろうとすると、どうしても指示が複雑になりすぎて、理想通りにいかない。

ゼロからMVを丸ごと生成するのはまだ難しいですが、既存映像をベースにAIでアレンジするなら十分活用できます。
つまり、AIは“魔法のツール”ではなく、人間のクリエイティブを後押しする補助役

「RunwayでMVを作ろうとしたけれど全然できなかった」

――そんな体験から得たのは、AI時代における映像制作のリアルな現実でした。

今後もRunwayを使い込んでみて、記事にしていきたいと思います。

最後までご覧いただきありがとうございます。

また次の記事でお会いしましょう。

Shuhey

モテたくて始めたギターとブラックコーヒー。気づけばモテそっちのけで音楽沼へダイブ。
バンド、弾き語り、路上ライブを経て、社会人になってもDTMでひっそり音楽を続ける日々。友人にDTMを布教するも次々と脱落し、気づけばひとり…。音楽を語りたいのに相手がいないので、せめてブログにぶつける30代前半男性。

島村楽器主催のアコパラ2019で「soloel」としてグランプリ受賞。

Shuheyをフォローする

コメント

タイトルとURLをコピーしました