Midjourneyのクリエイターは最近、テキストを動画に変換するジェネレーターを近々リリースすると発表した。CEOのデビッド・ホルツ氏によると、AIモデルのトレーニングは1月に開始され、新しいツールは数ヶ月以内に導入される予定だという。この種のツールとしては初のものではないが、最高のものになると思わせる理由はたくさんある。我々だけではない!なぜMidjourney for videoが待望のリリースなのかについて説明しよう。
Midjourneyは2022年2月に活動を開始し、以来大きな成功を収めている独立系研究所だ。彼らのAIは、DALLE-3やAdobe Fireflyなどの競合ツールのように、いわゆる “プロンプト “を介してテキストの説明から画像を作成する。現在もDiscordのボットで運営されているが、Midjourneyは世界有数の画像ジェネレーターとみなされている。その言語理解力、夢のような出力、驚くほどフォトリアリスティックな結果は、ユーザーから愛されている。
ムードボード(私たちの体験談を読んでほしい)や、派手なズームアウト動画(ステップバイステップのガイドはこちら)の作成にも最適なツールだ。Midjourneyによると、近々、ビデオのプリビジュアライゼーションにも使用する予定だという。
Midjourneyは、自然な発展としてビデオにも使える。
Midjourneyのチームは、かなり頻繁にアップデートを行う。第5バージョンから1年以内に、開発者たちはクリスマス直前にMidjourney V6を発表した。まだ前バージョンの機能の多くが不足しており、初期のアルファテストと見なされているが、それでも、このAIモデルが以前のどのリリースよりもリアルな画像を作成できるようになることは明らかだ。このアップデートは9ヶ月前から進められており、より高い一貫性、人間の言葉遣いに対するより良い感度と理解力、テキスト描画能力も含まれている。例えば、「霧の中に消えていく夜の長い通り」というプロンプトの結果はこうなった。すべてが街灯に照らされ、手前には “2024” -ar 16:9 -v 6.0 “と書かれた看板がある:
V6を試すには、”/settings “と入力してドロップダウンメニューから選択するか、プロンプトの最後に”-v 6 “というコマンドを追加する必要がある。
ジェネレーティブAIの専門家は 「他の画像ジェネレーターはもっと早くテキスト作成機能を導入していたじゃないか!」と反論するかもしれない。それがMidjourneyの特徴だ。Midjourneyは何でも先駆者になろうとはしない。多くの機能は、競合他社の同じ機能よりもかなり遅れて登場する(Vary(Region)対AdobeのGenerative Fillが良い例だ)。しかし、ほとんどの場合、それらの方がはるかに高品質な結果をもたらす。「より遅く、しかしより良く」は、Midjourneyがビデオジェネレーターをトレーニングする際にとったアプローチでもある。もしこのツールが、Midjourneyの画像と同じ品質とまとまりのある動画を作成できるようになれば、この市場は深刻な競争を強いられることになるだろう。
Midjourneyはビデオジェネレーターの競争に遅れているか?
前述したように、動画生成はMidjourneyの得意分野ではない。現在、Runway MLがいわゆるAIマジックツールでショーを運営している(彼らのGen-1とGen-2ビデオモデルについてはこちらで触れた)。Googleは1年以上前から動画生成に取り組んでいる。また、Pikaはまだベータ版で無料だし、Stability AIからリリースされたばかりのStable Video Diffusionもある。有名な画像ジェネレーター、レオナルドAIも最近、画像からモーションへの機能を取り入れた。(ちなみに、動画生成AIについては、近日中に徹底的な概要を紹介する予定)
今回の発表で、Midjourneyは混雑した分野に参入することになった。しかし、ご存知の通り、この技術はまだ非常に若く、経験も浅いため、完璧とは言い難い結果を生み出している。もしかしたらミッドジャーニーは、画像ジェネレーターで見せたように、AI開発の新たな飛躍を示すことができるかもしれない。
また、Midjourney社に期待したいのは、倫理的な問題に対する同社の見解だ。この研究会社は(他の企業とともに)、アーティストの作品の権利を取得せずにモデルをトレーニングしているとして、しばしば批判されているからだ。
その他の変化
ビデオモデルのMidjourneyが発表されたのは、Discordで毎週行われているオフィスアワーでのことだった。どのように機能するのか、具体的にいつ期待できるのか、それ以上の詳細はない。
また、ユーザーは他の約束された変更、例えば最終的にDiscordから永久に離れることや、Midjourneyのためのより良いインターフェイスを持つことを待つことができない:
Feature image: generated with Midjourney V6 for CineD