すべてのAIアート愛好家に待望のニュースだ!Midjourneyは最近、新しいインペインティング機能をリリースした。まだテスト段階だが、結果はすでにかなり印象的だ。このアップデートを「Adobeのジェネレーティブ・フィルに対する回答」と呼ぶ人もいる。また、”ついに!”と興奮気味に反応する人もいる。我々はまた、MidjourneyのVary Region機能を試してみたが、これは様々な映画制作作業をサポートする可能性を秘めていると思う。
Midjourneyは、市場で最高の画像ジェネレーターの1つと考えられている。開発者は独立した研究所に所属しているため、新しいアップデートや機能を猛スピードでリリースしている。(つい数週間前、私たちは最新のズームアウト機能を試した)。また、このディープラーニング・モデルの正確な言語理解と驚くほど写実的な結果も、ユーザーから高く評価されている。
しかし、Midjourneyに欠けていた中心的なものの1つは、画像の選択した領域を変更する可能性だった。最初からInpaint機能を備えていたStable DiffusionやAdobeのGenerative Fillと比べて、Midjourneyのユーザーは生成されたビジュアルの細部を調整することができなかった。これにはイライラさせられたが、ようやくこの問題がある程度なくなる。
MidjourneyのVary Region機能のテスト、ヒント、トリックに入る前に、注意事項があります。このAI画像ジェネレーターを使ったことがない方は、まず私たちの記事「AIツールを使って動画用のアーティスティックなムードボードを作成する」をお読みください。そこでは、Midjourneyのニューラルネットワークを使った作業の基本が学べます。
MidjourneyのVary Region機能を使う2つの方法
ユーザーは通常通り、MidjourneyのDiscord Botから新機能にアクセスできる。画像を生成してアップスケールすると、その下に “Vary (Region) “というボタンが表示さ れる。
ボタンをクリックすると、チャットから直接エディターのある新しいウィンドウがポップアップする。そこでは、長方形の選択ツールかフリーハンドの投げ縄のどちらかを選ぶことができる。どちらか、または両方を使って、画像の微調整したい部分を選択する。
2つの可能性がある。一つ目は「送信」をクリックし、Midjourney にビジュアルの定義された部分を再生成させること。この場合、Midjourneyはこの部分のミスを修正し、元のテキスト入力に従ってより良い結果を得ようとする。私の例では、ニューラルネットワークは中世の戦士の新しいビジュアライゼーションを作成し、それを背景に合わせた。
Midjourneyの新機能「Vary Region」を活用するもう一つの方法は、「Remix」モードを導入することだ。この方法では、新しいプロンプトを書くことで、選択した領域の内容を完全に変更することができる。”/settings “と入力し、”remix mode “をクリックして有効にする必要がある。
テキストプロンプトを変更してイメージを洗練させる
リミックスモードを有効にすると、エディターに追加のテキストボックスが表示され、選択した領域のプロンプトを変更できるようになる。その領域で見たいものを正確に記述する。導入したい、あるいは除外したい詳細について、具体的に記述する(以下、表現についてのヒントをいくつか紹介する)。AIはルート画像のオリジナルのアスペクト比を保持する。
上のスクリーンショットにあるように、私は戦士の周りの環境全体を変えることにし、彼を霧の森から廃村にテレポートさせた。結果は予想外に良かった。4つの画像バリエーションのうち3つが私の説明と正確に一致し、奇妙なアーティファクトも含まれていなかった。
もちろん、1回のテストが成功したからといって、それが前例となるわけではない。しかし、つい最近発表されたばかりで、まだベータテスト中のこのツールにとって、結果は驚くべきものに思える。
新しいMidjourneyのVary Region機能で特に素晴らしいのは、柔軟性が導入されていることだ。再生成された画像を間に挟んでアップスケールすることで、画像の一部を何度でも改善し、望ましい結果を得ることができる。例えば、撮影監督、プロデューサー、プロダクション・デザイナーに特定のショットを伝えたいとする。今なら、デッサン力がなくても、頭から紙に書き出すことができそうだ。試行錯誤は必要かもしれないが、可能性はあるだろう。
最高の画像結果を得るためのヒント
他のニューラルネットワークと同様、Midjourneyはまだ学習中だ。そのため、すぐに驚異を期待してはいけない。Vary Region機能から最良の結果を得るために、以下にいくつかのヒントを挙げる(AI開発者と私からの提案を組み合わせたもの):
- この機能は、画像の大きな領域に最も効果的だ。クリエイターによると、画像の20%から50%の領域を選択すると、最も正確で一貫性のある結果が得られる。
- プロンプトを変更する場合、新しいテキストがその特定の画像にマッチしていれば、ニューラルネットワークはより良い結果を提供する。例えば、Midjourneyはキャラクターに帽子を追加しても問題ない。しかし、極端に変わったシナリオ(部屋にいる象のような)を描くように頼むと、システムは意図した結果を出さないかもしれない。
- また、この機能はMidjourneyで動作するいくつかのコマンドやパラメータを尊重する。そのため、否定的なプロンプトに使用されるパラメータである”-no “コマンドの威力をお忘れなく。これは画像から指定された要素を削除するようAIに促す。
映像制作におけるMidjourneyのVary Region機能の使用方法
ご存知の通り、私はMidjourneyをビジュアル・リサーチ、アーティスティックなムードボードの作成、今後のプロジェクトのピッチ・ペーパーの準備に愛用している。最新のアップデートは、このコンセプチュアルな作業を間違いなく簡素化し、具体的なビジョンを伝えたい場面で役に立つだろう。百聞は一見にしかずとはよく言ったものだ。
それとは別に、MidjourneyのVary Region機能を使って、素早くプリビズを作成することもできる。そのため、このツールを何度も使って、さまざまなシナリオを作成することができる。従って、私は自分の戦士をさまざまなシナリオに配置し、マッチカットの形でアニメーション化することで、彼のヒーローの旅の短いプレビューを作ることができた。それほど時間はかからなかったし、ビデオの結果がそれを物語っている:
それが常に目的に合うとは言わないが、シーンやシークエンスによっては、このようなプレビズで十分だ。
MidjourneyのインペイントとAdobeのGenerative Fillの比較
MidjourneyのVary Regionに現時点で決定的に欠けているのは、自分の画像(またはフィルムの静止画)をアップロードして、人工知能の助けを借りてその一部を改良する可能性だ。これによって、撮影されたシーンをVFX用に準備したり、撮影中の不穏な要素を素早くマスクしたりすることができる。
クールでしょう?これはすでにAdobeのGenerative Fillの能力の範囲内だ。Adobe Fireflyと呼ばれる独自のAIをベースにしたこの機能は、Photoshop(ベータ版)で利用できる。Creative Cloudのサブスクリプションを持っていれば、ソフトウェアをインストールして試すことができる。次の例では、最新の短編映画のスチール写真を使い、画像の一部を変更した。これで、主人公はちょっと魅力的なディナーを楽しむことができる:
Generative Fillは、指定した領域の消しゴムとしても機能する。プロンプトに何も入力しなければ、コンテンツに応じた塗りつぶしテクニックを使って、選択した要素を消す努力をする。一方Midjourneyは、定義された領域に常に新しいものを入れようとする。
つまり、私の考えでは、Midjourneyは決して新しいジェネレーティブ・フィルではない。しかし、この方向で発展しており、願わくば近いうちに似たような機能が導入されることを期待したい。なぜ「できれば」なのか?このアーティスティックな画像ジェネレーターで作成された写真のクオリティは、Adobeの革新的な技術をもってしても、まだ甲乙つけがたい。
その他の問題と制限
選択領域のサイズに関する問題にはすでに触れた。テストの1つで、私はワイドショットの戦士だけを置き換えようとした。それに応じてプロンプトを変更し、緑色のロングドレスを着た美しいエルフの女性を得ようとしたが、結果は期待はずれだった。
何度か試してみたが、唯一まともな写真は最後のもので、女性が視聴者に背を向けて立っている。他の絵は不穏なだけでなく、奇妙に見える。通常、Midjourneyは非常に魅力的な人間や人間に似た生き物を描くことができるにもかかわらず、だ。同じプロンプトを使って、上の写真にある困ったエルフのバリエーションを作るように頼むと、即座に素晴らしい結果を出してくれる:
次のアップデートでは、モデルが学習を続け、最終的には画像の小さな選択部分にも新しいスキルを適用してくれることを期待したい。
MidjourneyのVary Region機能で遊んでいる間に気づいた、その他の制限や問題点は以下の通り:
- Photoshopの多様で柔軟なツールと比べると、Midjourneyの投げ縄は慣れが必要だ。とはいえ、開発者が機能するエディターをDiscordに直接組み込めたことは注目に値する。
- さらに、消しゴムがない。そのため、選択範囲に素早く変更を加えることはできない。現時点では、画像のさまざまな部分に印をつけたステップを「元に戻す」ことしかできない。
- Midjourney の Vary Region ツールは、以下のモデルバージョンと互換性がある:V5.0, V5.1, V5.2, Niji 5
- DiscordコミュニティのMidjourneyユーザーも、何世代もの地域バリエーションを行うと、画像全体が徐々に暗くなることに気づいている。
まとめ
AIツールに関するどの記事でも、私は倫理の問題に触れている。もちろん、人工知能が私たちの仕事を奪ったり、大手の制作会社が、モデルを学習させた最初のアーティストの作品に適切な帰属表示をすることなく、生成されたアートを使用したりすることは望んでいない。しかし、Midjourneyのようなツールは、私たちの平凡な仕事をサポートしたり、私たちの仕事を向上させ、映画、アート、音楽の新しいアイデアを引き出す手助けをする、助けの手にもなり得る。ここでは、慎重かつ倫理的なアプローチが鍵となる。したがって、ニューラルネットワークの使い方を学び、アップデートに遅れないようにすることが重要なのだ。
Feature image credit: created with Midjourney for CineD