巧妙で革新的なAIベースのフィルターで有名なLightricksは、SFでさえも予想しなかったものを生み出した。このビジュアルテック企業は、LTX Studioをリリースすることで、AI生成ビデオコンテンツの世界を再定義した。LTX Studioは、”ストーリーテリングの変革 “というかなり大げさなスローガンを掲げているが、現在の同業他社とは異なり、これまでに見たことのないレベルのコントロールを提供するAIエンジンだ。
OpenAIのSORAの話題はまだ残っているが、Lightricksは革命的な新ツールLTX Studioでゲームをアップグレードしている。一見SORAの方がリアルで洗練されたように見えるが、LTX Studioにはもっと重要な特徴がある。LTX Studioは、ユーザーが最終的な映像をかつてないほどコントロールできるようにしている。
LTX Studioは、AIベースのコンテンツ制作で顕著な問題の1つである「選択的コントロール」を解決する。その中核となるクリエイティブ・プロセスは、AIジェネレーターの基本的なルールに従っている: テキストからビデオへ。クリエイティブなビジョンを指定するテキストを入力するだけで、AIがビデオを生成する。ほとんどのジェネレーターは、それ以上のことはしない。プロンプトを再投稿すればAIが新しいビデオを生成するが、正確な、あるいは選択的なコントロールはかなり稀な機能だ。この点で、LTX Studioは同業他社とは一線を画しており、複数の項目を具体的に選択、編集、追加することができる。
各ビジュアルプロセスのためのファイヤースターター
次の超大作の大まかなアイデアが浮かんだとする。関連するキーワードをいくつか入力すると、LTX Studioはそれを初歩的なスクリプトにし、このスクリプトがAIに入力されると、それに基づいてビデオを生成する。この部分だけでも、あらゆるアイデアやひらめきのプロセスをスピードアップさせることができるが、このシステムをユニークなものにしているのは次に来るものだ。作業用の映像が手に入るのだ。
この初期のワークスペースのスクリーンショットでわかるように、映像はカットごとに分割され、それぞれにあらすじが設定されている。これらのカットは、切り替えたり、差し替えたり、カットしたり、(連続した「フッテージ」を生成して)拡大したりすることができる。
完全な編集スイート
LTX Studioは完全な編集スイートを提供する。音楽、VFX、ボイスオーバー、カット、トランジションなど、最終的なビデオで微調整できる。この機能は(他にもあるが)LTX Studioを革命的なものにし、AIの群れから一線を画している。しかし、それだけではない。
キャラクターの一貫性
キャラクターの一貫性は、現代のチューリングテストにおける主要なハードルのひとつだ。AIジェネレーターは、この種の連続性に苦労しているようで、人間の目にははっきりとわかるほど微妙に異なるキャラクター・レンダリングを作成する。LTX Studioはこの問題をカバーしていると謳っている。このシステムでは、外見と性格特性の両方を包含する明確なキャラクターを生成することができ、より親近感のある “本物 “と感じられるキャラクターをエミュレートすることを目指している。
3D知覚
LTX Studioカムは、3次元オブジェクトも「知覚」する。それ自体は3Dアプリケーションではないが、この知覚はいくつかの興味深い機能を可能にする。ユーザーは、カメラの動きやアングル、キャラクターやオブジェクトの動き、照明の位置をコントロールすることができる。また、メインキャラクターはそのままに、スタイリングや雰囲気、周囲の照明状況などを変更することもできる。
キャスティング
周囲の雰囲気を変えることができるように、すべてのキャラクターをクリエイティブなビジョンに完璧に合うように変更、編集、微調整することができる。まったく同じシーンでも、キャラクターの髪型や服装、メイクを変えることができる。それだけではない。民族、性別、身長、種族など、すべてがあなたの意のままになる。
可能性は無限大のように思えるが、おそらくそうなのだろう。もちろん、この記事でそのすべてを網羅しているわけではないし、AIの常として、まだ始まったばかりだ。しかし、この新しいツールが強力であるのと同じくらい(実際そうなのだが)、まだいくつかの欠点がある。
まだ欠けているもの
現時点では、LTX Studioから出力されるビデオレンダリングは、AIが生成したコンテンツに関連する視覚的な特徴がある。SORAの出力ほど(恐ろしく)洗練されているようには見えないが、様々な使用例で間違いなく使えるだろう。さらに、AIは音声を生成することはできないようだ。ボイスオーバーは廃止されているが、リップシンクやボーカルの音声を合わせて話すキャラクターは見たことがない。また、手や “同期していない “動き(例えば、男性が足よりも速く動き、舗装道路を “滑る “など)にも問題がある。テストが進むにつれて、おそらくもっと多くの欠点が見つかるだろうが、それらはこの製品の破壊的な性質が大きく上回っている。
将来はどうなる?
現時点では、あえて予言はしない。先月はこの分野に法外な進歩をもたらしたし、ここ数年も同様だ。実に不可解な時代だ。私は、Lightricksがこの強力なツールを他の既存の(そして将来の)ツールに組み込むかどうか、またどのように組み込むかを見守りたい。また、LightricksがC2PAのような認証イニシアティブと協力するかどうかも見てみたい。この種のツールで初めての長編映画や自主制作ドキュメンタリーを編集することを想像してみてほしい。ポストでカメラや照明を再調整したり、同じシーンで異なるスタイルや雰囲気をテストしたりすることを想像してみてほしい。音楽と完璧に調和するように、自分の映像に基づいて数フレーム追加することを想像してほしい。ボタンをクリックするだけで、同じコマーシャルビデオをさまざまな視聴者に適応させることができる。なんて素晴らしい時代なんだ LTX Studioでは、リクエストを受け付けている。