ポストプロダクションにおいて、編集者は素材を説得力のある物語に変えるために様々なテクニックを駆使する。その1つがフランケンバイティングと呼ばれる手法で、エディターが音声の断片をつなぎ合わせてシームレスな新しいストーリーを作り出す。観客は編集に気づかないかもしれない。
フランケンバイティングは、リアリティ番組、ドキュメンタリー、ニュースなどでよく使われる。時間を圧縮し、ドラマを盛り上げ、混沌としたシーンを明確にすることができる。しかし、多用されると、人の発言を操作することに倫理的、法的な問題が生じる。
編集者として、私はフランケンバイティングへの依存が高まっていることに気づいている。私は個人的に、フランケンバイティングに全面的に依存したドキュメンタリーシリーズをいくつか手がけてきた。言葉の断片を繋ぎ合わせ、インタビューの話者が実際には言っていない発言を作り出すことがある。このような編集は、ストーリープロデューサーの指示で行われることが多い。
プロデューサーがフランケンバイティングを好むのは、それがコスト削減につながるからだ。インタビューを短くし、制作時間を短縮し、撮影日数を少なくすれば、すべて経費削減になる。しかし、このアプローチは、編集者を誤解を招きやすい立場に置くことになる。
フランケンバイティングの様々な用途
フランケンバイティングは、ポストプロダクションにおいて様々な役割を果たす。適切に使用すれば、シーンの流れを大幅に改善できる。一般的な使い方は以下の通りだ:
- 会話の明確化 : 会話の明瞭化:間を取ったり、発言を組み合わせたりすることで、簡潔な台詞を作ることができる。
- 緊張感を生み出す: リアリティ番組では、場を盛り上げ、そのような展開にはならなかったかもしれない出来事を形作る。
- キャラクターの特徴を形成する: 映像をつなぎ合わせることで、編集者は参加者に明確な役割を与えることができる。
効果的ではあるが、フランケンバイトは編集と捏造の境界線を曖昧にする。
倫理性
混沌とした映像から洗練された物語を提供することは難しい。しかし、過剰なフランケンバイティングは、発言の真の意味を変えてしまう。新しく作られた発言が技術的には真実であったとしても、評価を傷つける誤った印象を与えかねない。
プロデューサーは、フランケンバイティングはビジネスの一部であり、厳しい締め切りの中でストーリーを作り上げるための「必要悪」だと主張するかもしれない。しかし、この作業は労働集約的でもあり、ポストプロダクションのスケジュールを圧迫する。
経費節減の代償
ドキュメンタリー制作チームにとって、フランケンバイティングは経費削減を可能にする:
- インタビューを短くする。
- 細部まで完璧に撮影する必要がないため、準備や撮影の日数が少なくて済む。
- スケジュールを早めることで、クルーや機材のコストを削減できる。
この戦略は予算面では有効かもしれないが、編集者の仕事量を増やすことになる。倫理的な意味合いも大きい。制作予算は現実的な制約であるが、話者の意図を捻じ曲げることは倫理的な一線を越える可能性がある。
編集者にとっての労力
フランケンバイティングは、ポストプロダクションにおける手っ取り早い修正ではない。編集者の作業時間を増やすことになる。シームレスな物語を作るということは、多くの場合、長いトランスクリプトの中から、自然に調和する音声の断片を探し出すことを意味する。それぞれの文章やフレーズを慎重に合わせ、編集し、連続性を保つために並べ替えなければならない。この骨の折れる作業には、何時間も試行錯誤を繰り返し、聞き直し、視聴者が被写体の言葉やトーンに不自然なズレを感じないよう、つなぎ目のひとつひとつを洗練させる必要がある。ポストプロダクションでは、このような労力を考慮した余分な時間が与えられることはほとんどない。
熟練した現場プロデューサーは、インタビュー対象者がストーリーに沿った言い方をするように誘導することで、この負担を軽減することができる。経験豊富なプロデューサーは、何度も、あるいは別の方法で質問をし直すタイミングを知っている。そうすることで、編集者が直接使えるような回答をインタビュー対象者に提供するよう促すことができる。このプロセスは、現場では何時間もかかるが、ポストでの大がかりな加工の必要性を大幅に減らすことができる。その上、被写体の声の信憑性が保たれる。
フランケンバイティング vs. AIボイスクローニング
AIボイスクローニングは、人の声を複製する技術であり、その人が話していない言葉であっても、その人が話しているように聞こえる新しい音声を生成する。しかし、フランケンバイティングとは異なり、AIボイスクローニングは、同意に関する懸念、誤用の可能性、人の意図や言葉を誤って伝えるなどのリスクに直面している。
どちらも人の言葉を整形するが、AIは文章全体を生成するのに対し、フランケンバイティングは実際の音声をつなぎ合わせる。どちらの手法も元のメッセージを変えてしまう可能性があり、信憑性と捏造の境界線が曖昧になる。
ElevenLabsのようなツールは、リアルな音声クローンを提供し、編集者はフランケンバイティングのような手間のかかる編集をすることなく、発言を明確にし、ストーリーの流れを強化することができる。
Artlistも最近、AI音声生成機能(クローンではない)を追加した。
法的には、どちらもグレーゾーンだ。契約はプロデューサーに編集権を与えるかもしれないが、ある時点で不当になる。AIボイスクローニングは、誰かの発言を整形するという点で、フランケンバイティングと異なるだろうか?
私にとっては、フランケンバイティングの方が手間がかかり、倫理的にはボイスクローニングと変わらない。もしAIによるボイスクローニングがドキュメンタリーシリーズやリアリティTVで受け入れられるようになれば、私はその効率化を歓迎するだろう。
しかし、こうした技術がより簡単で一般的になるにつれ、業界はより明確なガイドラインを必要とするかもしれない。フランケンバイティングがどれほど使われているか視聴者が気づけば、AIボイスクローニングと同じような批判に直面するのではないだろうか。