私がビデオ編集者ではないと気づいた日
先月、2分間の製品ウォークスルーを録画しようとして18時間も費やしました。3テイク目で犬が吠えました。7テイク目では照明がおかしかった。12テイク目には台本を完全に忘れていました。プロジェクトを削除し、フリーランサーに450ドル払って、一般的な企業広告のようなビデオを作ってもらいました。それがきっかけでビデオAIツールをテストし始め、HeyGenを発見しました。これは実際に問題を解決し、自分が詐欺師のように感じることもありませんでした。
HeyGenは、デジタルアバターを使ってテキストをトーキングヘッドビデオに変換する生成AIプラットフォームです。カメラもマイクもスタジオも不要。スクリプトを入力し、アバターを選ぶ(または自分で作成する)と、AIがアバターがあなたの言葉を話すビデオを生成します。唇の動き、ジェスチャー、声の抑揚が同期します。
3ヶ月使ってみてわかったことは以下の通りです:
アバターのリアルさは不均一ですが、改善中です。 プリセットの「スタジオ」アバター(約100種類)は洗練されています。肌の質感、目の動き、微妙な首の傾きまで再現されています。カスタムアバターは、自分自身の5分間のビデオ録画が必要で、それを基に外見を複製します。結果は約80%の精度で、社内研修には十分ですが、手の動きやアバターがまばたきをする速さにわずかな不気味の谷を感じるでしょう。
声のクローンは機能しますが、完璧ではありません。 30秒の音声クリップをアップロードして声をクローンできます。AIはトーンとテンポを捉えますが、感情の幅は平坦です。スクリプトに怒りや興奮が必要な場合、アバターは中立的なままです。まるで落ち着いたニュースキャスターが弔辞を読んでいるかのようです。単純な説明や告知には問題ありません。
価格の現実:個人ユーザーは月額24ドル、チームは月額84ドル。 「クリエイター」プラン(月額24ドル)では、月10分のビデオ、1つのインスタントアバター、120以上のテンプレートが利用できます。「ビジネス」プラン(月額84ドル)では、月100分、3つのインスタントアバター、チームコラボレーションが可能です。無制限の分数やカスタムアバターが必要なら、エンタープライズプランで月額240ドル以上かかります。参考までに、フリーランサー1本のビデオコストはHeyGenの基本プラン1年分よりも高いです。
本当のキラー機能:翻訳。 HeyGenは40以上の言語に対応しています。英語でビデオを生成し、同じアバターが新しい音声にリップシンクするスペイン語、中国語、アラビア語版に複製できます。オンボーディング資料にこれを使い、ローカライゼーション予算を90%削減しました。
無視できない制限。 背景は静的(動的な環境はなし)。アバターは物を持ったりスライドとインタラクトできません。AIが技術用語を誤って発音することがあります(「APIエンドポイント」を3回も間違えました)。エクスポート品質は最大1080pで、4Kはありません。
プロのビデオ制作の代わりになるでしょうか?いいえ。しかし、社内メモ、営業ピッチ、教育コンテンツなど、自分で撮影するのに何時間も無駄にするような場面では、実用的な近道です。ただ、オスカー賞を獲れるとは期待しないでください。