ホームページ :テクノロジーを簡単に楽しむ、未来を自由に見る

GoogleのVeo 3ビデオAI、字幕精度に問題

Googleの最新ビデオ生成AI「Veo 3」は、音声と対話を生成する一方で、字幕の精度に問題があり、特に不明瞭な字幕がしばしば追加される。

最新の更新

Googleの最新のビデオ生成AIモデル「Veo 3」は、5月末に発表され、クリエイターたちはその機能を試すためにすぐに使用を開始しました。Veo 3は、前モデルから数ヶ月後に登場し、ユーザーが初めて音声や対話を生成できるようになったことで注目を集めました。これにより、広告やASMRビデオ、映画の予告編、ユーモラスな街頭インタビューなど、8秒の超リアルなクリップが次々に作成されました。アカデミー賞ノミネート監督のダーレン・アロノフスキーは、ツールを使用して「Ancestra」という短編映画を制作しました。Google DeepMindのCEOデミス・ハサビスは、ビデオ生成技術が「サイレント映画時代からの脱却」を果たしたと述べました。

しかし、ユーザーはすぐにいくつかの問題に気付きました。特に、Veo 3が対話を含むクリップを生成する際、指示に明示的に字幕を追加しないようにお願いしても、意味不明な字幕が加えられることがあり、字幕の精度に問題が生じています。この問題は、Veo 3の導入時にクリエイターたちにとって予想外の課題となっています。