非公式・AI自動要約ニュースサイト(各AI企業の公式とは無関係)
AI News JP / www.ai-news.jp
📰 ニュース Runway 🟠 重要 動画 · 出典: Runway

90%以上がAI生成動画を見分けられない結果が明らかに。技術の進化がもたらす影響を考えるべき。

AI生成動画の識別能力に関する研究結果

原題: Runway Research | The Turing Reel

重要度の根拠: AI生成動画の識別能力が低下していることは多くの人に影響を与えるため。

要約

Runwayが実施した研究によると、1,043人の参加者のうち90%以上がAI生成動画と実際の動画の区別ができませんでした。この研究は、最新のGen-4.5モデルによる動画生成技術の進歩を示しており、動画の真偽を見極めることがますます困難になっていることを示唆しています。Runwayは、誰でも実際にこの識別能力を試せるサイトを公開しました。

要点

  • 90%以上がAI動画を識別できず
  • Gen-4.5モデルの進化を示唆
  • 動画の真偽に関する考え方が変化
  • 誰でも識別能力を試せるサイトを公開
  • 人に関連する動画は比較的識別可能
開発者向け技術解説(API・実装詳細・破壊的変更)を見る

Runwayは、Gen-4.5モデルを使用して生成された動画と実際の動画を区別できるかどうかを検証するため、1,043人の参加者を募り、各参加者に20本の動画(10本の実際の動画と10本の生成動画)を視聴させました。参加者のうち9.5%(99人)が統計的に有意な精度を達成し、全体の検出精度は57.1%でした。人に関連する動画は58-65%の精度で検出できましたが、動物や建築に関しては45-47%と逆に識別が困難でした。この研究は、動画の真偽に関する考え方に根本的な変化をもたらす可能性があります。

本文の日本語訳(全文)を見る

合成ビデオに関する知覚研究を行いました。私たちは、同じフレームから始まる2本の動画を人々に見せました。一方は実際に撮影されたもので、もう一方はRunway Gen-4.5で生成されたものでした。私たちは彼らに本物を識別できるかどうかを尋ねました。成功したのは5%でした。私たちは結果を公表し、あなた自身で試してみることができるようにしています。

AIはあなたが本物のビデオを識別できるか?私たちは1,000人に同じフレームからの2本の動画を見せました - 1本は実際のもので、もう1本は生成されたものでした。10%未満の人が違いを見分けることができました。

AI動画生成モデルは、2023年初頭に初の公開テキストからビデオへのモデルであるGen-2をリリースして以来、急速に進化しています。2年前、これらのモデルは数秒の間に荒く、ピクセル化されたクリップを生成するのに数分かかりました。今日では、リーディングモデルは実際のビデオとほぼ区別できない出力を一貫して生成することができます。

今週、私たちは最新のベースモデルであるGen-4.5の画像からビデオへの機能をリリースしました。今日は、人々が5秒の動画が本物か、私たちのモデルによって生成されたかを判断する能力を評価する新しい研究を公開しています。また、誰でも自分で試すことができる新しいサイトを立ち上げています。

この研究では、1,043人の参加者を無作為に募集しました。各参加者は、20本の動画(10本の実際のもの、10本の生成されたもの)をランダムな順序で視聴し、それぞれが本物かAI生成かを判断しました。各動画は一度だけ生成され、出力は編集されず、品質を向上させたり結果を歪めたりするために再生成されることはありませんでした。

90%以上の参加者は、Gen-4.5の出力を実際のビデオと確実に区別できませんでした。1,043人の参加者のうち99人(9.5%)だけが統計的に有意な精度(15/20以上正解、p < 0.05、二項検定)を達成しました。全体の検出精度は57.1%で、偶然よりわずかに高いだけでした。実際の動画(58.0%)と生成された動画(56.1%)のパフォーマンスは似ており、体系的な検出戦略は示されませんでした。

検出精度はコンテンツカテゴリによって異なりました。人に関連する動画(顔、手、アクション)は検出が容易で(58-65%)、動物や建築は偶然以下(45-47%)でした - 参加者は生成された動画を本物と誤認する可能性が高かったです。

これらの結果は、動画の真偽に関する考え方に根本的な変化をもたらすものです。私たちは長年にわたり、一般的なワールドモデルの構築に向けて努力してきました。リアルなシミュレーションは、物理的な世界での難しい問題を解決するための前提条件です。Gen-4.5は、私たちが今までに構築した中で最も強力なシミュレーターです。しかし、その能力には責任が伴います。90%の人々が合成と実際の映像を確実に区別できないとき、特定のカテゴリの生成コンテンツが現実よりも説得力があるとき、検出は信頼と検証のための不十分な戦略です。

動画生成モデルは、トレーニングデータと計算をスケールし続ける限り、指数関数的に改善し続けるでしょう。AI業界と社会全体は、平均的な人々が動画がAIによって生成されたかどうかを判断できない状況に達しました。

写真からPhotoshop、従来のCGIに至るまで、技術は一貫してコンテンツの「リアル」を定義する世論を変えてきました。AIモデルが引き続き改善されるにつれて、同様の変化が期待されます。Runwayを含む基盤モデル開発者は、モデル出力の質に関する公共の議論を推進し、この技術がもたらす社会的課題を軽減する方法を探る責任があると考えています。また、私たちはAI研究とイノベーションの限界を押し広げ続ける必要があります。

すべてのRunway生成出力にはC2PAメタデータが含まれており、私たちのモデルが生成するコンテンツの出所と由来を証明できます。このオープンな技術基準は、さまざまなメディア会社やニュース組織によって受け入れられていますが、絶対的ではありません。私たちは、信頼を維持しながら創造的な可能性を可能にする新しい、より強力な基準を構築する必要があります。それにはC2PAのような技術的解決策だけでなく、新しいリテラシー、更新された編集基準、および真偽についての継続的な対話が必要です。

モデル研究対象: 一般ユーザー対象: 開発者

出典: https://runwayml.com/research/theturingreel

媒体: Runway

※本記事は Anthropic / OpenAI / Google / Meta / Mistral / DeepSeek / Sakana 等各社の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。