肌の色と性別の偏見を150%改善!合成データで公正性を追求する新たな手法。
生成系システムにおける偏見の軽減に関する研究
原題: Runway Research | Mitigating stereotypical biases in text to image generative systems
重要度の根拠: 生成モデルの偏見軽減に向けた重要な研究成果
要約
最新のテキストから画像を生成するモデルは、特定のグループ、特に肌の色が明るいとされる人々や男性を過剰に代表する社会的偏見を示すことが知られています。本研究では、さまざまな肌の色や性別を持つ合成データを用いてモデルを微調整する方法を提案し、異なるグループ間で公平な結果を確保することを目的としています。結果、肌の色の認識における公平性メトリックが150%、性別において97.7%改善されました。すべてのテキストプロンプトとトレーニング画像生成用のコードは公開される予定です。
要点
- 肌の色や性別のバイアスを軽減する手法
- 合成データを用いたモデルの微調整
- 公平性メトリックの大幅改善
- トレーニング用コードとプロンプトの公開予定
開発者向け技術解説(API・実装詳細・破壊的変更)を見る
本研究では、テキストから画像を生成するモデルのバイアスを軽減するために、肌の色や性別に関して多様な合成データで微調整する手法を提案しています。具体的には、エスニシティ、性別、職業、年齢層などの組み合わせから生成されたテキストプロンプトを使用し、合成データを作成します。DFTモデルは、肌の色の認識において150%、性別において97.7%の公平性メトリックの改善を示しました。今後、トレーニング画像を生成するためのすべてのテキストプロンプトとコードが公開される予定です。
本文の日本語訳(全文)を見る
最先端のテキストから画像を生成するモデルは、特定のグループ、特に肌の色が明るいとされる人々や男性を過剰に代表する社会的偏見を示すことが知られています。本研究では、こうした偏見を軽減し、異なるグループ間で結果が公平であることを保証する方法を提案します。私たちは、さまざまな肌の色と性別を持つ合成データでテキストから画像を生成するモデルを微調整することによってこれを実現します。この合成データは、エスニシティ、性別、職業、年齢層などの多様なテキストプロンプトの乗算的組み合わせから構成されています。私たちの多様性微調整(DFT)モデルは、肌の色の認識における公平性メトリックを150%、性別において97.7%改善します。ベースラインと比較して、DFTモデルはより多くの肌の色が暗いと見なされる人々と女性を生成します。オープンリサーチを促進するために、私たちはすべてのテキストプロンプトとトレーニング画像を生成するためのコードを公開します。
出典: https://runwayml.com/research/mitigating-stereotypical-biases-in-text-to-image-generative-systems
媒体: Runway
※本記事は Anthropic / OpenAI / Google / Meta / Mistral / DeepSeek / Sakana 等各社の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。