FLUX.2 [klein]が登場。リアルタイムの画像生成が可能で、パフォーマンスも抜群。
FLUX.2 [klein]: インタラクティブな視覚知能へ向けて
原題: FLUX.2 [klein]: Towards Interactive Visual Intelligence
重要度の根拠: 新しい高速モデルのリリースは多くのユーザーに影響を与えるため。
要約
FLUX.2 [klein]が発表され、画像生成と編集を統合した高速モデルが登場しました。このモデルは、消費者ハードウェア上で13GBのVRAMで動作し、リアルタイムの画像生成を可能にします。小型ながらも高性能で、テキストから画像への生成や画像編集を迅速に行うことができます。特に、5倍のサイズのモデルに匹敵するパフォーマンスを提供し、オープンソースで利用可能です。
要点
- FLUX.2 [klein]は統合画像生成モデル
- 消費者ハードウェアで動作可能
- 5倍サイズのモデルに匹敵する性能
- オープンソースで利用可能
- リアルタイムの画像生成を実現
開発者向け技術解説(API・実装詳細・破壊的変更)を見る
FLUX.2 [klein]は、テキストから画像(T2I)、画像から画像(I2I)、およびマルチリファレンス生成をサポートする小型で高性能なモデルです。4BのベースモデルはApache 2.0ライセンスのもとで提供され、9BモデルはFLUX NCLが適用されます。最大の柔軟性を確保するために、完全なトレーニング信号を保持した未蒸留のモデルも用意されています。消費者GPU(例:RTX 3090/4070)で動作し、サブ秒で高品質の生成が可能です。
本文の日本語訳(全文)を見る
FLUX.2 [klein]が発表され、私たちの最速の画像モデルが登場しました。統合生成と編集を1秒未満で行うことができ、すでに所有しているハードウェアで動作します。Apache 2.0のもとで、4Bのモデルが提供されます。
本日、FLUX.2 [klein]モデルファミリーがリリースされました。これまでで最速の画像モデルです。FLUX.2 [klein]は、単一のコンパクトなアーキテクチャで生成と編集を統合し、エンドツーエンドの推論を1秒未満で実現します。品質を犠牲にすることなく、リアルタイムの画像生成が求められるアプリケーション向けに構築されており、13GBのVRAMで動作します。
視覚知能は新しい時代に突入しています。AIエージェントがより高度になるにつれ、リアルタイムで応答し、迅速に反復し、アクセス可能なハードウェア上で効率的に動作する視覚生成が必要です。kleinという名前はドイツ語で「小さい」を意味し、コンパクトなモデルサイズと最小限のレイテンシを反映しています。しかし、FLUX.2 [klein]は限られたものではありません。これらのモデルは、テキストから画像への生成、画像編集、マルチリファレンス生成において、通常ははるかに大きなモデルにしか実現できない卓越したパフォーマンスを提供します。
注:FLUX [dev]非商用ライセンスはFLUX非商用ライセンスに改名され、9B Kleinモデルに適用されます。ライセンスに対する実質的な変更はありません。
当社のフラッグシップ小型モデル。テキストから画像、単一リファレンス編集、マルチリファレンス生成における品質対レイテンシのパレートフロンティアを定義します。半秒未満で、5倍のサイズのモデルに匹敵するかそれを超える性能を発揮します。8B Qwen3テキストエンベッダーを用いた9Bフローモデルを基にし、4つの推論ステップに蒸留されています。
複数の入力画像を組み合わせ、概念をブレンドし、複雑な構成をサブ秒の速度で反復することができます。これほど早く、これほど良くできたモデルはかつてありません。
完全にオープンでApache 2.0のもとで利用可能です。最もアクセスしやすいモデルで、RTX 3090/4070のような消費者GPUで動作します。コンパクトながらも強力な性能を持ち、T2I、I2I、マルチリファレンスをサポートし、そのサイズを超えた品質を提供します。ローカル開発やエッジデプロイメント向けに構築されています。
完全な能力を備えた基盤モデル。蒸留されておらず、最大限の柔軟性のために完全なトレーニングシグナルを保持します。ファインチューニング、LoRAトレーニング、研究、およびコントロールが速度よりも重要なカスタムパイプラインに最適です。蒸留モデルよりも高い出力の多様性を持っています。
ライセンス:4BベースはApache 2.0、9BベースはFLUX NCLのもとで提供されます。
出典: https://bfl.ai/blog/flux2-klein-towards-interactive-visual-intelligence
媒体: Black Forest Labs
※本記事は Anthropic / OpenAI / Google / Meta / Mistral / DeepSeek / Sakana 等各社の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。