基礎
コンテキストウィンドウ
LLM が一度に「読める」最大トークン数。Claude や GPT は 20 万〜100 万トークン級。
詳しい解説
1 回の対話で入力 + 出力に使える上限トークン数。長いほど大きな文書を一括処理できるが、メモリ消費とレイテンシも増える。2026 年時点で主要モデルは概ね 20 万〜100 万トークン級。これを超える長文を扱う場合は RAG や要約による前処理が必要。
別表記
コンテキストウィンドウcontext windowコンテキスト長
LLM が一度に「読める」最大トークン数。Claude や GPT は 20 万〜100 万トークン級。
1 回の対話で入力 + 出力に使える上限トークン数。長いほど大きな文書を一括処理できるが、メモリ消費とレイテンシも増える。2026 年時点で主要モデルは概ね 20 万〜100 万トークン級。これを超える長文を扱う場合は RAG や要約による前処理が必要。