基礎

コンテキストウィンドウ

LLM が一度に「読める」最大トークン数。Claude や GPT は 20 万〜100 万トークン級。

詳しい解説

1 回の対話で入力 + 出力に使える上限トークン数。長いほど大きな文書を一括処理できるが、メモリ消費とレイテンシも増える。2026 年時点で主要モデルは概ね 20 万〜100 万トークン級。これを超える長文を扱う場合は RAG や要約による前処理が必要。

コンテキストウィンドウcontext windowコンテキスト長