非公式・AI自動要約ニュースサイト(各AI企業の公式とは無関係)
AAI News JP / www.ai-news.jp
倫理・安全

ガードレール

AI に有害・違反コンテンツを出させないための制御層。

詳しい解説

出力フィルタ、入力検査、システムプロンプト制約、別モデルによる二次審査などで、機密漏洩や暴力・差別・違法行為への助言などを抑止する仕組みの総称。SaaS で AI を本番運用する際の必須レイヤ。NeMo Guardrails、Llama Guard、Constitutional AI 等が代表例。

別表記

ガードレールguardrails

関連用語

← 用語集一覧へ