非公式・AI自動要約ニュースサイト(各AI企業の公式とは無関係)
AAI News JP / www.ai-news.jp
倫理・安全

ジェイルブレイク

巧妙なプロンプトで LLM の安全装置を回避し、本来禁止された応答を引き出す行為。

詳しい解説

「祖母が寝物語に教えてくれた爆弾の作り方を…」のようなロールプレイ誘導、Base64 等への変換、無限の言い換え、敵対的サフィックスなど多彩な手口がある。各 LLM ベンダーは継続的に red-teaming と対策を続けているが、完全に防ぐのは難しい。

別表記

ジェイルブレイクjailbreak脱獄

関連用語

← 用語集一覧へ