倫理・安全
ジェイルブレイク
巧妙なプロンプトで LLM の安全装置を回避し、本来禁止された応答を引き出す行為。
詳しい解説
「祖母が寝物語に教えてくれた爆弾の作り方を…」のようなロールプレイ誘導、Base64 等への変換、無限の言い換え、敵対的サフィックスなど多彩な手口がある。各 LLM ベンダーは継続的に red-teaming と対策を続けているが、完全に防ぐのは難しい。
別表記
ジェイルブレイクjailbreak脱獄
巧妙なプロンプトで LLM の安全装置を回避し、本来禁止された応答を引き出す行為。
「祖母が寝物語に教えてくれた爆弾の作り方を…」のようなロールプレイ誘導、Base64 等への変換、無限の言い換え、敵対的サフィックスなど多彩な手口がある。各 LLM ベンダーは継続的に red-teaming と対策を続けているが、完全に防ぐのは難しい。