構造検証と意味監査が大規模言語モデルの安全性をどう高めるか?
DoubtProbe: 構造検証と意味監査によるブラックボックス脱獄防御
査読前の可能性がある研究情報
DoubtProbeは、大規模言語モデルの安全性を高めるための新しいブラックボックス脱獄防御フレームワークです。
速報・AI要約未精査
arXiv cs.CL
毎日更新・AIニュース考察
DoubtProbe: 構造検証と意味監査によるブラックボックス脱獄防御
査読前の可能性がある研究情報
DoubtProbeは、大規模言語モデルの安全性を高めるための新しいブラックボックス脱獄防御フレームワークです。
速報・AI要約未精査