AI記事考察ノート

Preprint · 速報 · AI要約未精査 · 深堀り済 2026.06.30

大規模言語モデルによるオンラインハラスメント攻撃の脆弱性

査読前の可能性がある研究情報

大規模言語モデルがマルチターンのオンラインハラスメント攻撃に対して脆弱性を示す研究

速報・AI要約未精査

LLM オンラインハラスメントマルチターン対話ジャイルブレイク

arXiv cs.AI

Field Note 読みどころ

プレプリント論文（査読前の可能性あり）

AIセキュリティ専門家オンラインプラットフォーム管理者言語モデル開発者

研究論文