AI記事考察ノート - Signal Field Notes

絞り込み結果

条件に一致した記事を、新しい順にまとめています。 3

Preprint · 速報 · AI要約未精査 · 深堀り済 2026.06.30

大規模言語モデルによるオンラインハラスメント攻撃の脆弱性

査読前の可能性がある研究情報

大規模言語モデルがマルチターンのオンラインハラスメント攻撃に対して脆弱性を示す研究

速報・AI要約未精査

LLM オンラインハラスメントマルチターン対話ジャイルブレイク

arXiv cs.AI

Field Note 読みどころ

プレプリント論文（査読前の可能性あり）

AIセキュリティ専門家オンラインプラットフォーム管理者言語モデル開発者

Preprint 速報 AI要約未精査深堀り済 06.25

査読前の可能性がある研究情報

LLMのジャイルブレイク評価における自動化されたスコアリングシステムの信頼性と堅牢性を検討

速報・AI要約未精査

こんな人にAIセキュリティ研究者・LLM開発者

arXiv cs.CL

Preprint ✓完成深堀り済 06.16

査読前の可能性がある研究情報

Rapid Responseフレームワークに対するプロンプトインジェクションによる攻撃手法が明らかに

こんな人にセキュリティ専門家・大規模言語モデル開発者

arXiv cs.CL