GAversaryが示す自然言語分類器の新たな脆弱性
自然言語分類器に対する進化的生成攻撃の脆弱性
査読前の可能性がある研究情報
GAversaryは、自然言語分類器に対する新たな攻撃手法を提案し、従来の方法よりも高い精度で脆弱性を評価します。
arXiv cs.AI
毎日更新・AIニュース考察
自然言語分類器に対する進化的生成攻撃の脆弱性
査読前の可能性がある研究情報
GAversaryは、自然言語分類器に対する新たな攻撃手法を提案し、従来の方法よりも高い精度で脆弱性を評価します。
査読前の可能性がある研究情報
OI-Benchは、大規模言語モデルが指示干渉に対する脆弱性を評価するための新しいベンチマークです。
速報・AI要約未精査
こんな人にAI研究者・機械学習エンジニア
arXiv cs.CL査読前の可能性がある研究情報
PixJailは、テキストから画像生成システムの脆弱性評価を自動化するフレームワーク
速報・AI要約未精査
こんな人にAIセキュリティ専門家・画像生成技術開発者
arXiv cs.AIHugging FaceとProtect AIが提携し、機械学習モデルのセキュリティを強化する取り組みを開始
こんな人に企業のAI担当者・機械学習エンジニア
Hugging Face Blog