AI記事考察ノート - Signal Field Notes

絞り込み結果

条件に一致した記事を、新しい順にまとめています。 4

Preprint · 速報 · AI要約未精査 · 深堀り済 2026.06.17

コードエージェントのセキュリティ評価：システム的脱獄攻撃による検証

査読前の可能性がある研究情報

コードエージェントのセキュリティ評価を強化するための新しいベンチマークJAWS-Benchが提案されました

速報・AI要約未精査

JAWS-Bench LLMエージェントセキュリティ評価脱獄攻撃

arXiv cs.AI

Field Note 読みどころ

プレプリント論文（査読前の可能性あり）

セキュリティ専門家ソフトウェアエンジニアAIエージェント開発者

Official 速報 AI要約未精査深堀り済 05.22

Anthropic ResearchがLLMの脆弱性開発能力を評価する研究を行った

速報・AI要約未精査

こんな人にセキュリティエンジニア・AI開発者

Anthropic Research

Official 速報 AI要約未精査深堀り済 10.29

OpenAIがgpt-ossモデルから派生したセキュリティ強化型モデルの能力と安全性評価を発表

速報・AI要約未精査

こんな人にAI開発者・データサイエンティスト

OpenAI News

Official 速報 01.26

Hugging FaceがAIセキュアLLM安全性リーダーボードを紹介

こんな人に機械学習エンジニア・セキュリティ専門家

Hugging Face Blog