視覚言語モデルの安全性を問い直す——PHANTOMが示唆する新たな評価フレームワーク
PHANTOM: 視覚言語モデルに対するマルチモーダル悪意のある攻撃データセット
査読前の可能性がある研究情報
視覚言語モデルに対する大規模な悪意のある攻撃データセットPHANTOMが公開されました。
速報・AI要約未精査
毎日更新・AIニュース考察
PHANTOM: 視覚言語モデルに対するマルチモーダル悪意のある攻撃データセット
査読前の可能性がある研究情報
視覚言語モデルに対する大規模な悪意のある攻撃データセットPHANTOMが公開されました。
速報・AI要約未精査
査読前の可能性がある研究情報
Holmesは、大規模モバイルアプリケーションのクラッシュ診断を効率化する多エージェントシステムです。
速報・AI要約未精査
こんな人にソフトウェアエンジニア・品質保証担当者
arXiv cs.AI査読前の可能性がある研究情報
コンパクトなVLMが歯科診断で大規模モデルと同等以上の性能を発揮
速報・AI要約未精査
こんな人に医療AI担当者・口腔画像解析技術開発者
arXiv cs.AI査読前の可能性がある研究情報
Beaverは、複数のモダリティから科学的キュレーションを支援するエージェントハーネスを開発
速報・AI要約未精査
こんな人にAI研究者・科学情報キュレーター
arXiv cs.AI査読前の可能性がある研究情報
マルチモーダルフィッシング脅威検出のための新しいハイブリッドパイプラインが提案された
速報・AI要約未精査
こんな人にセキュリティエンジニア・フィッシング対策担当者
arXiv cs.CL査読前の可能性がある研究情報
MMOUは、長くて複雑な現実世界のビデオに対するマルチモーダル理解と推論能力を評価する新しいベンチマークです。
速報・AI要約未精査
こんな人にAI研究者・マルチモーダルモデル開発者
arXiv cs.CL査読前の可能性がある研究情報
アルツハイマー病の早期診断を効率化する段階的マルチモーダル予測手法 ProMUSE
速報・AI要約未精査
こんな人に医療技術者・神経科学者
arXiv cs.AI査読前の可能性がある研究情報
NRITYAMは、言語モデルが世界中の舞踊伝統を理解する能力を評価する大規模データセットです。
速報・AI要約未精査
こんな人にAI研究者・文化遺産保護団体
arXiv cs.AI査読前の可能性がある研究情報
マルチモーダルKB-VQAシステムにおける「先頭重視」バイアスが明らかに
こんな人にAI研究者・KB-VQAシステム開発者
arXiv cs.AI査読前の可能性がある研究情報
ContextRLは、大規模言語モデルが長文や複雑な状況で重要な情報を特定する能力を向上させる強化学習手法
こんな人にAIアシスタント開発者・自動化システムエンジニア
arXiv cs.CL