高リスク医療状況でのLLMsの安全性は本当に確保できるか? extsc{MedHarm}が示唆する新たな課題
医療安全対応に失敗したとき:高リスク医療クエリ評価用ベンチマーク extsc{MedHarm}
査読前の可能性がある研究情報
大規模言語モデルの安全性を評価するための新たな高リスク医療クエリベンチマーク extsc{MedHarm} を導入
arXiv cs.AI
毎日更新・AIニュース考察
医療安全対応に失敗したとき:高リスク医療クエリ評価用ベンチマーク extsc{MedHarm}
査読前の可能性がある研究情報
大規模言語モデルの安全性を評価するための新たな高リスク医療クエリベンチマーク extsc{MedHarm} を導入