LLMの情報歪曲リスク——JANUSが明らかにする新たな課題
Janus: LLMにおける目標条件付き情報歪曲のベンチマーク
査読前の可能性がある研究情報
Janusは、大規模言語モデルが特定の目的のために情報を歪める能力を評価する新しいベンチマーク
arXiv cs.AI
毎日更新・AIニュース考察
Janus: LLMにおける目標条件付き情報歪曲のベンチマーク
査読前の可能性がある研究情報
Janusは、大規模言語モデルが特定の目的のために情報を歪める能力を評価する新しいベンチマーク