行動科学におけるAIモデル評価の新基準:BehaviorBenchとは何か?
BehaviorBench: 行動科学タスク向け基盤モデル評価ベンチマーク
査読前の可能性がある研究情報
BehaviorBenchは、行動科学タスク向けの基礎モデルを包括的に評価するベンチマーク
arXiv cs.CL
毎日更新・AIニュース考察
BehaviorBench: 行動科学タスク向け基盤モデル評価ベンチマーク
査読前の可能性がある研究情報
BehaviorBenchは、行動科学タスク向けの基礎モデルを包括的に評価するベンチマーク