行動科学におけるAIモデル評価の新基準:BehaviorBenchとは何か?
BehaviorBench: 行動科学タスク向け基盤モデル評価ベンチマーク
査読前の可能性がある研究情報
BehaviorBenchは、行動科学タスク向けの基礎モデルを包括的に評価するベンチマーク
arXiv cs.CL
毎日更新・AIニュース考察
BehaviorBench: 行動科学タスク向け基盤モデル評価ベンチマーク
査読前の可能性がある研究情報
BehaviorBenchは、行動科学タスク向けの基礎モデルを包括的に評価するベンチマーク
趙瑾華氏が都市計画学部長に就任、AIと公共政策を融合して都市問題解決に取り組む
速報・AI要約未精査
こんな人に都市計画担当者・交通政策関係者
MIT News AI