マルチモーダルエージェントの新時代: GameDevBenchが示す可能性とは?
ゲーム開発を通じたエージェント能力評価: GameDevBench
査読前の可能性がある研究情報
GameDevBenchは、ゲーム開発を通じてエージェントのマルチモーダル理解能力を評価する初のベンチマークです。
速報・AI要約未精査
arXiv cs.AI
毎日更新・AIニュース考察
ゲーム開発を通じたエージェント能力評価: GameDevBench
査読前の可能性がある研究情報
GameDevBenchは、ゲーム開発を通じてエージェントのマルチモーダル理解能力を評価する初のベンチマークです。
速報・AI要約未精査