月光級数学への挑戦:AIが研究レベルで見せる限界とは?
リーマンベンチ:月光級数学のためのAI評価基準
査読前の可能性がある研究情報
リーマンベンチは、競技数学と研究レベルの数学におけるAIの性能差を明らかにする新しい評価基準
速報・AI要約未精査
arXiv cs.AI
毎日更新・AIニュース考察
リーマンベンチ:月光級数学のためのAI評価基準
査読前の可能性がある研究情報
リーマンベンチは、競技数学と研究レベルの数学におけるAIの性能差を明らかにする新しい評価基準
速報・AI要約未精査
OpenAIが生命科学研究におけるAIの性能を評価するための新規基準「LifeSciBench」を導入
速報・AI要約未精査
こんな人にライフサイエンス分野の研究者・AIシステム開発者のための専門家
OpenAI News