LLMの高階論理的推論、現状はどこまで達成可能か?
HOLMES: LLMにおける高階論理的推論評価
査読前の可能性がある研究情報
HOLMESは、現実世界でのLLMの高階論理的推論能力を評価する初のベンチマーク
速報・AI要約未精査
arXiv cs.AI
毎日更新・AIニュース考察
HOLMES: LLMにおける高階論理的推論評価
査読前の可能性がある研究情報
HOLMESは、現実世界でのLLMの高階論理的推論能力を評価する初のベンチマーク
速報・AI要約未精査