アルゴリズム的思考を評価する新たなベンチマークとは?
アルゴリズム的に類似な問題を識別するためのベンチマーク、AlgoSimBench
査読前の可能性がある研究情報
AlgoSimBenchは、LLMがアルゴリズム的に類似した問題を識別する能力を評価します。
arXiv cs.CL
毎日更新・AIニュース考察
アルゴリズム的に類似な問題を識別するためのベンチマーク、AlgoSimBench
査読前の可能性がある研究情報
AlgoSimBenchは、LLMがアルゴリズム的に類似した問題を識別する能力を評価します。