AI記事考察ノート

Preprint · 速報 · AI要約未精査 · 深堀り済 2026.06.11

Claw-SWE-Bench: オープンソースエージェントのコーディング能力評価ベンチマーク

査読前の可能性がある研究情報

Claw-SWE-Benchは、OpenClawのような汎用エージェントのコーディング能力を評価するための多言語ベンチマーク

速報・AI要約未精査

Claw-SWE-Bench OpenClaw SWE-bench アダプタ設計

arXiv cs.CL

Field Note 読みどころ

Claw-SWE-Benchは、OpenClawなどの汎用エージェントがSWE-benchで測定可能なコーディング能力を持つためには適切なアダプターが必要であることを示す
データセットは8言語43リポジトリのGitHubイシュー解決インスタンスを含む

プレプリント論文（査読前の可能性あり）

AI研究者ソフトウェアエンジニアエージェント開発者

絞り込み結果