LLMのバグ修正能力、新たな評価基準が登場
大規模なバグ修正ベンチマークMegaBugFix:LLMによるコード腐食と評価
査読前の可能性がある研究情報
MegaBugFixは、LLMのバグ修正能力を評価するための大規模なベンチマークを提供します。
arXiv cs.AI
毎日更新・AIニュース考察
大規模なバグ修正ベンチマークMegaBugFix:LLMによるコード腐食と評価
査読前の可能性がある研究情報
MegaBugFixは、LLMのバグ修正能力を評価するための大規模なベンチマークを提供します。