LLMのバグ修正能力、新たな評価基準が登場
大規模なバグ修正ベンチマークMegaBugFix:LLMによるコード腐食と評価
査読前の可能性がある研究情報
MegaBugFixは、LLMのバグ修正能力を評価するための大規模なベンチマークを提供します。
arXiv cs.AI
毎日更新・AIニュース考察
大規模なバグ修正ベンチマークMegaBugFix:LLMによるコード腐食と評価
査読前の可能性がある研究情報
MegaBugFixは、LLMのバグ修正能力を評価するための大規模なベンチマークを提供します。
査読前の可能性がある研究情報
分子構造と自然言語の対応データセットを自動生成する手法が提案されました。
速報・AI要約未精査
こんな人に化学分野の研究者・AI言語モデル開発者
arXiv cs.CL査読前の可能性がある研究情報
PETRAは石油工学分野向けの大規模データセットとパイプラインを提供し、情報検索性能を向上させる。
速報・AI要約未精査
こんな人に石油工学の研究者・機械学習エンジニア
arXiv cs.CL査読前の可能性がある研究情報
C-QUERIは、議会公聴会から質問と回答のペアを抽出し、政党間での戦略的違いを明らかにする。
速報・AI要約未精査
こんな人に政策立案者・政治学者
arXiv cs.CL