競技プログラミングにおけるLLM評価の新地平:UOJ-Benchとは何か?
競技プログラミングにおけるコード生成・ハッキング・修正能力評価の新ベンチマーク:UOJ-Bench
査読前の可能性がある研究情報
UOJ-Benchは競技プログラミングにおける大規模言語モデルの能力を評価する新たなベンチマーク
速報・AI要約未精査
arXiv cs.AI
毎日更新・AIニュース考察
競技プログラミングにおけるコード生成・ハッキング・修正能力評価の新ベンチマーク:UOJ-Bench
査読前の可能性がある研究情報
UOJ-Benchは競技プログラミングにおける大規模言語モデルの能力を評価する新たなベンチマーク
速報・AI要約未精査