AI記事考察ノート

Preprint · 速報 · AI要約未精査 · 深堀り済 2026.06.15

CORA: 多目的RLVRにおける思考-回答の一貫性向上技術

査読前の可能性がある研究情報

CORAは、大規模ビジョン-言語モデルにおける思考-回答の一貫性問題を改善する技術

速報・AI要約未精査

RLVR Consistency-Oriented Reasoning Alignment (CORA) Hybrid Reward Advantage Splitting (HRAS) Group Relative Policy Optimization (GRPO)

arXiv cs.CL

Field Note 読みどころ

プレプリント論文（査読前の可能性あり）

機械学習研究者AI開発エンジニア自動化システム設計者

絞り込み結果