思考順序学習がもたらす生成品質向上とは?
思考順序学習:拡散言語モデルにおけるトークン解読順序の研究
査読前の可能性がある研究情報
言語モデルの生成品質を向上させるため、トークン非マスキング順序の最適化手法が提案される
速報・AI要約未精査
Masked diffusion language models
Kullback-Leibler divergence
Self-Aware Scheduling (SAS)
Group Relative Policy Optimization
arXiv cs.AI