Preprint · 速報 · AI要約未精査 · 深堀り済 2026.06.10 GW-DPOがLLMの指示階層をどう変えるか——5レベルの指令構造に迫る 重力加重優先度最適化による多層指令階層の強制 査読前の可能性がある研究情報 GW-DPOはLLMの多層指令階層を強制し、過剰拒否率を低減 速報・AI要約未精査 Gravity-Weighted DPO Instruction Hierarchies LLM DPO arXiv cs.CL