スパースリワードが引き起こすLLMの推論ショートカットとは?
スパースリワードパラドックス:強化学習によるLLMの記憶ショートカットのメカニズム的解析
査読前の可能性がある研究情報
スパースリワードがLLMの記憶ショートカットを誘発し、推論性能に悪影響を与えるメカニズムを解明
速報・AI要約未精査
arXiv cs.CL
毎日更新・AIニュース考察
スパースリワードパラドックス:強化学習によるLLMの記憶ショートカットのメカニズム的解析
査読前の可能性がある研究情報
スパースリワードがLLMの記憶ショートカットを誘発し、推論性能に悪影響を与えるメカニズムを解明
速報・AI要約未精査