不完全情報下での強化学習、Big 2が示す新たな可能性とは?
インフォーマルな情報を持つ4人用カードゲーム「Big 2」における自己対局強化学習
査読前の可能性がある研究情報
Big 2ゲームにおける自己対局強化学習の研究がPPOの優位性を示す
arXiv cs.AI
毎日更新・AIニュース考察
インフォーマルな情報を持つ4人用カードゲーム「Big 2」における自己対局強化学習
査読前の可能性がある研究情報
Big 2ゲームにおける自己対局強化学習の研究がPPOの優位性を示す