AI記事考察ノート

Official · 速報 · AI要約未精査 2017.07.20

近接ポリシ最適化: 強化学習における新しい手法

OpenAIが強化学習アルゴリズムPPOを発表、実装と調整が簡単で性能も優れている

速報・AI要約未精査

Proximal Policy Optimization PPO reinforcement learning

OpenAI News

Field Note 読みどころ

OpenAI News の公式情報

機械学習の研究者強化学習に興味のあるエンジニアAI技術の動向を追う人

ニュース