Official · 速報 · AI要約未精査 2017.07.20 近接ポリシ最適化が強化学習分野を変えるか? 近接ポリシ最適化: 強化学習における新しい手法 OpenAIが強化学習アルゴリズムPPOを発表、実装と調整が簡単で性能も優れている 速報・AI要約未精査 Proximal Policy Optimization PPO reinforcement learning OpenAI News