Rethinking DQN

原文来自自己很早前写的一篇公众号文章:Rethinking DQN Playing Atari with Deep Reinforcement Learning 为什么增加Replay Memory有效? 一个样本可能被多次随机采样到...

March 22, 2019 · 4 min · Monkeyzx