【論文紹介】オンライン強化学習においてベルマン誤差の歪みを補正するQ学習
2024-03-31
近年、深層強化学習の分野では、歪んだ誤差分布が学習に悪影響を及ぼすことが指摘されています。その問題に取り組み、新しい手法を提案した論文「Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning」について著者の大村が解説します。
近年、深層強化学習の分野では、歪んだ誤差分布が学習に悪影響を及ぼすことが指摘されています。その問題に取り組み、新しい手法を提案した論文「Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning」について著者の大村が解説します。