March, 2024 - 原田・黒瀬・椋田研究室 Blog

【論文紹介】オンライン強化学習においてベルマン誤差の歪みを補正するQ学習

2024-03-31

近年、深層強化学習の分野では、歪んだ誤差分布が学習に悪影響を及ぼすことが指摘されています。その問題に取り組み、新しい手法を提案した論文「Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning」について著者の大村が解説します。

March 2024