17/03/02 22:17:44.07 Ez+iQZgs.net
>>415
PFNは深層学習の基礎研究で全てを変える事は目指してないのではなかろうか。
彼らは深層学習応用と知識普及で貢献することに専念しているように見える。
2月に深層強化学習ライブラリを公開したけど、これは天才ではなく秀才の仕事だ。
深層強化学習ライブラリChainerRL
URLリンク(research.preferred.jp)
>Deep Q-Network (Mnih et al., 2015)
>Double DQN (Hasselt et al., 2016)
>Normalized Advantage Function (Gu et al., 2016)
>(Persistent) Advantage Learning (Bellemare et al., 2016)
>Deep Deterministic Policy Gradient (Lillicrap et al., 2016)
>SVG(0) (Heese et al., 2015)
>Asynchronous Advantage Actor-Critic (Mnih et al., 2016)
>Asynchronous N-step Q-learning (Mnih et al., 2016)
>Actor-Critic with Experience Replay (Wang et al., 2017)