知能研究スレ2

知能研究スレ2at FUTURE

知能研究スレ2 - 暇つぶし2ch169:>>168
18/08/27 09:43:35.46 Zq8VRJ9K.net BE:138871639-2BP(0)
URLﾘﾝｸ(img.5ch.net)
3.1
外的報酬のない好奇心に基づいた学習外的報酬を使用せずに、多数の環境に対する純粋な好奇心に基づく学習を拡大することから始めます。
We pick a total of 54 diverse simulated environments, as shown in Figure 1,
図1に示すように、合計54の多様なシミュレーション環境を選択し、
including 48 Atari games, Super Mario Bros., 2 Roboschool scenarios (learning Ant controller and Juggling), Two-player Pong, 2 Unity mazes (with and without a TV controlled by the agent).
Super Mario Bros.、Roboschoolシナリオ2（Ant Control and Jugglingを学ぶ）、Two-player Pong、2つのUnity mazes（エージェントによって制御されたテレビの有無にかかわらず）を含む48のAtariゲームを含みます。
この大規模分析の目的は、以下の質問を調査することです。
（a）外的な報酬なしに、さまざまなゲームで純粋な好奇心に基づいたエージェントを実行すると、実際にはどうなりますか？
（b）あなたはこれらのエージェントからどのような行動を期待できますか？
（c）ダイナミクスを基礎とした好奇心における異なる特徴学習の変種がこれらの行動に及ぼす影響は何か？
2
URLﾘﾝｸ(pathak22.github.io) URLﾘﾝｸ(pathak22.github.io)
5

次ページ

続きを表示

1を表示