ゲーマーLV90 人工知能編at GAMEDEVゲーマーLV90 人工知能編 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト11:ゲーマーLV90 18/05/03 17:56:08.21 aC7LfhT5.net フェーズ 学習データ作成モード ざっくり モード=状態に対して学習データを参照して 回数が少ない行動を取る 回数が同じ場合は 行動変数小さい順 や 行動01から順に 状態ランダムテーブルシャッフル 状態 テーブルの1番 状態認識 モード参照 行動 報酬獲得 記憶 状態 テーブルの2番 状態認識 モード参照 行動 報酬獲得 記憶 テーブル13まで終わったら 状態ランダムテーブルシャッフル 状態 テーブルの1番 状態認識 モード参照 行動 報酬獲得 記憶 13×13=169 で表完成 フェーズ 学習データ使用モード ざっくり モード=状態に対して学習データを参照して 報酬が一番高く確率が高い行動を選択 確率が同じ場合新しいのを選択 状態nに対して作成した表の行動13を選択でモードの表現 12:ゲーマーLV90 18/05/03 17:58:49.65 aC7LfhT5.net とりあえず要素はこんな感じです 説明なしでも伝わるか時間置いてみようと思います 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch