【オセロ,将棋】ボードゲーム Part2【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム Part2【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト17:535 17/10/26 00:13:05.87 vVm7O/8N.net とりあえず、mnistのやつは正解をlabel_tで渡すみたいだけど 局面の勝率を正解にしたい場合はどうすればいいんだろう? ラベルと勝率じゃデータ構造違うよね多分? それとも同じなんだろうか… 18:535 17/10/26 00:16:30.06 vVm7O/8N.net 内積とると考えれば勝率を一次元のベクタと見なせばつじつまが合うのか? 19:名前は開発中のものです。 17/10/26 09:53:53.13 43FvyXwK.net >>17 mnistは、分類器(他クラス分類)なので、活性化関数はsoftmaxになり、教師データ はlabel_tで与えます。別にvec_tでも良いですが、例えば3という答えに対して、 label_tは{3}なのに対し、vec_tは{0,0,0,1,0,0,0,0,0,0}などとなって冗長なので、label_tが 用意されているわけです。他にも、誤差の計算方法が違うなんてのもあります。 一方、ゲームの勝敗予想は2値分類問題なので、活性化関数はsigmoidで、教師 データはvec_tとして、勝利を{1}、敗北を{0}として与えて学習させます。 オセロには引き分けがあるので、引き分けは{0.5}としてみましたが、勝率50%と引き 分けでは意味がまったく違うのが悩みの種です。2人ゼロ和完全情報ゲームでは 勝率50%というのは理論上存在しないのですが、強化学習の途中などでは生じます からね。 なお、tiny_dnnでは2値分類や回帰の学習には入力データも教師データもともにvec_t で与えてfitを用い学習します。mnistのような他クラス分類でlabel_tで教師データを与え、 学習をする時はtrainを使用します。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch