▲コンピュータ将棋スレッド145

▲コンピュータ将棋スレッド145at BGAME

▲コンピュータ将棋スレッド145 - 暇つぶし2ch755:名無し名人
18/12/27 16:07:48.13 RzIXkXyY0.net
初手76歩と26歩でどれくらい評価値が違うんだろうな

756:名無し名人
18/12/27 16:15:23.24 5hro4Km+0.net
Alphazero
先手で１敗
後手では９敗（宣言ルールで勝てるのに投了してるもの含）
elmoとレート差がありすぎて極端な数字になってるだけでしょ。
あと自己対戦はレート計算するとき普通誤差が拡大する

757:名無し名人
18/12/27 16:45:10.19 V4jbthxea.net
考察してる人の動画
> AlphaZero論文のデータから見る将棋界の未来予想図①
URLﾘﾝｸ(nico.ms)
対elmoの結果から推定されるAlphaZeroの先手後手のレート差は339.2(先手勝率87.52%)
対aperyqhapaqの結果から推定されるAlphaZeroの先手後手のレート差は132.2(先手勝率68.16%)
elmoとはレート差あり過ぎて数値が極端というのは確かにあるだろうけど、
AlphaZero同士で先手勝率6割5分程度はあるかもね。
他のソフトで対aperyqhapaqとの対戦の先手後手の勝率差はそこまで大きくならなかったと思うので
AlphaZeroはやっぱり(他のソフトよりは)先手後手でレート差が結構ありそうに思う

758:名無し名人
18/12/27 16:57:05.55 H8bMbwZa0.net
評価の精度が煮詰まってくると探索部との相性が～ってなるし、
評価の精度に技術革新が起こるとやっぱり評価の精度が大事って話になるし
また評価の精度が煮詰まってくると（以下略

759:名無し名人
18/12/27 17:02:57.60 ZHjm1qIP0.net
行き詰ると、気分転換したくなるんだよな。

760:名無し名人
18/12/27 17:08:31.64 H8bMbwZa0.net
まあ囲碁よりかは大局感が効かない感はある
というか囲碁の大局感のしめる割合がでかい感がある

761:名無し名人
18/12/27 17:10:43.10 /J3j3WBFr.net
>>750
序盤は大局観、終盤は読み。
将棋は、終盤に攻める側が駒損することが多く、防御側の戦力が溜まっていくので
読みが外れて攻めが切れると一気に逆転する。
奇跡的に良くできたボードゲームだ。

762:名無し名人
18/12/27 17:18:50.03 ZHjm1qIP0.net
>>760
囲碁の場合、大差ない手が多すぎる。
そのため、読みの比率が下がるだけ。
人間にもコンピュータにも難しすぎるゲームだと思う。

763:名無し名人
18/12/27 19:07:30.14 nulO+GNKM.net
elmoが80スレッド１手60秒で対局した時の先後のレーティング差が分からないから無意味

764:名無し名人
18/12/27 19:54:38.84 UQloo+8q0.net
>>760
囲碁は探索では歯が立たないから仕方が無い
将棋は良い手を指せば速く詰み上がるが
囲碁は基本、石が尽きるまで探索せねば機械的には勝敗が求まらない
石は全部で300個以上あるから、つまり囲碁では現実的に詰み探索が成立しない
ということは、有効な評価関数を構成することが将棋より数段難しいということでもある
これまでは辛うじて人間がパターン認識力と仮説構築と検証の能力を駆使して大局観を擬似的に形成してきたが
いかんせん将棋の駒得ほどの精度は実現しようがなく、
>囲碁の場合、大差ない手が多すぎる。 (>>762)
「ようにしか見えない」という大変残念な状況なのだと思う

765:名無し名人
18/12/27 19:57:59.39 0y8xeeMt0.net
きむりんさんは竹部さんと絶縁か
まぁそういう結末になるのは予想できたけど

766:名無し名人
18/12/27 20:28:55.36 96tUBkFId.net
>>762
「人間には」難しすぎる。
ゆえに人間がその知識でコンピュータに教えようとしてもうまくいかなかった。
そこで、自分で感覚を掴んで強くなるコンピュータを作ったら、あっという間にニンゲンはブチ抜かれた。

767:名無し名人
18/12/27 20:38:20.45 Th7R4+nM0.net
だが、囲碁AIと囲碁の神様との差は、将棋AIと将棋の神様との差より
はるかに大きいと思うよ。。

768:名無し名人
18/12/27 20:46:14.72 tEgrgjrJ0.net
>>751
完全探索がムリな数規模の前で
評価精度が全てという帰着でしょうよ。

769:名無し名人
18/12/27 21:24:17.99 UQloo+8q0.net
その評価精度というのは
MCTSに対する全幅の信頼と
Deep Learningの黒魔術的な調整（または取捨選択）ノウハウと
有り得ない回数の自己対戦で支えられています！
2番目のは敵対的生成ネットワーク（GAN）に収束しつつあるのかな知らんけど

770:名無し名人
18/12/27 23:03:21.14 UQloo+8q0.net
3駒間の関係のK_0×P_1_0×P_2_0に対応する評価因子を
　f_[K_0, P_1_0, P_2_0](K, P_1, P_2) = 1 （K=K_0, P1=P_1_0, P2=P_2_0)
　　　　　　　　　　　　　　　　　　　　　　= 0 (上記以外)
と定義して、
f_[K_a, P_1_a, P_2_a](K, P1, P2)とf[K_b, P_1_b, P_2_b](K, P1, P2)の積を将棋の全ての局面について足し合わしたら、
KPP（T無し）の場合は手番に関する対称性から局面の総数は常に偶数で、
かつ任意の[K, P_1_0, P_2_0]に対して値が正になるやつと負になるやつが同数現れるから
　（上記積）= 1　（K_a = K_b, P_1_a=P_1_b, P_2_a=P_2_b)
　　　　　　　　= 0 （上記以外）
となって、(上記積)の足し合わせは内積の定義を満たす
まとめ：むしろKPPTの方が内積の定義を満たすかどうか無根拠であり異端

771:名無し名人
18/12/27 23:10:04.90 4of0F0S/0.net
>>770
内積の定義を満たすってのは、満たしたら何かいいことあるの？
もしくは満たさなかったらなんか悪いことがあるの？

772:名無し名人
18/12/27 23:12:39.70 xK+hEzPd0.net
>>765
相入玉みたいなやりとりだったな

773:名無し名人
18/12/28 00:17:30.10 qFEAm8ru0.net
>>771
将棋の全ての局面（合法手だけで実現する局面に限定してもそうで無くとも良いが、KPPを考える限り必然的に偶数）を定義域D、
値域を実数Rとする任意の関数h:D→Rが与えられたとき、
　H(K_0, P_1_0, P_2_0) = Σ[(K,P1,P2)∈D]{ h(K,P1,P2) * f_[K_0,P_1_0,P_2_0](K,P1,P2) } -- (1)
を(K_0, P_1_0, P_2_0)∈Dについて計算したらば、
　h(K,P1,P2) = Σ[(K_0,P_1_0,P_2_0)∈D]{ H(K_0, P_1_0, P_2_0) * f_[K_0,P_1_0,P_2_0](K,P1,P2) } -- (2)
となって、評価因子f_[K_0,P_1_0,P_2_0](K,P1,P2)の（式(1)を係数とする）線形和（式(2)）でもって
h(K,P1,P2)が非線形であっても近似でくる、
＿人人人人人人人人人＿
＞　ような気がする　＜
￣Y^Y^Y^Y^Y^Y^Y^Y^Y^￣

774:名無し名人
18/12/28 00:28:27.55 gWGRHLgG0.net
>>773
近似できるできないの違いがよくわからんのだけど、近似できてもやっぱり誤差は出るんだろ？
近似できるものとできないものの違いって誤差の大きさが違うだけのような気がするんだけどどうなんだろうか？

775:名無し名人
18/12/28 10:06:12.74 CS1SRokW0.net
平日にタイトル戦の進行を追いながらfloodgateの前例を検索してツイートしているおじさんはハローワーク伊勢へGO