17/08/02 19:20:31.20 IV2rpxczd.net
1分10秒加算と、1手1秒を比較してみます。
975:名無し名人
17/08/02 19:48:31.36 /mMMDZcop.net
>>961
元にした素材の素性と、教師局面の深度と量で全然変わる
976:名無し名人
17/08/02 20:06:08.71 Z9ihJXLs0.net
まだやってんの?
977:名無し名人
17/08/02 20:10:02.66 AAyWmbNl0.net
思考時間によるレーティング上昇にノード数の閾値のようなものはあるかという問答をしてみたい。
一手10秒と一手1秒で測定されたRのずれは、
一手1秒と一手0.1秒で測定されたRのずれと同じなのか?という話。
思考時間によるレーティングの向上は経験則だと
上昇レーティング = 500 log(t/t0) くらいで、
つまり持ち時間10倍で500くらい上がるっていうのはまぁよくある話だった。
だが、近年の評価関数は持ち時間によって有利不利が変わる。
おそらくelmoなんかは思考時間10倍で600とか上がってしまうのだろう。
あの経験則は「10倍になると」という相対的な事しか言っていないので、
「elmoが600 log(t/t0)で、他のソフトは500 log(t/t0)です。」のように言い切れるならば
最初に書いたように10秒と1秒を比較する必要はなく、
1秒と0.1秒を比較し、そのまま直線を引いて10秒でのR差を出せば良いことになる。
今回の問題は、経験式のようにどこまでもまっすぐ線が引けるかだが、
「ある深さ、ある探索ノード数まで読みが進むとある評価関数は急に強くなる」
みたいな事が起こっているならば残念ながら直線は引けない。
レーティング上昇ぶりに変化が出るノード数の閾値みたいなものがあるのかって問答
978:名無し名人
17/08/02 20:21:14.95 DumI0mqS0.net
自己対戦で有意差が出る直前で一気に引き戻された時の絶望感ったらないな
開発者の人は毎回こんな絶望を味わっているのか
979:名無し名人
17/08/02 20:59:58.01 6qtj7qdY0.net
そもそも5%の有意水準ってかなり甘いけどね
980:名無し名人
17/08/02 23:22:36.81 CztcLG4f0.net
俺って天才だよなあ
981:名無し名人
17/08/02 23:39:12.51 BbbOEtXN0.net
ちょっとコード追加して、新たなブレンドモードを作ったら、面白い評価関数ができた。
なんだかしらないけど強い。どうして強いのかもわからない。w
982:名無し名人
17/08/02 23:39:22.46 UVdPtMyZ0.net
山本は2σじゃ危なくてダメと言ってるからな
983:名無し名人
17/08/03 00:22:59.29 bdPIOIQT0.net
その最低限5%の足切りすら突破出来ない評価関数が多すぎるんだなこれが
984:名無し名人
17/08/03 00:23:14.57 dkenphoI0.net
細かい改良を100回テストしたら4回はずれるんだから当然
僅かな改善 (R20 程度) を無数に重ねあわせて、少しずつレーティングを改善している。とてもつらい。
URLリンク(denou.jp)
これは99.7%信頼区間3000局の誤差上限52.7%以上の事だった
山本氏はそれぞれ違うバージョンのポナンザ同士に3000回程度の対局をさせ、
この対局統計を分析しより良いポナンザのプログラムを採択する方式でポナンザを改良した。
採択されたポナンザはそうでないポナンザより平均2%ポイント程度勝率が高かったという。
対局で52%の勝率を上げたポナンザが生き残り、このポナンザがもう一つのポナンザと対局を行う。
URLリンク(japanese.joins.com)
985:名無し名人
17/08/03 00:35:03.23 dkenphoI0.net
信頼区間を乱数でテストするとこんな感じ
擬似1000局勝率50% 100万セット
95%信頼区間 46.9~53.1%
532勝以上 23269 回 2.3%
468勝以下 23089 回 2.3%
範囲内 953642 回 95.4%
986:名無し名人
17/08/03 00:40:47.04 bdPIOIQT0.net
>>973
片側検定で頼むで
987:名無し名人
17/08/03 01:01:05.98 hnnjruuk0.net
>>974
強いかどうかなら勝率50.05%以上を仮定しておくと
(勝率50%だと弱くはない=互角も可能なのでわずかに勝率を50%より上げておく)
95%だと526勝474敗で達成
>>972
細かい改良を積み重ねる方式なら別にいい
最悪マイナスの改良でなければいいのだから
だがどこの馬の骨かわからんものが100個あったときに
最強のものを決めるという問題の場合にはそれは使えない
0.95^100=0.59%
つまり実力ではなくたまたま運が良かっただけという可能性が99.41%になるから
0.9995^100=95%になるから
100個のものの検定を95%の信頼区間で行うときには
1個あたりでは99.95%の信頼区間を最低限取る必要がある
988:名無し名人
17/08/03 01:04:35.31 Xzd14CNR0.net
短時間の勝率と長時間の勝率が一致しないって話が出てきている時代に
統計の「厳密」な議論がどこまで意味があるのだろうか
989:名無し名人
17/08/03 01:06:22.08 hnnjruuk0.net
それに完全互角でも先手勝率55%と予想されてるからな
勝率52%とかなってくると先後の差ですら影響するよな
990:名無し名人
17/08/03 01:20:45.22 bdPIOIQT0.net
>>975
突っ込みどころが多すぎるぞ・・・
991:名無し名人
17/08/03 01:35:43.65 BiY1ZAvL0.net
ガバガバ数学定期
992:名無し名人
17/08/03 07:43:29.97 /+xpQuez0.net
>>969
新しいブレンドモードをぜひやねうら王さんに送って
使えるようにお願いします
993:名無し名人
17/08/03 07:44:40.46 GD2QJudBa.net
開発は改良の積み重ねだからごくわずかなレート向上が重要だけど、
ユーザーが有意水準を考えなければならないレベルのどんぐり関数を比較すること自体が馬鹿馬鹿しい
あくまで将棋スレなのに、将棋である必要がない議論しかなされてないよね
まあ一時期はスマホのスペックの話題ばっかだったし、そういうのは求められてないんかね
994:名無し名人
17/08/03 09:57:51.12 qQ0Hnmhn0.net
いやstockfishもR20とかそれ以下の改良の積み重ねだけどね
995:名無し名人
17/08/03 10:05:49.80 SUTyR97Ca.net
要は将棋なんて興味ないんだよ
他人をなぎ倒せりゃそれでいいw
996:名無し名人
17/08/03 10:26:52.51 O6Kx/nBor.net
>>976
難癖を付けるのが目的だからね
日本の保守(笑)なおっさん、ジジイには良くあること
997:名無し名人
17/08/03 11:59:27.48 vws3z6oG0.net
ENGINE_VERSIONどこにあるんだっけ?と思ったら
extra/config.hじゃなくてshogi.hにあったのね
直観的にあると見当をつける場所ではないような気もするが
998:名無し名人
17/08/03 12:30:52.22 4oXMxa6wM.net
>>981
少し前まで将棋の内容について触れると湧いてくる荒らしが常駐してた影響もあるだろうね
999:名無し名人
17/08/03 14:59:46.79 OfsfbDFG0.net
>>985
Bonanzaもshogi.hにBNZ_VERがある。
1000:名無し名人
17/08/03 18:43:32.53 rIYopPsc0.net
>>983
これが真理だな。
去年の真やねうら王をスマホで動かしてウォーズ40連勝くらいできるし、もはや人間には理解できないレベル。
1001:名無し名人
17/08/03 19:45:05.79 +EXgPMmfd.net
>>988
それはお前にとっての真理だろ。
開発者の中には将棋の神にどれだけ近づけるかや、完全解析の究明を目指したりしてる人だっている�
1002:セから。
1003:名無し名人
17/08/03 19:54:25.82 rIYopPsc0.net
>>989
メッチャキモいぞ
1004:名無し名人
17/08/03 20:06:57.27 a8wHEm/s0.net
完全解析を目指してる開発者はいないだろうなぁ
1005:名無し名人
17/08/03 20:19:33.43 KqHHKgtz0.net
今の少しずつようするに「棋力」を上げるアプローチから完全解析ってできるの?
全く別の方向から考えないとダメなんじゃ?
1006:名無し名人
17/08/03 20:39:01.21 Xzd14CNR0.net
まずはどうぶつしょうぎに自己対戦学習させて初期局面の後手評価値がかなり大きくなるかどうか
やってみてほしい。
1007:名無し名人
17/08/03 20:46:11.03 jUKcdWmf0.net
完全解析はとにかくスピード命だろ
どんなに頑張っても終わらんだろうけどw
1008:名無し名人
17/08/03 20:46:34.02 PNftBja60.net
完全解析したら棋士は廃業。棋士は開発者を殺してでも阻止する
1009:名無し名人
17/08/03 21:20:29.76 lCUntu6Qa.net
急に変なの湧いてきたな
1010:名無し名人
17/08/03 21:23:51.02 0E8cXZGBd.net
完全解析()
1011:名無し名人
17/08/03 21:48:12.99 BnXYy6R3d.net
量子コンピュータはD-Wave社が実用化してるからそれ借りてきて来年の選手権に出れば余裕で優勝できるよ。
1012:名無し名人
17/08/03 21:50:43.56 6b9jyaI2d.net
1000なら今年中に完全解析
1013:名無し名人
17/08/03 21:56:32.76 BnXYy6R30.net
1000なら俺が幸せになる
1014:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 16日 12時間 38分 13秒
1015:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています