19/08/23 19:13:36.62 KljXhF7+.net
囲碁は現在のコミで白番有利説もあるようですがどうなのか
951:310
19/09/05 22:24:16.41 NIzTzKyA.net
棋譜の作り方全面改訂。
分岐のチェックで、以前は全ての分岐を棋譜化していたけど、今度のは軽い探索で
怪しい評価値(同一評価値~-4程度まで)のものだけ棋譜化するようにして、
棋譜数を大幅節約。学習が楽になるという算段です。
棋譜づくりが順調になり暇ができると、細かく気になっていた、どーでもよいところを
改良し始めて、バグとりで棋譜づくりが滞るという悪循環orz
よくよく考えたら、PCのパワーアップしたので、またDCNNトライとかしてみようかな
とか思い始めた。tiny-dnnしか選択肢無いんだけど。
952:535
19/09/11 20:42:08.54 EGEM/7RV.net
googleがminigoというオープンソースやってるらしいですね。
最近さぼりっぱなしだったけど、ちょっと見てみるか。
953:535
19/09/12 19:49:22.62 qOi8eRBu.net
すげー難しそう
まだちゃんと見てないけど
954:310
19/09/17 23:33:38.68 KoOw8EHX.net
相変わらずしこしこ棋譜作って学習繰り返してます。
もう無いだろうと思いつつ、ちょこっとした事に気づいて修正を繰り返してます。
置換表のハッシュ関数を改良。
格納効率が結構良くなったので、衝突が減ったはず。
終盤探索の時にBOOK(確定)も参照して余計な探索を減らしました。
基本遡りで確定させているので、運が良い時に滅茶苦茶早くなりました。
無い時は今まで通り(汗
学習データが不足しているのではないかと、置換表内に残っているスコアが確定
した局面FIFOで貯めて、折々に学習に回してみました。1回探索で100~500件
程度。これをFIFOで500万件。棋譜に残っていない局面で学習する事で、過学習
が防止できるかなと思っていますが…。
現在、27手確定局面で大体14000件の棋譜とその分岐で合計23万件ほどですが、
まだ棋譜が足りていない感じです。が、件数が増えすぎて手に負えません。
BOOKの確認ができるWindowsアプリ作ろうかと思い始めています。
955:535
19/09/22 19:52:21.38 ctBLCdpw.net
このまま失踪しそうな感じです。
やっぱアルファゼロは手を出してはいけないかったんや。
956:310
19/09/22 19:56:33.01 x3eDgHtk.net
DCNNになってから、一般人のPCでは手が出せなくなってるからね。
計算プロセス自体は、NNを極端に単純化したものが線形回帰だと思えば、
NNで生まれた計算ノウハウが流用できますよ。
というか、今の時代、ただのLRでDCNNとほぼ同じ強さ、とかの方がオシャレ
ではないかと思う、ひねくれものの僕。
957:310
19/09/23 19:34:01.85 taOqGsoO.net
所詮趣味なので、あまり無理せず、やる気になるときにやればよいかと思います。
958:535
19/09/23 20:58:22.95 T5ohU9uM.net
うーむ、やりたい気持ちはあるのですが、いかんせん難しすぎて…
githubにもっと易しそうなのでてくるまで待つか?うーん。
959:535
19/09/25 21:31:58.87 /O9j0jn/.net
気温が徐々に下がってますね。
そろそろ計算回しっぱなしにしてもいいかな。
つっても回せるプログラムがないけど。
960:535
19/09/28 22:43:07.40 upFNPupL.net
またgithub漁ってます。
URLリンク(github.com)
961:535
19/10/01 22:13:53.83 r/X1idNR.net
3日くらい計算回したけど全く強くなる気配がないなorz
もしかしたら微妙に強くなってるのかもしれないけどあまりに成長速度が遅すぎる
やっぱアルファゼロは計算時間が半端ないのかも?
962:535
19/10/01 23:21:06.21 r/X1idNR.net
やっぱアルファゼロはいったん諦めて、囲連星でやったようにモンテカルロAIの棋譜取り&勝率DB作り&教師ありDNNでライフゲーム囲碁やるべきか?
うーむ
963:310
19/10/02 01:57:09.42 FIHYKLNY.net
DCNN強化学習はマシンパワーが恐ろしいほど必要だからね。
満足できる教師データがそろってから評価関数に使ってみる程度にしないと…。
自由度が高すぎるので、まともな評価関数に収束するまでに、相当な試行回数が
必要なんじゃないかと思う。
自分は棋譜作成をずーっとやっていますが、現在は棋譜作りの目的がBook充実
になりつつあります。なんというか、現在の形はいつの間にかQ学習+ε-Greedy
っぽくなってきています。
アルファ様のお陰で、目標を見失いましたので、手段のためなら目的を選ばない感じ
で、プログラム作る楽しみという方向になっています(^^;
964:535
19/10/02 22:58:01.64 BtKMO/4x.net
ライフゲーム囲碁、モンテカルロAIの棋譜取り始めました。
ヒューリスティックなしのモンテカルロで1手10000プレイアウトで1局に約1分かかります。
それを16並列で1分当たり約16局採取できる予定。
棋譜の質があまりよくないのが難点ですがとりあえず、これでやってみます。
965:535
19/10/03 21:37:56.85 tdDOcoA1.net
18257局分棋譜が取れたようです。大体13.2局/分くらい取れるっぽい。
全コア動かすとシングルよりやっぱ少し遅くなるみたいですね。
966:535
19/10/06 00:55:35.61 V0Jk6SKR.net
DB作成まで来ました。
ライフゲーム囲碁は囲連星と比べてもっと沢山の棋譜が必要になるかもしれません。
オープニングのバリエーション的に。
967:310
19/10/11 20:52:12.13 Tdz7win8.net
評価関数を変えたくなってきた。
偶数手番と奇数手番の癖が顕著になってきたので、スムージングをしたく
なったのだけど、キーを手番優先にしているので、1手進むと盤面がひっくり
返ってしまい、連続性が無くなってしまう。
キーを黒番優先にして、評価値も黒番サイド(白番の場合は-1を掛ける)に
統一するとスムージングしやすくなる。
ただし、評価関数からBookから、あちこち影響が出る。
そろそろソースの整理がしたくなってきていたので、バッサリやっちゃおうかな。
台風で暇だし。
968:
19/10/12 09:18:22 acZ84t7K.net
一晩考えてやっぱ辞めました(^^;
単純じゃない。
969:
19/10/12 19:26:22 pRNoi8N2.net
あ~なんか情熱が湧いてこないな。
プログラム書くのがすごい億劫。
970:
19/10/13 05:54:00 ZL98wLBj.net
とりあえず、囲連星のコード流用してDNN学習回せるところまで来ました。
あとはAIプレイヤーのコードを移植すればひと段落かな。
971:
19/10/13 07:51:43 ZL98wLBj.net
モンテカルロAIとDNNAIで対戦できるところまで来ました。
DNNAIの動きはまあ第一弾にしては悪くない感じ。
972:
19/10/13 08:07:20 ZL98wLBj.net
パッと見DNNAIには知性の芽生えのようなものを感じる。
勝率に結びつくかは微妙だけど。
973:535
19/10/13 08:47:17.90 ZL98wLBj.net
勝率に結びついてませんね…。
残念過ぎる…。
寝るか。。。
974:
19/10/13 10:43:15 ZL98wLBj.net
うーん、ハッキリと弱くなってますね。
ライフゲーム囲碁って昔勝率DB使った時も勝率落ちたし何でだろう?
975:535
19/10/13 10:48:13.56 ZL98wLBj.net
モンテカルロAIにトリプルスコアで負けてますね~
かなc
976:
19/10/14 19:34:30 +gotlTkI.net
ここからどうしていけばいいのかわからんなぁ。
負けるDNNAIで棋譜取りして勝てるようになるのかといえばかなり期待薄。
でもやれることもないし一応やってみるか。
977:
19/10/15 23:46:30 ttnyLWCi.net
DNNの評価値を得点差から勝率と得点差/81の平均にしたところ
トリプルスコアで負けてたのがダブルスコアになったようです。
まだ負けてるけど。
囲碁では得点差で評価値を付けるのはほぼタブーで勝率を評価値にするのがセオリーなのですが、試してみたかった。
978:535
19/10/17 22:06:11.66 AT1bNTwz.net
やっぱ、負けてるなぁ。
979:535
19/10/22 14:18:39.16 Mqr1tYDA.net
うーむ相手から攻撃されたときに反撃しない癖があるようだ。
反撃さえすれば楽に勝てるはずなんだが…。
980:535
19/10/22 16:38:49.29 Mqr1tYDA.net
DNNの入力にに盤面の情報だけじゃなくて、石がぶつかってるところの情報も与えてみるか。
かなり肝になる情報のはずだから。
981:535
19/10/22 17:02:51.95 Mqr1tYDA.net
うお、メモリがパンクしたorz
もー新スレッドリッパーにメモリ1TB載せたいorz
982:535
19/10/22 17:31:13.35 Mqr1tYDA.net
データベースがでかすぎるのかなぁ。
500万局面を4対称で2000万局面分くらいあるんだが、初期アルファ碁でも3000万局面くらいだったっていうし減らそういかなぁ。
うーん。
983:535
19/10/23 20:19:32.52 VmufmFSW.net
前も言ったかもしれないけどいたずらにネットワークを巨大化するよりコンパクトにしてエポック数を稼いだほうがいいかもしれないな。
984:535
19/10/26 19:36:09.88 4XMH/3Nj.net
学習するほどに弱くなる理由がさっぱりわからんorz
ちょっと休憩
985:535
19/10/27 18:41:08.53 OnknjOzZ.net
またgithubでアルファゼロ探ししようかなぁ(懲りてない)
986:535
19/11/05 18:52:29.53 F2Rnn9oI.net
新スレッドリッパー今日発表見たいですね
ワクワク
987:535
19/11/05 22:09:32.07 GKFgjg5l.net
あれ、今日じゃないのか…
988:535
19/11/07 23:17:24.41 OiCk9RdB.net
スレッドリッパー 32コア ベース3.7GHz ターボ4.5GHz 1999$
素晴らしい
金がないけど
989:535
19/11/09 22:53:36.89 rF2mt5AD.net
URLリンク(github.com)
これwindowsでも動くっぽい
990:535
19/11/10 20:01:17.40 KZcBl7Ju.net
せっかく良さそうなの見つけたのに、イマイチモチベーション上がんないな~
なんでだろ。ホントよさそうなのに。
991:535
19/11/17 21:06:42.27 eK7f1inq.net
コツコツpythonやってます。
リストの使い方がわかってくると書く速度あがりそう。
992:535
19/11/17 21:48:33.74 eK7f1inq.net
>>972にライフゲーム碁のロジックを実装しました。
ランダムプレーヤーと対戦できるところまで確認しました。
意外と拡張しやすい作りになってるっぽい。
993:535
19/11/17 22:00:36.51 eK7f1inq.net
インターフェースの作りがうまいプログラムは心が躍りますね。
見習いたい。
994:535
19/11/17 22:24:52.29 eK7f1inq.net
うおおお、遅えええええええ
6x6オセロだと結構速いけど9x9ライフゲーム囲碁だとめちゃ遅いorz
なにか高速化策を考えねば…
995:535
19/11/17 22:33:57.28 eK7f1inq.net
並列化されてないっぽいな。うーむ
並列化狙うか…
996:535
19/11/18 20:52:01.98 mPMMCB5I.net
今日一日、強化学習回してたんですが途中でOS固まってたorz
でも一応、3回ベストポリシー更新されたみたい。
ランダムボットと対戦させてみます。
997:535
19/11/18 21:16:14.14 mPMMCB5I.net
ランダムボットと黒白25戦づつやってディープラーニングAIの39勝11敗
でだしとしてはまあまあかな。
純モンテカルロAIともやってみよう。
998:535
19/11/18 21:19:24.26 mPMMCB5I.net
あれ、純モンテカルロAIないのか?
うーん。
999:535
19/11/19 19:48:59.11 EOzKZ0AX.net
うーむOS固まるなぁ。
今日も固まった。
グラボの熱が悪いのだろうか?
1000:535
19/11/19 20:34:57.86 EOzKZ0AX.net
パソコンの調子が悪いのならいっそAWSとか検討するという手も…
でも金が…
1001:名前は開発中のものです。
19/11/20 21:49:18.08 lMEK9Bn7.net
今日も固まったorz
ほんまどーなってるの?
1002:535
19/11/20 21:49:44.28 lMEK9Bn7.net
名前忘れた
1003:535
19/11/20 22:46:44.07 lMEK9Bn7.net
固まったけど少し更新されてたようです
ランダムボットと対戦したら48勝2敗
結構ハッキリ強くなってるな。
1004:535
19/11/21 19:44:58.21 xK6B/ksk.net
今日も当たり前のように固まってるorz
どうすりゃいいんだ?
1005:535
19/11/21 21:11:44.62 xK6B/ksk.net
そろそろ次スレの季節ですね。
順番的に私の番か。
995くらいで立てたらいいですかね。
1006:535
19/11/22 19:54:12.78 nusik7MY.net
今日も固まった
いまのところ100%
1007:310
19/11/22 20:03:28.74 bJtjxKyJ.net
どもです。そろそろ次スレですね。
相変わらず、色々小改造しながら相変わらず棋譜作り続けています。
Book確認のデバッグ用プログラム作って、棋譜の間違い特定が飛躍的に早くなり、
その分、訂正用の棋譜が膨れて遡り探索がおろそかになっています。
評価関数の学習は進めていますが、どちらかというと評価関数が怪しくて間違えて
いそうなところで、わざと分岐させてBookで正解手順(に近い)の分岐を登録していく
事で、棋譜の精度を上げようとしています。BookをQ値と考えると、選択的なε-Greedy
でQ学習しているような感じになりつつあります。
もちろん、最終的には評価関数に反映しますが、今はBook構築が先みたいな。
VC++のバージョンアップ通知が来たので更新したら、あちこちワーニングや
エラーが出て来まして、ソースの整理をしながら、ワーニングにならないソース
に書き換え中です。急いでも仕方がないので、裏で棋譜作り動かしながら、
ちんたらやってます。
久々にMCTS部分を見たら、バグだらけだったので、直したところ、マシンパワーが
上がったことからか、残り30手程度ならすぐに終局まで枝が伸びて比較的正確に
最善手順が生成できそうかなと思っています。全てのプログラムの書き換えが
終わったところで、テストしてみたいと思っています。
1008:535
19/11/23 14:12:48.21 0YM91Vba.net
昨日の晩からいままで連続で動いてます。
なかなかベストポリシーが更新されなくて焦れる
1009:535
19/11/23 17:50:36.12 0YM91Vba.net
ランダムボットに白黒25戦づつやって50勝0敗来ました!
このゲームはほかのゲームと比べてランダムボットが比較的強いから素晴らしいですね。
1010:535
19/11/23 18:12:06.28 0YM91Vba.net
うーん、人間に勝てるほどは強くないな
1011:535
19/11/23 19:11:14.10 0YM91Vba.net
次スレ
【オセロ,将棋】ボードゲーム Part3【囲碁,War】
スレリンク(gamedev板)
1012:535
19/11/23 20:58:35.29 0YM91Vba.net
こっち埋めちゃいますね。
1013:535
19/11/23 20:59:10.47 0YM91Vba.net
梅
1014:535
19/11/23 21:00:52.15 0YM91Vba.net
AWSでいいマシンを使うというのも憧れるが、
買うのとどっちが安いかは微妙かな。
1015:535
19/11/23 21:02:40.43 0YM91Vba.net
スレッドリッパー11月30日発売。
コア数はいわずもがなベースクロックもかなり高い。
1016:535
19/11/23 21:05:07.92 0YM91Vba.net
pythonの文法は結局何がいいのかよくわからんな。
ライブラリが充実してるってのはそうなんだろうけど。
1017:535
19/11/23 21:05:51.11 0YM91Vba.net
1000 !
お疲れさまでした。
次スレでまたお会いしましょう。
1018:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 769日 3時間 30分 53秒
1019:1002
Over 1000 Thread.net
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
──────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
URLリンク(premium.5ch.net)
▼ 浪人ログインはこちら ▼
URLリンク(login.5ch.net)
1020:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています