【オセロ,将棋】ボードゲーム Part2【囲碁,War】 at GAMEDEV
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 - 暇つぶし2ch921:310
19/06/25 22:00:54.87 i36dK7DH.net
あ、会社のPCです。流石に性能2倍なので、買うモチベーションが下がったのです。
現在液晶の表面パネルバキバキで、タブレット機能止めて、
セロテープで補強してだましだまし使ってますが、発熱によって
内部が歪んじゃっているみたいで、通常状態でも液晶が湾曲してます。

で、将棋の探索の深さが意味不明だったので、色々考えていましたが、
なんとなく想像がついてきました。多腕バンディット使って、反復深化と
絞り込みを行っているのではないかと思います。
現状中盤探索の速度がいまいち遅く、シングルプローブカットすると
何故かさらに遅くなるという状態。棋譜作成メインだったので、あまり
気にしていなかったのですが、新しいPC来たらちょっとトライしてみよう
かなと思っています。

922:310
19/06/28 22:23:55.68 jdIE39If.net
新PCセットアップ中。
前回思いついた中盤探索ロジック。具体的に実装を考え始めたら、
MCTSでいいじゃんということに(汗
これからVisual Studioのダウンロードです。

923:名前は開発中のものです。
19/06/29 09:41:43.34 aAhzQFUl.net
セットアップ完了して、開発環境の移行も終わりました。
VS2017→VS2019でエラーチェックが厳格化したものがあったようで、ソース修正。
Win8→Win10でコマンドプロンプトがなんか変わって、CTRL-Sの動作がよくわからない。
などなど、細かい点はいくつかありますが、速度的には思いのほか効果が出ていて、
ほぼ倍速くらいな感じです。並列のオーバーヘッド増加分を、クロック他CPU単体の
パフォーマンスアップで吸収していると思われます。

924:310
19/06/29 09:42:10.63 aAhzQFUl.net
↑は僕です。

925:535
19/06/29 17:06:05.94 6alt1Zxx.net
倍速はなかなかいいですね。おめでとうございます。
俺も頑張らねば。。。

926:535
19/06/30 17:26:00.32 5SElYd7b.net
逃げちゃだめだ、逃げちゃだめだ、逃げちゃだめだ(pythonから)

927:535
19/07/04 18:51:35.21 JLZZWsF4.net
VMWareだとどうにもtensorflow-gpuが使えないのでネイティブubuntuを入れるか迷い中
SSD丸ごと1個あけて別ドライブにインストールすればwin10とも干渉しないはず…

928:535
19/07/05 20:11:11.37 gv5AG18i.net
一応ubuntu入ったっぽい。
でも環境構築する根性が湧いてこない。
あしたにするか。。。

929:535
19/07/06 17:14:44.78 YqSGwJgi.net
あかん、ubuntuすっごい固まるorz
今日だけで4回フリーズしたorz

930:535
19/07/07 19:22:27.22 8kGyRN1E.net
ここまで固まられるとネイティブubuntuは正直、撤退かなぁ
うーん。惜しいなぁ。

931:535
19/07/07 22:36:19.30 8kGyRN1E.net
VMWareのubuntuは固まらないんだよなぁ
バージョンが違うからかなぁ

932:535
19/07/08 23:58:39.11 J+Oysvfm.net
50万局学習させても知性とは程遠い打ち筋orz
絶望した!

933:535
19/07/12 20:02:35.26 5KSDfXOV.net
さんれんきう

934:535
19/07/14 01:02:14.40 BHfYEZqG.net
AQZという囲碁AIが50万局の学習でプロに勝ったそうな。
なんで俺が試したプログラムとそんなに違うんだ?

935:535
19/07/15 07:10:16.79 U2als8ec.net
徹夜してしまった
反省(反省するとは言っていない)

936:535
19/07/21 20:03:14.96 E/xzPLNe.net
二進も三進もいかないorz
しばらく休憩するか…

937:535
19/07/21 21:27:54.74 E/xzPLNe.net
URLリンク(github.com)
気分を変えてこれに手を出そうかと思ってます。

938:535
19/07/28 15:53:29.60 afiNgtjO.net
すっかりさぼってしまっています。

939:310
19/07/31 22:58:56.92 RoaGFb2p.net
地味に改良&棋譜作成継続中。
評価値で黒番+2、白番-1くらいの差が生じているので、
評価関数にバイアス項を導入しました。
他、若干の高速化ネタ。
中盤探索でProbcutすると遅くなる問題を回避。本格修正するか悩み中。
というか、そもそもZebraより圧倒的に遅い原因がわからん。

940:535
19/08/04 00:47:49.68 kSURYkNt.net
ようやっと>>920のプログラムにライフゲーム囲碁のルールを実装しました。
python 超つらい…

941:535
19/08/04 01:56:43.25 kSURYkNt.net
CPU使用率10%か。。。切ない。。。

942:535
19/08/04 20:02:48.59 kSURYkNt.net
計算がある程度進むと必ずOSごとフリーズするorz
きょうびOSごと落ちるってどういうことだよ?

943:535
19/08/04 20:18:18.16 kSURYkNt.net
これはもうアルファゼロには手を出すなという神のお告げかもorz orz orz

944:535
19/08/07 20:34:05.86 cRW9S7xJ.net
そもそも、気温が高すぎて留守にしてる最中計算回しっぱなしにするの怖いってのもあるんだよなぁ

945:310
19/08/10 21:39:26.19 iTdjAaDm.net
中盤探索を改良。
一つは、普通に無駄な処理を見つけて修正。
もう一つは、評価値の計算に差分計算を取り入れました。
今まで並列処理で差分ってどうやるんだろうと思っていましたが、
単にDepth=1のところ(次がLeaf)で、順次評価値計算するのを
差分すればよかったのね。
この2つで、中盤探索で2手ほど深く読めるようになりました。

946:535
19/08/13 19:47:02.79 wzsq2qR8.net
今、実家に帰省してるんですが>>865のAIを動かしてみようとしたけどdllが認識されませんね?
何が悪いんだろう?

947:310
19/08/15 23:44:11.68 NhTCTcJa.net
小人閑居して不善をなす…。
思い切って、不要そうに思える棋譜をバッサリ削除してみました。
削除しすぎたかも。
いろいろ細かく修正と、デバッグ用表示の改良。
とかやっていたら、丸1日近く動かしたところで、なぜか急激にパフォーマンス低下。
もともと空きが少なかったSDDが一杯になっている…。とはいえ30Gはあったはず。
再起動していたらもとに戻った。原因不明。
対症療法で不要プログラムアンインストールしていたら、使っているOfficeを間違えて
アンインストールしてしまった。
HDD一杯が原因なのか、評価値のファイルが壊れていた。
ギリギリ間に合ってバックアップから復旧できた…と思う。

948:310
19/08/16 14:28:22.00 MY5mY5kZ.net
SDD一杯の犯人判明。
セキュリティー対策ソフトの監視対象管理DBのファイルが合計で400G越え(汗
ところが、管理者権限ないと停止できず、ファイル掴んでいるため削除できない。
今日は管理者休暇中。
logファイルを頻繁に追記しすぎて、ファイルサイズ変化する都度DBファイルが
作られているのではないかと想像。棋譜バッサリ削除して、一気に遡り探索やり直し
していて、これまでと比較にならないペースと数で追記処理が起きているので、
その影響の可能性が。

Officeは再インストールしてもらったけど、何故かセキュリティ解除キーの入力ができない。
来週月曜日は出張なので、来週火曜日までだましだまし行きます。
古い方のPCがまだ生きているので、Excel作業はそちらでやる事にしました。

949:535
19/08/23 19:05:38.98 KljXhF7+.net
AQZ敗退か
残念

950:名前は開発中のものです。
19/08/23 19:13:36.62 KljXhF7+.net
囲碁は現在のコミで白番有利説もあるようですがどうなのか

951:310
19/09/05 22:24:16.41 NIzTzKyA.net
棋譜の作り方全面改訂。
分岐のチェックで、以前は全ての分岐を棋譜化していたけど、今度のは軽い探索で
怪しい評価値(同一評価値~-4程度まで)のものだけ棋譜化するようにして、
棋譜数を大幅節約。学習が楽になるという算段です。
棋譜づくりが順調になり暇ができると、細かく気になっていた、どーでもよいところを
改良し始めて、バグとりで棋譜づくりが滞るという悪循環orz

よくよく考えたら、PCのパワーアップしたので、またDCNNトライとかしてみようかな
とか思い始めた。tiny-dnnしか選択肢無いんだけど。

952:535
19/09/11 20:42:08.54 EGEM/7RV.net
googleがminigoというオープンソースやってるらしいですね。
最近さぼりっぱなしだったけど、ちょっと見てみるか。

953:535
19/09/12 19:49:22.62 qOi8eRBu.net
すげー難しそう
まだちゃんと見てないけど

954:310
19/09/17 23:33:38.68 KoOw8EHX.net
相変わらずしこしこ棋譜作って学習繰り返してます。
もう無いだろうと思いつつ、ちょこっとした事に気づいて修正を繰り返してます。
置換表のハッシュ関数を改良。
格納効率が結構良くなったので、衝突が減ったはず。
終盤探索の時にBOOK(確定)も参照して余計な探索を減らしました。
基本遡りで確定させているので、運が良い時に滅茶苦茶早くなりました。
無い時は今まで通り(汗
学習データが不足しているのではないかと、置換表内に残っているスコアが確定
した局面FIFOで貯めて、折々に学習に回してみました。1回探索で100~500件
程度。これをFIFOで500万件。棋譜に残っていない局面で学習する事で、過学習
が防止できるかなと思っていますが…。
現在、27手確定局面で大体14000件の棋譜とその分岐で合計23万件ほどですが、
まだ棋譜が足りていない感じです。が、件数が増えすぎて手に負えません。
BOOKの確認ができるWindowsアプリ作ろうかと思い始めています。

955:535
19/09/22 19:52:21.38 ctBLCdpw.net
このまま失踪しそうな感じです。
やっぱアルファゼロは手を出してはいけないかったんや。

956:310
19/09/22 19:56:33.01 x3eDgHtk.net
DCNNになってから、一般人のPCでは手が出せなくなってるからね。
計算プロセス自体は、NNを極端に単純化したものが線形回帰だと思えば、
NNで生まれた計算ノウハウが流用できますよ。
というか、今の時代、ただのLRでDCNNとほぼ同じ強さ、とかの方がオシャレ
ではないかと思う、ひねくれものの僕。

957:310
19/09/23 19:34:01.85 taOqGsoO.net
所詮趣味なので、あまり無理せず、やる気になるときにやればよいかと思います。

958:535
19/09/23 20:58:22.95 T5ohU9uM.net
うーむ、やりたい気持ちはあるのですが、いかんせん難しすぎて…
githubにもっと易しそうなのでてくるまで待つか?うーん。

959:535
19/09/25 21:31:58.87 /O9j0jn/.net
気温が徐々に下がってますね。
そろそろ計算回しっぱなしにしてもいいかな。
つっても回せるプログラムがないけど。

960:535
19/09/28 22:43:07.40 upFNPupL.net
またgithub漁ってます。
URLリンク(github.com)

961:535
19/10/01 22:13:53.83 r/X1idNR.net
3日くらい計算回したけど全く強くなる気配がないなorz
もしかしたら微妙に強くなってるのかもしれないけどあまりに成長速度が遅すぎる
やっぱアルファゼロは計算時間が半端ないのかも?

962:535
19/10/01 23:21:06.21 r/X1idNR.net
やっぱアルファゼロはいったん諦めて、囲連星でやったようにモンテカルロAIの棋譜取り&勝率DB作り&教師ありDNNでライフゲーム囲碁やるべきか?
うーむ

963:310
19/10/02 01:57:09.42 FIHYKLNY.net
DCNN強化学習はマシンパワーが恐ろしいほど必要だからね。
満足できる教師データがそろってから評価関数に使ってみる程度にしないと…。
自由度が高すぎるので、まともな評価関数に収束するまでに、相当な試行回数が
必要なんじゃないかと思う。
自分は棋譜作成をずーっとやっていますが、現在は棋譜作りの目的がBook充実
になりつつあります。なんというか、現在の形はいつの間にかQ学習+ε-Greedy
っぽくなってきています。
アルファ様のお陰で、目標を見失いましたので、手段のためなら目的を選ばない感じ
で、プログラム作る楽しみという方向になっています(^^;

964:535
19/10/02 22:58:01.64 BtKMO/4x.net
ライフゲーム囲碁、モンテカルロAIの棋譜取り始めました。
ヒューリスティックなしのモンテカルロで1手10000プレイアウトで1局に約1分かかります。
それを16並列で1分当たり約16局採取できる予定。
棋譜の質があまりよくないのが難点ですがとりあえず、これでやってみます。

965:535
19/10/03 21:37:56.85 tdDOcoA1.net
18257局分棋譜が取れたようです。大体13.2局/分くらい取れるっぽい。
全コア動かすとシングルよりやっぱ少し遅くなるみたいですね。

966:535
19/10/06 00:55:35.61 V0Jk6SKR.net
DB作成まで来ました。
ライフゲーム囲碁は囲連星と比べてもっと沢山の棋譜が必要になるかもしれません。
オープニングのバリエーション的に。

967:310
19/10/11 20:52:12.13 Tdz7win8.net
評価関数を変えたくなってきた。
偶数手番と奇数手番の癖が顕著になってきたので、スムージングをしたく
なったのだけど、キーを手番優先にしているので、1手進むと盤面がひっくり
返ってしまい、連続性が無くなってしまう。
キーを黒番優先にして、評価値も黒番サイド(白番の場合は-1を掛ける)に
統一するとスムージングしやすくなる。
ただし、評価関数からBookから、あちこち影響が出る。
そろそろソースの整理がしたくなってきていたので、バッサリやっちゃおうかな。
台風で暇だし。

968:
19/10/12 09:18:22 acZ84t7K.net
一晩考えてやっぱ辞めました(^^;
単純じゃない。

969:
19/10/12 19:26:22 pRNoi8N2.net
あ~なんか情熱が湧いてこないな。
プログラム書くのがすごい億劫。

970:
19/10/13 05:54:00 ZL98wLBj.net
とりあえず、囲連星のコード流用してDNN学習回せるところまで来ました。
あとはAIプレイヤーのコードを移植すればひと段落かな。

971:
19/10/13 07:51:43 ZL98wLBj.net
モンテカルロAIとDNNAIで対戦できるところまで来ました。
DNNAIの動きはまあ第一弾にしては悪くない感じ。

972:
19/10/13 08:07:20 ZL98wLBj.net
パッと見DNNAIには知性の芽生えのようなものを感じる。
勝率に結びつくかは微妙だけど。

973:535
19/10/13 08:47:17.90 ZL98wLBj.net
勝率に結びついてませんね…。
残念過ぎる…。
寝るか。。。

974:
19/10/13 10:43:15 ZL98wLBj.net
うーん、ハッキリと弱くなってますね。
ライフゲーム囲碁って昔勝率DB使った時も勝率落ちたし何でだろう?

975:535
19/10/13 10:48:13.56 ZL98wLBj.net
モンテカルロAIにトリプルスコアで負けてますね~
かなc

976:
19/10/14 19:34:30 +gotlTkI.net
ここからどうしていけばいいのかわからんなぁ。
負けるDNNAIで棋譜取りして勝てるようになるのかといえばかなり期待薄。
でもやれることもないし一応やってみるか。

977:
19/10/15 23:46:30 ttnyLWCi.net
DNNの評価値を得点差から勝率と得点差/81の平均にしたところ
トリプルスコアで負けてたのがダブルスコアになったようです。
まだ負けてるけど。

囲碁では得点差で評価値を付けるのはほぼタブーで勝率を評価値にするのがセオリーなのですが、試してみたかった。

978:535
19/10/17 22:06:11.66 AT1bNTwz.net
やっぱ、負けてるなぁ。

979:535
19/10/22 14:18:39.16 Mqr1tYDA.net
うーむ相手から攻撃されたときに反撃しない癖があるようだ。
反撃さえすれば楽に勝てるはずなんだが…。

980:535
19/10/22 16:38:49.29 Mqr1tYDA.net
DNNの入力にに盤面の情報だけじゃなくて、石がぶつかってるところの情報も与えてみるか。
かなり肝になる情報のはずだから。

981:535
19/10/22 17:02:51.95 Mqr1tYDA.net
うお、メモリがパンクしたorz
もー新スレッドリッパーにメモリ1TB載せたいorz

982:535
19/10/22 17:31:13.35 Mqr1tYDA.net
データベースがでかすぎるのかなぁ。
500万局面を4対称で2000万局面分くらいあるんだが、初期アルファ碁でも3000万局面くらいだったっていうし減らそういかなぁ。
うーん。

983:535
19/10/23 20:19:32.52 VmufmFSW.net
前も言ったかもしれないけどいたずらにネットワークを巨大化するよりコンパクトにしてエポック数を稼いだほうがいいかもしれないな。

984:535
19/10/26 19:36:09.88 4XMH/3Nj.net
学習するほどに弱くなる理由がさっぱりわからんorz
ちょっと休憩

985:535
19/10/27 18:41:08.53 OnknjOzZ.net
またgithubでアルファゼロ探ししようかなぁ(懲りてない)

986:535
19/11/05 18:52:29.53 F2Rnn9oI.net
新スレッドリッパー今日発表見たいですね
ワクワク

987:535
19/11/05 22:09:32.07 GKFgjg5l.net
あれ、今日じゃないのか…

988:535
19/11/07 23:17:24.41 OiCk9RdB.net
スレッドリッパー 32コア ベース3.7GHz ターボ4.5GHz 1999$
素晴らしい
金がないけど

989:535
19/11/09 22:53:36.89 rF2mt5AD.net
URLリンク(github.com)
これwindowsでも動くっぽい

990:535
19/11/10 20:01:17.40 KZcBl7Ju.net
せっかく良さそうなの見つけたのに、イマイチモチベーション上がんないな~
なんでだろ。ホントよさそうなのに。

991:535
19/11/17 21:06:42.27 eK7f1inq.net
コツコツpythonやってます。
リストの使い方がわかってくると書く速度あがりそう。

992:535
19/11/17 21:48:33.74 eK7f1inq.net
>>972にライフゲーム碁のロジックを実装しました。
ランダムプレーヤーと対戦できるところまで確認しました。
意外と拡張しやすい作りになってるっぽい。

993:535
19/11/17 22:00:36.51 eK7f1inq.net
インターフェースの作りがうまいプログラムは心が躍りますね。
見習いたい。

994:535
19/11/17 22:24:52.29 eK7f1inq.net
うおおお、遅えええええええ
6x6オセロだと結構速いけど9x9ライフゲーム囲碁だとめちゃ遅いorz
なにか高速化策を考えねば…

995:535
19/11/17 22:33:57.28 eK7f1inq.net
並列化されてないっぽいな。うーむ
並列化狙うか…

996:535
19/11/18 20:52:01.98 mPMMCB5I.net
今日一日、強化学習回してたんですが途中でOS固まってたorz
でも一応、3回ベストポリシー更新されたみたい。
ランダムボットと対戦させてみます。

997:535
19/11/18 21:16:14.14 mPMMCB5I.net
ランダムボットと黒白25戦づつやってディープラーニングAIの39勝11敗
でだしとしてはまあまあかな。
純モンテカルロAIともやってみよう。

998:535
19/11/18 21:19:24.26 mPMMCB5I.net
あれ、純モンテカルロAIないのか?
うーん。

999:535
19/11/19 19:48:59.11 EOzKZ0AX.net
うーむOS固まるなぁ。
今日も固まった。
グラボの熱が悪いのだろうか?

1000:535
19/11/19 20:34:57.86 EOzKZ0AX.net
パソコンの調子が悪いのならいっそAWSとか検討するという手も…
でも金が…

1001:名前は開発中のものです。
19/11/20 21:49:18.08 lMEK9Bn7.net
今日も固まったorz
ほんまどーなってるの?

1002:535
19/11/20 21:49:44.28 lMEK9Bn7.net
名前忘れた

1003:535
19/11/20 22:46:44.07 lMEK9Bn7.net
固まったけど少し更新されてたようです
ランダムボットと対戦したら48勝2敗
結構ハッキリ強くなってるな。

1004:535
19/11/21 19:44:58.21 xK6B/ksk.net
今日も当たり前のように固まってるorz
どうすりゃいいんだ?

1005:535
19/11/21 21:11:44.62 xK6B/ksk.net
そろそろ次スレの季節ですね。
順番的に私の番か。
995くらいで立てたらいいですかね。

1006:535
19/11/22 19:54:12.78 nusik7MY.net
今日も固まった
いまのところ100%

1007:310
19/11/22 20:03:28.74 bJtjxKyJ.net
どもです。そろそろ次スレですね。
相変わらず、色々小改造しながら相変わらず棋譜作り続けています。
Book確認のデバッグ用プログラム作って、棋譜の間違い特定が飛躍的に早くなり、
その分、訂正用の棋譜が膨れて遡り探索がおろそかになっています。
評価関数の学習は進めていますが、どちらかというと評価関数が怪しくて間違えて
いそうなところで、わざと分岐させてBookで正解手順(に近い)の分岐を登録していく
事で、棋譜の精度を上げようとしています。BookをQ値と考えると、選択的なε-Greedy
でQ学習しているような感じになりつつあります。
もちろん、最終的には評価関数に反映しますが、今はBook構築が先みたいな。

VC++のバージョンアップ通知が来たので更新したら、あちこちワーニングや
エラーが出て来まして、ソースの整理をしながら、ワーニングにならないソース
に書き換え中です。急いでも仕方がないので、裏で棋譜作り動かしながら、
ちんたらやってます。
久々にMCTS部分を見たら、バグだらけだったので、直したところ、マシンパワーが
上がったことからか、残り30手程度ならすぐに終局まで枝が伸びて比較的正確に
最善手順が生成できそうかなと思っています。全てのプログラムの書き換えが
終わったところで、テストしてみたいと思っています。

1008:535
19/11/23 14:12:48.21 0YM91Vba.net
昨日の晩からいままで連続で動いてます。
なかなかベストポリシーが更新されなくて焦れる

1009:535
19/11/23 17:50:36.12 0YM91Vba.net
ランダムボットに白黒25戦づつやって50勝0敗来ました!
このゲームはほかのゲームと比べてランダムボットが比較的強いから素晴らしいですね。

1010:535
19/11/23 18:12:06.28 0YM91Vba.net
うーん、人間に勝てるほどは強くないな

1011:535
19/11/23 19:11:14.10 0YM91Vba.net
次スレ
【オセロ,将棋】ボードゲーム Part3【囲碁,War】
スレリンク(gamedev板)

1012:535
19/11/23 20:58:35.29 0YM91Vba.net
こっち埋めちゃいますね。

1013:535
19/11/23 20:59:10.47 0YM91Vba.net


1014:535
19/11/23 21:00:52.15 0YM91Vba.net
AWSでいいマシンを使うというのも憧れるが、
買うのとどっちが安いかは微妙かな。

1015:535
19/11/23 21:02:40.43 0YM91Vba.net
スレッドリッパー11月30日発売。
コア数はいわずもがなベースクロックもかなり高い。

1016:535
19/11/23 21:05:07.92 0YM91Vba.net
pythonの文法は結局何がいいのかよくわからんな。
ライブラリが充実してるってのはそうなんだろうけど。

1017:535
19/11/23 21:05:51.11 0YM91Vba.net
1000 !
お疲れさまでした。
次スレでまたお会いしましょう。

1018:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 769日 3時間 30分 53秒

1019:1002
Over 1000 Thread.net
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。

──────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
URLリンク(premium.5ch.net)
▼ 浪人ログインはこちら ▼
URLリンク(login.5ch.net)

1020:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch