【オセロ,将棋】ボードゲーム Part2【囲碁,War】 at GAMEDEV
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 - 暇つぶし2ch850:535
19/05/13 20:57:06.68 rQSLa/J8.net
お、すごい
249勝 204敗 勝率55.0%

851:535
19/05/13 21:55:46.89 rQSLa/J8.net
LV3 vs LV3の黒番の勝率が65%くらいだったはずだから、黒番で勝率70%位いけばLV3越えといえるかも

852:535
19/05/13 23:06:54.58 rQSLa/J8.net
地味な学習も必要だとは思うけどアイディア一発でドカンと強くなるのも諦めきれない。

853:535
19/05/14 21:30:20.81 kAvibZwR.net
ん、なんかDNN学習させたらうち筋はそんなに悪くなってないと思うんだけど勝てなくなったな。
なんだろう?

854:535
19/05/15 21:00:42.40 ce+jhpkV.net
173勝 176敗 勝率 49.6%
対戦してみたけど思ったほど負けてないな?

855:535
19/05/15 21:22:39.79 ce+jhpkV.net
初期アルファ碁のようにポリシーネットとバリューネットに分けてみるか?

856:535
19/05/15 21:35:41.77 ce+jhpkV.net
そこそこの精度でも軽い評価関数は結構ほしいかも。
モンテカルロで役に立つし。

857:535
19/05/15 22:07:54.43 ce+jhpkV.net
というわけで、今使ってるDNNより大幅に簡素化したネットワークで学習させてみる。
データは同じ。

858:535
19/05/15 22:45:22.49 ce+jhpkV.net
あれ、大幅に簡素化したのに学習時間が思ったより短くならないな。
10倍速くらい早くなると思ってたのに3倍速くらいだ。

859:535
19/05/15 23:06:58.43 ce+jhpkV.net
更に簡素化して10倍速くらいにしました。
ちょっと簡素化しすぎかも?

860:310
19/05/15 23:27:46.15 2Iqikd3t.net
新バージョンで色々プログラム見直し。
探索部は全く改善していませんが、その他の部分が大幅にスピードアップ。
自動記譜作成時のオーバーヘッド(探索以外の時間)がかなり減った。
あとは学習の時間を減らしたい。

861:535
19/05/16 19:50:22.50 bKmJMMur.net
大きい方のネットワークの損失が3500位なのに対して小さい方のネットワークの損失が5300位。
さて、使い物になるかな?

862:535
19/05/16 20:26:43.20 bKmJMMur.net
うおお,遅え!
モンテカルロに使おうと思ったらプレイアウト回数かなり減らさなきゃだめだな。

863:535
19/05/16 20:40:14.63 bKmJMMur.net
一回打ってみたけど打ち筋は決して悪くない。
だが激遅。
だかが300プレイアウトでここまで遅いとは…

864:535
19/05/16 20:49:50.51 bKmJMMur.net
ん、でも打ち筋がいい。
ブレークスルー来たか??

865:535
19/05/16 21:05:06.63 bKmJMMur.net
すごいな、こちらの打ち筋は相当改善されたのにLV3がその上を行ってくる。
奥が深い。

866:535
19/05/16 22:04:27.02 bKmJMMur.net
ん、まだ学習飽和してないみたい。
ジリジリ損失減ってる。

867:535
19/05/16 22:42:50.95 bKmJMMur.net
LV1と対戦させ始めてみたけど、かえって勝率落ちてるな?
まだ対戦回数少なすぎて結論出すのは早いけど、もっと50連勝くらいするかと思った。
対LV1
黒番 17勝 3敗 勝率85.0%
白番 13勝 3敗 勝率81.3%

868:535
19/05/17 21:14:13.13 Af3ltV5Z.net
勝率上がってるみたいです。やった!
対LV1
黒番 156勝 15敗 勝率91.2%
白番 109勝 8敗 勝率93.2%

869:535
19/05/17 21:17:20.41 Af3ltV5Z.net
小さいネットワークの損失も5180くらいまで減ってます!
次は本丸、LV3と決戦や!

870:535
19/05/17 22:31:13.53 Af3ltV5Z.net
対LV3 黒番
47勝 34敗 勝率58.0%
ふーむ、まあ悪くないけど、正直もっと期待していたw
400~500戦くらいはしないとまだ結論は早いけど。

871:535
19/05/18 01:00:18.55 NdCkwblz.net
ほほう、6割行った。
120勝 80敗 勝率60.0%

872:535
19/05/18 16:28:24.45 NdCkwblz.net
291勝 231敗 勝率55.7%
ふーむ、まあ悪くないけど。
最終的には対LV3黒番勝率 70% を目指したい。

873:535
19/05/18 21:21:56.33 NdCkwblz.net
そういえば、勝率ばかり気にして肝心の棋譜をあまり見てなかったな。
どんな負け方してるのかちゃんと把握せねば。

874:535
19/05/18 22:11:34.39 NdCkwblz.net
ふーむ、必敗を避けるルーチンに若干バグがあるな。

875:535
19/05/19 07:21:38.98 GRYTxzHT.net
GPU使いたいなぁ。
せっかくいいの買ったんだから。

876:535
19/05/19 07:52:25.50 GRYTxzHT.net
ライフゲーム囲碁も平行で開発しようかなぁ。
アルファゼロアルゴリズムが心のどこかで捨てきれない。

877:535
19/05/19 13:54:34.49 GRYTxzHT.net
ライフゲーム囲碁 コード書き始めました。
ルール実装が結構効率的な奴思い付いて、1000万プレイアウト/s位出ました。
並行でやるっつっても計算資源が問題だなぁ。
囲連星はアイディアないしちょっとお休みかなぁ。

878:535
19/05/19 17:10:04.89 GRYTxzHT.net
GUIがないと不便だなぁ。うーん。

879:535
19/05/21 00:59:34.87 rSRUkqQW.net
うお、ついに人間(俺)に勝った!
内容的にも文句ない勝ち方だ!
(;SZ[19]
;B[jj];W[ji];B[ii];W[ih];B[ki];W[jh];B[kk];W[kh]
;B[lj];W[ij];B[hi];W[hk];B[hh];W[lg];B[gl];W[mg]
;B[gg];W[ff];B[gk];W[gj];B[ll];W[mm];B[fj];W[fi]
;B[gi];W[hj];B[hl];W[jk];B[ik];W[hj];B[gj];W[gf]
;B[gm];W[gh];B[fn];W[fh];B[lh])

880:535
19/05/21 01:06:56.53 rSRUkqQW.net
ここまでくると囲連星はいったん公開してもいいかもな。
本当は白黒総合勝率でLV3に勝ってからが理想なんだけど。
あとDBのファイルサイズでかいんだよなぁ。

881:535
19/05/21 23:53:55.55 rSRUkqQW.net
現状の囲連星のAIを公開します。
ちなみに対LV2黒番必勝ではなくなってしまっているようです。
あと思考時間かなり長いです。
URLリンク(drive.google.com)

882:535
19/05/23 20:03:18.47 boQDU2Sa.net
反応がなくて寂しい。。。
まあもともと過疎スレだからしかたないか。

883:310
19/05/25 01:28:48.60 rX0QQhRb.net
すんまそん。
ダウンロードしたけど、記譜作成中なので、CPU食いたくなくて(汗

884:535
19/05/25 21:14:03.65 LKgjurKe.net
囲碁ディープラーニングプログラミングという本があったので買ってみた

885:535
19/05/25 22:41:49.53 LKgjurKe.net
このサイトも面白そう
URLリンク(medium.com)

886:535
19/05/25 22:44:29.26 LKgjurKe.net
C#からC++を呼び出すの結構難しい。
マネージドコードとアンマネージドコードがどうたらとか、、、

887:535
19/05/27 14:54:14.96 6xYMMPUB.net
AMD Ryzen 3900来た

888:535
19/05/27 17:52:37.02 8VbKHTBW.net
囲碁ディープラーニングプログラム読んでるけどすっごい目が滑る
でも12章のactor critics法というのが面白そうで頑張って読みたい

889:535
19/06/01 23:30:05.61 bijpxRGI.net
俺のマザーボードRyzen3000シリーズに対応しないらしいorz
ショック

890:535
19/06/02 18:07:27.02 rgij2qjY.net
はぁ~だめだあぁ
目が滑る
頭に入ってこない

891:535
19/06/02 21:33:07.07 rgij2qjY.net
うお、betago(>>868の本のプログラム)動いた。
そして意外と強い。

892:535
19/06/02 21:38:17.03 rgij2qjY.net
ん、終局の仕方がわからん。
終局は実装されてないのかな?

893:名前は開発中のものです。
19/06/02 21:42:02.90 pCuEsXAG.net
いまからやってみるか

894:310
19/06/04 01:18:15.20 11K0AF4X.net
強化学習本興味あります。
棋譜作成がいまいち上手く行っていないので。

895:535
19/06/04 21:25:33.03 eotmjR11.net
くそう、時間が欲しい。
金さえあればニートになるのにww

896:535
19/06/05 21:45:28.39 tAUB+cOz.net
これから仕事が忙しくなりそうな予感。
まあさすがに土日は休めるだろうけど。

897:535
19/06/08 18:42:48.95 bTp76tLI.net
うおお、目が滑りまくりorz
一日無駄になったorz

898:535
19/06/08 21:38:02.44 bTp76tLI.net
目が滑るのは取り組み方が間違�


899:チてる証拠。



900:名前は開発中のものです。
19/06/10 12:52:10.55 /Ra7JNmg.net
囲碁は完全に人工知能に負け人間が追いつくことはないとおもうが。
これや将棋は微妙な線で、人間に勝ち目あるかもしれん。
囲碁より勝ち方、有利のさせ方が分かりやすい差。
人工知能なしの人間技で、人工知能に勝てる方法あるんじゃないかと。

901:名前は開発中のものです。
19/06/10 17:27:02.16 sKxIYoYq.net
大人も子供も白熱!最新ゲーム「ノッカノッカ」が面白い
URLリンク(ima.goo.ne.jp)
ビビットカラーを使ったポップなデザインの二人用ボードゲーム「ガブル」
URLリンク(boardgame-kikou.blog.jp)
LOGY GAMES ボードゲームカタログ
URLリンク(www.logygames.com)
オシャレで簡単、だけど深いボードゲーム
URLリンク(sweetint.com)
コンポーネントに酔いしれて、戦略にゆったり溺れる「箱庭の国」
URLリンク(sake.saloon.jp)
『すずめ雀』初心者でも本格的な駆け引きを楽しめるミニマル麻雀ゲームが登場
URLリンク(www.inside-games.jp)
エクストリーム将棋の企画から販売まで
URLリンク(nakagawa-hands.com)

902:535
19/06/11 18:15:44.55 a3oKL+Tm.net
「来た!」「16コア来た!」「メイン16コア来た!」「これで勝つる!」

903:535
19/06/11 22:20:28.87 R+B8a+a7.net
囲碁ディープラーニングプログラミング相変わらず目が滑ってるんだけど、
しつこく食らいついてたらすこしずつ目が滑らなくなってきてる。
何とかものにしたい。

904:535
19/06/12 19:47:45.91 UjRskMNa.net
githubのリポジトリbetagoとは別に囲碁ディープラーニングプログラミング用のやつがあんのか!
気が付かなかったぜ!
これで勝つる!

905:535
19/06/13 21:23:37.11 ip5cHIAR.net
囲碁ディープラーニングプログラミングのgithubのコードいいかも。
マルチスレッドにも対応してるっぽいし。
これはかなり期待できる。

906:535
19/06/13 21:36:37.70 ip5cHIAR.net
GPUが使えてないみたいだな。
tensorflow-gpuうまく入ってないみたいだ。

907:535
19/06/13 21:38:46.69 ip5cHIAR.net
それにしてもZen2 スリッパが欲しい。
16C32Tじゃ足りない。
64C128Tが欲しいww

908:535
19/06/14 21:40:47.35 AD5EB04u.net
ん、27000回学習を回した時点から過去のAIに対する勝率が10%~30%位しか行かなくなったみたい。
なぜ?
こんなことってあるのか?

909:535
19/06/14 22:09:53.32 AD5EB04u.net
ん、学習したネットワークと対戦する方法がわからんなぁ。
web_demo.pyあたりで行けそうな気もするが…

910:535
19/06/15 17:55:00.43 ANVzDRfZ.net
human_v_bot.pyというのでランダムAIと対戦できるようなので、これをちょっといじれば自作AIと対戦できそう。

911:535
19/06/15 19:41:51.27 ANVzDRfZ.net
ヤバイ、待ってる時間がじれったい。
やはり zen2 スレッドリッパー買うしか…

912:535
19/06/15 21:21:58.56 ANVzDRfZ.net
LifeGameGoのルールを早く移植したいけど、もうちょっとgithubコードの感触つかんでからかな。

913:535
19/06/15 22:03:51.50 ANVzDRfZ.net
ふーむ、まじで>>891の状態から抜け出せないな。
ネットワークが小さすぎるんだろうか?

914:535
19/06/16 19:35:53.70 OMA3ZwQu.net
あかんな、遅すぎる。
うーん。アルファゼロに幻想持ちすぎかも知れんな。

915:535
19/06/16 20:37:51.38 qjgvbRbv.net
囲碁よりもシンプルなLifeGameGoならもっと速く学習できるという可能背もありますが…
とりあえず、GPUを使えるように頑張るのが先かなぁ?

916:310
19/06/17 17:09:51.93 pTM6WQ3W.net
Surface Pro2の液晶が割れたorz
仕事で使うPCなので慌ててPro6の発注をかけました。
一応コア数2倍の4コア8スレッド、メモリーも16Gになる予定。
そろそろスピードの限界を感じていたので、痛しかゆしなところ。
ようやくIntelの呪縛から解放されるAVX2対応のCPUがAMDから出るというのに、
専用新型PCが遠のきました。

どのくらいスピードアップするかなぁ…。

917:535
19/06/17 19:55:14.11 KSoga8dR.net
仕事で使うpcが自腹なんかよ?
乙です

918:535
19/06/21 20:05:05.51 wxbtZaxz.net
なんかちょっとモチベが落ちてます。
せっかく週末なのになぁ。

919:535
19/06/22 20:40:40.51 s675JLMo.net
あああああ、だめだ完全に気持ちがしぼんでしまった。

920:535
19/06/23 23:02:35.16 wqGRreNQ.net
つかやっぱpythonはちょっと厳しいんだよなぁ…

921:310
19/06/25 22:00:54.87 i36dK7DH.net
あ、会社のPCです。流石に性能2倍なので、買うモチベーションが下がったのです。
現在液晶の表面パネルバキバキで、タブレット機能止めて、
セロテープで補強してだましだまし使ってますが、発熱によって
内部が歪んじゃっているみたいで、通常状態でも液晶が湾曲してます。

で、将棋の探索の深さが意味不明だったので、色々考えていましたが、
なんとなく想像がついてきました。多腕バンディット使って、反復深化と
絞り込みを行っているのではないかと思います。
現状中盤探索の速度がいまいち遅く、シングルプローブカットすると
何故かさらに遅くなるという状態。棋譜作成メインだったので、あまり
気にしていなかったのですが、新しいPC来たらちょっとトライしてみよう
かなと思っています。

922:310
19/06/28 22:23:55.68 jdIE39If.net
新PCセットアップ中。
前回思いついた中盤探索ロジック。具体的に実装を考え始めたら、
MCTSでいいじゃんということに(汗
これからVisual Studioのダウンロードです。

923:名前は開発中のものです。
19/06/29 09:41:43.34 aAhzQFUl.net
セットアップ完了して、開発環境の移行も終わりました。
VS2017→VS2019でエラーチェックが厳格化したものがあったようで、ソース修正。
Win8→Win10でコマンドプロンプトがなんか変わって、CTRL-Sの動作がよくわからない。
などなど、細かい点はいくつかありますが、速度的には思いのほか効果が出ていて、
ほぼ倍速くらいな感じです。並列のオーバーヘッド増加分を、クロック他CPU単体の
パフォーマンスアップで吸収していると思われます。

924:310
19/06/29 09:42:10.63 aAhzQFUl.net
↑は僕です。

925:535
19/06/29 17:06:05.94 6alt1Zxx.net
倍速はなかなかいいですね。おめでとうございます。
俺も頑張らねば。。。

926:535
19/06/30 17:26:00.32 5SElYd7b.net
逃げちゃだめだ、逃げちゃだめだ、逃げちゃだめだ(pythonから)

927:535
19/07/04 18:51:35.21 JLZZWsF4.net
VMWareだとどうにもtensorflow-gpuが使えないのでネイティブubuntuを入れるか迷い中
SSD丸ごと1個あけて別ドライブにインストールすればwin10とも干渉しないはず…

928:535
19/07/05 20:11:11.37 gv5AG18i.net
一応ubuntu入ったっぽい。
でも環境構築する根性が湧いてこない。
あしたにするか。。。

929:535
19/07/06 17:14:44.78 YqSGwJgi.net
あかん、ubuntuすっごい固まるorz
今日だけで4回フリーズしたorz

930:535
19/07/07 19:22:27.22 8kGyRN1E.net
ここまで固まられるとネイティブubuntuは正直、撤退かなぁ
うーん。惜しいなぁ。

931:535
19/07/07 22:36:19.30 8kGyRN1E.net
VMWareのubuntuは固まらないんだよなぁ
バージョンが違うからかなぁ

932:535
19/07/08 23:58:39.11 J+Oysvfm.net
50万局学習させても知性とは程遠い打ち筋orz
絶望した!

933:535
19/07/12 20:02:35.26 5KSDfXOV.net
さんれんきう

934:535
19/07/14 01:02:14.40 BHfYEZqG.net
AQZという囲碁AIが50万局の学習でプロに勝ったそうな。
なんで俺が試したプログラムとそんなに違うんだ?

935:535
19/07/15 07:10:16.79 U2als8ec.net
徹夜してしまった
反省(反省するとは言っていない)

936:535
19/07/21 20:03:14.96 E/xzPLNe.net
二進も三進もいかないorz
しばらく休憩するか…

937:535
19/07/21 21:27:54.74 E/xzPLNe.net
URLリンク(github.com)
気分を変えてこれに手を出そうかと思ってます。

938:535
19/07/28 15:53:29.60 afiNgtjO.net
すっかりさぼってしまっています。

939:310
19/07/31 22:58:56.92 RoaGFb2p.net
地味に改良&棋譜作成継続中。
評価値で黒番+2、白番-1くらいの差が生じているので、
評価関数にバイアス項を導入しました。
他、若干の高速化ネタ。
中盤探索でProbcutすると遅くなる問題を回避。本格修正するか悩み中。
というか、そもそもZebraより圧倒的に遅い原因がわからん。

940:535
19/08/04 00:47:49.68 kSURYkNt.net
ようやっと>>920のプログラムにライフゲーム囲碁のルールを実装しました。
python 超つらい…

941:535
19/08/04 01:56:43.25 kSURYkNt.net
CPU使用率10%か。。。切ない。。。

942:535
19/08/04 20:02:48.59 kSURYkNt.net
計算がある程度進むと必ずOSごとフリーズするorz
きょうびOSごと落ちるってどういうことだよ?

943:535
19/08/04 20:18:18.16 kSURYkNt.net
これはもうアルファゼロには手を出すなという神のお告げかもorz orz orz

944:535
19/08/07 20:34:05.86 cRW9S7xJ.net
そもそも、気温が高すぎて留守にしてる最中計算回しっぱなしにするの怖いってのもあるんだよなぁ

945:310
19/08/10 21:39:26.19 iTdjAaDm.net
中盤探索を改良。
一つは、普通に無駄な処理を見つけて修正。
もう一つは、評価値の計算に差分計算を取り入れました。
今まで並列処理で差分ってどうやるんだろうと思っていましたが、
単にDepth=1のところ(次がLeaf)で、順次評価値計算するのを
差分すればよかったのね。
この2つで、中盤探索で2手ほど深く読めるようになりました。

946:535
19/08/13 19:47:02.79 wzsq2qR8.net
今、実家に帰省してるんですが>>865のAIを動かしてみようとしたけどdllが認識されませんね?
何が悪いんだろう?

947:310
19/08/15 23:44:11.68 NhTCTcJa.net
小人閑居して不善をなす…。
思い切って、不要そうに思える棋譜をバッサリ削除してみました。
削除しすぎたかも。
いろいろ細かく修正と、デバッグ用表示の改良。
とかやっていたら、丸1日近く動かしたところで、なぜか急激にパフォーマンス低下。
もともと空きが少なかったSDDが一杯になっている…。とはいえ30Gはあったはず。
再起動していたらもとに戻った。原因不明。
対症療法で不要プログラムアンインストールしていたら、使っているOfficeを間違えて
アンインストールしてしまった。
HDD一杯が原因なのか、評価値のファイルが壊れていた。
ギリギリ間に合ってバックアップから復旧できた…と思う。

948:310
19/08/16 14:28:22.00 MY5mY5kZ.net
SDD一杯の犯人判明。
セキュリティー対策ソフトの監視対象管理DBのファイルが合計で400G越え(汗
ところが、管理者権限ないと停止できず、ファイル掴んでいるため削除できない。
今日は管理者休暇中。
logファイルを頻繁に追記しすぎて、ファイルサイズ変化する都度DBファイルが
作られているのではないかと想像。棋譜バッサリ削除して、一気に遡り探索やり直し
していて、これまでと比較にならないペースと数で追記処理が起きているので、
その影響の可能性が。

Officeは再インストールしてもらったけど、何故かセキュリティ解除キーの入力ができない。
来週月曜日は出張なので、来週火曜日までだましだまし行きます。
古い方のPCがまだ生きているので、Excel作業はそちらでやる事にしました。

949:535
19/08/23 19:05:38.98 KljXhF7+.net
AQZ敗退か
残念

950:名前は開発中のものです。
19/08/23 19:13:36.62 KljXhF7+.net
囲碁は現在のコミで白番有利説もあるようですがどうなのか

951:310
19/09/05 22:24:16.41 NIzTzKyA.net
棋譜の作り方全面改訂。
分岐のチェックで、以前は全ての分岐を棋譜化していたけど、今度のは軽い探索で
怪しい評価値(同一評価値~-4程度まで)のものだけ棋譜化するようにして、
棋譜数を大幅節約。学習が楽になるという算段です。
棋譜づくりが順調になり暇ができると、細かく気になっていた、どーでもよいところを
改良し始めて、バグとりで棋譜づくりが滞るという悪循環orz

よくよく考えたら、PCのパワーアップしたので、またDCNNトライとかしてみようかな
とか思い始めた。tiny-dnnしか選択肢無いんだけど。

952:535
19/09/11 20:42:08.54 EGEM/7RV.net
googleがminigoというオープンソースやってるらしいですね。
最近さぼりっぱなしだったけど、ちょっと見てみるか。

953:535
19/09/12 19:49:22.62 qOi8eRBu.net
すげー難しそう
まだちゃんと見てないけど

954:310
19/09/17 23:33:38.68 KoOw8EHX.net
相変わらずしこしこ棋譜作って学習繰り返してます。
もう無いだろうと思いつつ、ちょこっとした事に気づいて修正を繰り返してます。
置換表のハッシュ関数を改良。
格納効率が結構良くなったので、衝突が減ったはず。
終盤探索の時にBOOK(確定)も参照して余計な探索を減らしました。
基本遡りで確定させているので、運が良い時に滅茶苦茶早くなりました。
無い時は今まで通り(汗
学習データが不足しているのではないかと、置換表内に残っているスコアが確定
した局面FIFOで貯めて、折々に学習に回してみました。1回探索で100~500件
程度。これをFIFOで500万件。棋譜に残っていない局面で学習する事で、過学習
が防止できるかなと思っていますが…。
現在、27手確定局面で大体14000件の棋譜とその分岐で合計23万件ほどですが、
まだ棋譜が足りていない感じです。が、件数が増えすぎて手に負えません。
BOOKの確認ができるWindowsアプリ作ろうかと思い始めています。

955:535
19/09/22 19:52:21.38 ctBLCdpw.net
このまま失踪しそうな感じです。
やっぱアルファゼロは手を出してはいけないかったんや。

956:310
19/09/22 19:56:33.01 x3eDgHtk.net
DCNNになってから、一般人のPCでは手が出せなくなってるからね。
計算プロセス自体は、NNを極端に単純化したものが線形回帰だと思えば、
NNで生まれた計算ノウハウが流用できますよ。
というか、今の時代、ただのLRでDCNNとほぼ同じ強さ、とかの方がオシャレ
ではないかと思う、ひねくれものの僕。

957:310
19/09/23 19:34:01.85 taOqGsoO.net
所詮趣味なので、あまり無理せず、やる気になるときにやればよいかと思います。

958:535
19/09/23 20:58:22.95 T5ohU9uM.net
うーむ、やりたい気持ちはあるのですが、いかんせん難しすぎて…
githubにもっと易しそうなのでてくるまで待つか?うーん。

959:535
19/09/25 21:31:58.87 /O9j0jn/.net
気温が徐々に下がってますね。
そろそろ計算回しっぱなしにしてもいいかな。
つっても回せるプログラムがないけど。

960:535
19/09/28 22:43:07.40 upFNPupL.net
またgithub漁ってます。
URLリンク(github.com)

961:535
19/10/01 22:13:53.83 r/X1idNR.net
3日くらい計算回したけど全く強くなる気配がないなorz
もしかしたら微妙に強くなってるのかもしれないけどあまりに成長速度が遅すぎる
やっぱアルファゼロは計算時間が半端ないのかも?

962:535
19/10/01 23:21:06.21 r/X1idNR.net
やっぱアルファゼロはいったん諦めて、囲連星でやったようにモンテカルロAIの棋譜取り&勝率DB作り&教師ありDNNでライフゲーム囲碁やるべきか?
うーむ

963:310
19/10/02 01:57:09.42 FIHYKLNY.net
DCNN強化学習はマシンパワーが恐ろしいほど必要だからね。
満足できる教師データがそろってから評価関数に使ってみる程度にしないと…。
自由度が高すぎるので、まともな評価関数に収束するまでに、相当な試行回数が
必要なんじゃないかと思う。
自分は棋譜作成をずーっとやっていますが、現在は棋譜作りの目的がBook充実
になりつつあります。なんというか、現在の形はいつの間にかQ学習+ε-Greedy
っぽくなってきています。
アルファ様のお陰で、目標を見失いましたので、手段のためなら目的を選ばない感じ
で、プログラム作る楽しみという方向になっています(^^;

964:535
19/10/02 22:58:01.64 BtKMO/4x.net
ライフゲーム囲碁、モンテカルロAIの棋譜取り始めました。
ヒューリスティックなしのモンテカルロで1手10000プレイアウトで1局に約1分かかります。
それを16並列で1分当たり約16局採取できる予定。
棋譜の質があまりよくないのが難点ですがとりあえず、これでやってみます。

965:535
19/10/03 21:37:56.85 tdDOcoA1.net
18257局分棋譜が取れたようです。大体13.2局/分くらい取れるっぽい。
全コア動かすとシングルよりやっぱ少し遅くなるみたいですね。

966:535
19/10/06 00:55:35.61 V0Jk6SKR.net
DB作成まで来ました。
ライフゲーム囲碁は囲連星と比べてもっと沢山の棋譜が必要になるかもしれません。
オープニングのバリエーション的に。

967:310
19/10/11 20:52:12.13 Tdz7win8.net
評価関数を変えたくなってきた。
偶数手番と奇数手番の癖が顕著になってきたので、スムージングをしたく
なったのだけど、キーを手番優先にしているので、1手進むと盤面がひっくり
返ってしまい、連続性が無くなってしまう。
キーを黒番優先にして、評価値も黒番サイド(白番の場合は-1を掛ける)に
統一するとスムージングしやすくなる。
ただし、評価関数からBookから、あちこち影響が出る。
そろそろソースの整理がしたくなってきていたので、バッサリやっちゃおうかな。
台風で暇だし。

968:
19/10/12 09:18:22 acZ84t7K.net
一晩考えてやっぱ辞めました(^^;
単純じゃない。

969:
19/10/12 19:26:22 pRNoi8N2.net
あ~なんか情熱が湧いてこないな。
プログラム書くのがすごい億劫。

970:
19/10/13 05:54:00 ZL98wLBj.net
とりあえず、囲連星のコード流用してDNN学習回せるところまで来ました。
あとはAIプレイヤーのコードを移植すればひと段落かな。

971:
19/10/13 07:51:43 ZL98wLBj.net
モンテカルロAIとDNNAIで対戦できるところまで来ました。
DNNAIの動きはまあ第一弾にしては悪くない感じ。

972:
19/10/13 08:07:20 ZL98wLBj.net
パッと見DNNAIには知性の芽生えのようなものを感じる。
勝率に結びつくかは微妙だけど。

973:535
19/10/13 08:47:17.90 ZL98wLBj.net
勝率に結びついてませんね…。
残念過ぎる…。
寝るか。。。

974:
19/10/13 10:43:15 ZL98wLBj.net
うーん、ハッキリと弱くなってますね。
ライフゲーム囲碁って昔勝率DB使った時も勝率落ちたし何でだろう?

975:535
19/10/13 10:48:13.56 ZL98wLBj.net
モンテカルロAIにトリプルスコアで負けてますね~
かなc

976:
19/10/14 19:34:30 +gotlTkI.net
ここからどうしていけばいいのかわからんなぁ。
負けるDNNAIで棋譜取りして勝てるようになるのかといえばかなり期待薄。
でもやれることもないし一応やってみるか。

977:
19/10/15 23:46:30 ttnyLWCi.net
DNNの評価値を得点差から勝率と得点差/81の平均にしたところ
トリプルスコアで負けてたのがダブルスコアになったようです。
まだ負けてるけど。

囲碁では得点差で評価値を付けるのはほぼタブーで勝率を評価値にするのがセオリーなのですが、試してみたかった。

978:535
19/10/17 22:06:11.66 AT1bNTwz.net
やっぱ、負けてるなぁ。

979:535
19/10/22 14:18:39.16 Mqr1tYDA.net
うーむ相手から攻撃されたときに反撃しない癖があるようだ。
反撃さえすれば楽に勝てるはずなんだが…。

980:535
19/10/22 16:38:49.29 Mqr1tYDA.net
DNNの入力にに盤面の情報だけじゃなくて、石がぶつかってるところの情報も与えてみるか。
かなり肝になる情報のはずだから。

981:535
19/10/22 17:02:51.95 Mqr1tYDA.net
うお、メモリがパンクしたorz
もー新スレッドリッパーにメモリ1TB載せたいorz

982:535
19/10/22 17:31:13.35 Mqr1tYDA.net
データベースがでかすぎるのかなぁ。
500万局面を4対称で2000万局面分くらいあるんだが、初期アルファ碁でも3000万局面くらいだったっていうし減らそういかなぁ。
うーん。

983:535
19/10/23 20:19:32.52 VmufmFSW.net
前も言ったかもしれないけどいたずらにネットワークを巨大化するよりコンパクトにしてエポック数を稼いだほうがいいかもしれないな。

984:535
19/10/26 19:36:09.88 4XMH/3Nj.net
学習するほどに弱くなる理由がさっぱりわからんorz
ちょっと休憩

985:535
19/10/27 18:41:08.53 OnknjOzZ.net
またgithubでアルファゼロ探ししようかなぁ(懲りてない)

986:535
19/11/05 18:52:29.53 F2Rnn9oI.net
新スレッドリッパー今日発表見たいですね
ワクワク

987:535
19/11/05 22:09:32.07 GKFgjg5l.net
あれ、今日じゃないのか…

988:535
19/11/07 23:17:24.41 OiCk9RdB.net
スレッドリッパー 32コア ベース3.7GHz ターボ4.5GHz 1999$
素晴らしい
金がないけど

989:535
19/11/09 22:53:36.89 rF2mt5AD.net
URLリンク(github.com)
これwindowsでも動くっぽい

990:535
19/11/10 20:01:17.40 KZcBl7Ju.net
せっかく良さそうなの見つけたのに、イマイチモチベーション上がんないな~
なんでだろ。ホントよさそうなのに。

991:535
19/11/17 21:06:42.27 eK7f1inq.net
コツコツpythonやってます。
リストの使い方がわかってくると書く速度あがりそう。

992:535
19/11/17 21:48:33.74 eK7f1inq.net
>>972にライフゲーム碁のロジックを実装しました。
ランダムプレーヤーと対戦できるところまで確認しました。
意外と拡張しやすい作りになってるっぽい。

993:535
19/11/17 22:00:36.51 eK7f1inq.net
インターフェースの作りがうまいプログラムは心が躍りますね。
見習いたい。

994:535
19/11/17 22:24:52.29 eK7f1inq.net
うおおお、遅えええええええ
6x6オセロだと結構速いけど9x9ライフゲーム囲碁だとめちゃ遅いorz
なにか高速化策を考えねば…

995:535
19/11/17 22:33:57.28 eK7f1inq.net
並列化されてないっぽいな。うーむ
並列化狙うか…

996:535
19/11/18 20:52:01.98 mPMMCB5I.net
今日一日、強化学習回してたんですが途中でOS固まってたorz
でも一応、3回ベストポリシー更新されたみたい。
ランダムボットと対戦させてみます。

997:535
19/11/18 21:16:14.14 mPMMCB5I.net
ランダムボットと黒白25戦づつやってディープラーニングAIの39勝11敗
でだしとしてはまあまあかな。
純モンテカルロAIともやってみよう。

998:535
19/11/18 21:19:24.26 mPMMCB5I.net
あれ、純モンテカルロAIないのか?
うーん。

999:535
19/11/19 19:48:59.11 EOzKZ0AX.net
うーむOS固まるなぁ。
今日も固まった。
グラボの熱が悪いのだろうか?

1000:535
19/11/19 20:34:57.86 EOzKZ0AX.net
パソコンの調子が悪いのならいっそAWSとか検討するという手も…
でも金が…

1001:名前は開発中のものです。
19/11/20 21:49:18.08 lMEK9Bn7.net
今日も固まったorz
ほんまどーなってるの?

1002:535
19/11/20 21:49:44.28 lMEK9Bn7.net
名前忘れた

1003:535
19/11/20 22:46:44.07 lMEK9Bn7.net
固まったけど少し更新されてたようです
ランダムボットと対戦したら48勝2敗
結構ハッキリ強くなってるな。

1004:535
19/11/21 19:44:58.21 xK6B/ksk.net
今日も当たり前のように固まってるorz
どうすりゃいいんだ?

1005:535
19/11/21 21:11:44.62 xK6B/ksk.net
そろそろ次スレの季節ですね。
順番的に私の番か。
995くらいで立てたらいいですかね。

1006:535
19/11/22 19:54:12.78 nusik7MY.net
今日も固まった
いまのところ100%

1007:310
19/11/22 20:03:28.74 bJtjxKyJ.net
どもです。そろそろ次スレですね。
相変わらず、色々小改造しながら相変わらず棋譜作り続けています。
Book確認のデバッグ用プログラム作って、棋譜の間違い特定が飛躍的に早くなり、
その分、訂正用の棋譜が膨れて遡り探索がおろそかになっています。
評価関数の学習は進めていますが、どちらかというと評価関数が怪しくて間違えて
いそうなところで、わざと分岐させてBookで正解手順(に近い)の分岐を登録していく
事で、棋譜の精度を上げようとしています。BookをQ値と考えると、選択的なε-Greedy
でQ学習しているような感じになりつつあります。
もちろん、最終的には評価関数に反映しますが、今はBook構築が先みたいな。

VC++のバージョンアップ通知が来たので更新したら、あちこちワーニングや
エラーが出て来まして、ソースの整理をしながら、ワーニングにならないソース
に書き換え中です。急いでも仕方がないので、裏で棋譜作り動かしながら、
ちんたらやってます。
久々にMCTS部分を見たら、バグだらけだったので、直したところ、マシンパワーが
上がったことからか、残り30手程度ならすぐに終局まで枝が伸びて比較的正確に
最善手順が生成できそうかなと思っています。全てのプログラムの書き換えが
終わったところで、テストしてみたいと思っています。

1008:535
19/11/23 14:12:48.21 0YM91Vba.net
昨日の晩からいままで連続で動いてます。
なかなかベストポリシーが更新されなくて焦れる

1009:535
19/11/23 17:50:36.12 0YM91Vba.net
ランダムボットに白黒25戦づつやって50勝0敗来ました!
このゲームはほかのゲームと比べてランダムボットが比較的強いから素晴らしいですね。

1010:535
19/11/23 18:12:06.28 0YM91Vba.net
うーん、人間に勝てるほどは強くないな

1011:535
19/11/23 19:11:14.10 0YM91Vba.net
次スレ
【オセロ,将棋】ボードゲーム Part3【囲碁,War】
スレリンク(gamedev板)

1012:535
19/11/23 20:58:35.29 0YM91Vba.net
こっち埋めちゃいますね。

1013:535
19/11/23 20:59:10.47 0YM91Vba.net


1014:535
19/11/23 21:00:52.15 0YM91Vba.net
AWSでいいマシンを使うというのも憧れるが、
買うのとどっちが安いかは微妙かな。

1015:535
19/11/23 21:02:40.43 0YM91Vba.net
スレッドリッパー11月30日発売。
コア数はいわずもがなベースクロックもかなり高い。

1016:535
19/11/23 21:05:07.92 0YM91Vba.net
pythonの文法は結局何がいいのかよくわからんな。
ライブラリが充実してるってのはそうなんだろうけど。

1017:535
19/11/23 21:05:51.11 0YM91Vba.net
1000 !
お疲れさまでした。
次スレでまたお会いしましょう。

1018:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 769日 3時間 30分 53秒

1019:1002
Over 1000 Thread.net
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。

──────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
URLリンク(premium.5ch.net)
▼ 浪人ログインはこちら ▼
URLリンク(login.5ch.net)

1020:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch