▲コンピュータ将棋スレッド145at BGAME
▲コンピュータ将棋スレッド145 - 暇つぶし2ch2:名無し名人
18/12/06 09:23:27.28 psJkJWa30.net
elmo
URLリンク(github.com)
Qhapaq
URLリンク(github.com)
Apery
URLリンク(github.com)
やねうら王
URLリンク(github.com)
技巧
URLリンク(github.com)
読み太
URLリンク(github.com)
SILENT_MAJORITY
URLリンク(github.com)
the end of genesis T.N.K.evolution turbo type D
URLリンク(github.com)
nozomi
URLリンク(github.com)
大合神クジラちゃん
URLリンク(garnet-alice.net)
たま@人造棋士18号
Twitter
@mm_Tamachan_mm
URLリンク(twitter.com)
18号ダウンロード先
URLリンク(github.com)
Qhapaq、QQR、aperypaq
URLリンク(github.com)
野生の魔女
URLリンク(github.com)
URLリンク(twitter.com) (5ch newer account)
(deleted an unsolicited ad)

3:名無し名人
18/12/06 09:25:58.17 psJkJWa30.net
■ソフト
将棋ソフト(マイボナ等)のページ
URLリンク(www.geocities.jp)
将棋所
URLリンク(www.geocities.jp)
将棋GUI
URLリンク(shogigui.siganus.com)
柿木の将棋ソフトウェア(Kifu for Windows等)
URLリンク(kakinoki.o.oo7.jp)
将棋ぶらうざQ
URLリンク(park.geocities.jp)
脊尾詰
URLリンク(panashogi.web.fc2.com)
なのは詰め
URLリンク(vivio.blog.shinobi.jp)
なのは詰め64bit版
URLリンク(vivio.blog.shinobi.jp)
■開発者向けリンク集 etc
やねうら王 公式サイト
URLリンク(yaneuraou.yaneu.com)
競技プログラマー向け将棋AI開発入門 nodchip
URLリンク(topcoder.g.hatena.ne.jp)
ゲームプログラミング(将棋を中心に) 竹内 聖悟
URLリンク(www.ai-gakkai.or.jp)
コンピュータ将棋のアルゴリズム HTML版
URLリンク(usapyon.game.coocan.jp)
■コンピュータ将棋選手権使用可能ライブラリ
URLリンク(www2.computer-shogi.org)

4:名無し名人
18/12/06 09:26:04.68 bOo8mOJH0.net
やねうら王 公式サイト
URLリンク(yaneuraou.yaneu.com)

5:名無し名人
18/12/06 09:27:06.64 psJkJWa30.net
>>4
入れただろうがガイジ

6:名無し名人
18/12/06 09:31:28.55 psJkJWa30.net
開発者Twitterなど
@k_ohga(野生の読み太の人)
ツイッタ
URLリンク(twitter.com)
ファイル
URLリンク(github.com)
elmo
URLリンク(twitter.com)
Ponanza
URLリンク(twitter.com)
Apery
URLリンク(twitter.com)
やねうら王
URLリンク(twitter.com)
Qhapaq
URLリンク(twitter.com)
大合神クジラちゃん
URLリンク(twitter.com)
たぬき
URLリンク(twitter.com)
HoneyWaffle
URLリンク(twitter.com)
うさぴょん2'
URLリンク(twitter.com)
Hefeweizen
URLリンク(twitter.com)
@_illpha(dolphinやillphaの人)
URLリンク(twitter.com)
@ tayayan_ts(NNUEkaiの人)
URLリンク(twitter.com)
(deleted an unsolicited ad)

7:名無し名人
18/12/06 09:33:11.57 psJkJWa30.net
Qhapaq さんの新サイト:
コンピュータ将棋 まとめサイト(コンピュータ将棋のレーティング公開、wikiの運営など)
URLリンク(www.qhapaq.org)
コンピュータ将棋データベース(棋譜ファイル、対局結果のcsvファイル、各種バイナリ、定跡など)
URLリンク(www.qhapaq.org)

8:名無し名人
18/12/06 09:33:25.25 bOo8mOJH0.net
スマソ >>3が見えなかった・・・

9:名無し名人
18/12/06 09:35:23.42 psJkJWa30.net
次スレ立てたいけど立てられない場合は↓で
(落ちてたら 「スレ立て」もしくは「依頼」で検索)
[ID無] □■□将棋板・スレ立て依頼所 2□■□
スレリンク(bgame板)

10:名無し名人
18/12/06 11:04:00.89 5+EzAZJI0.net
>>1
裸玉はMATE20
10枚落ちと歩三兵は今のPCではMATE判定不能だと判明しました

11:名無し名人
18/12/06 12:14:39.07 rtaccU9Y0.net
>>10 って情報あるから検証してみては
>十枚落ち
>GodwhaleChild 5.0.5 + QQRなどのソフトにより、32手以内に下手勝ちであることが確かめられます[25]。
URLリンク(ja.wikiversity.org)

12:名無し名人
18/12/06 14:06:36.09 K5y0/dQs0.net
Ryoto_Sawada ?Qhapaq @Qhapaq_49
なんですって、それなら年末にはsota取り返しておきますの!!


年末までにNNUEkai7越えの評価関数公開

13:名無し名人
18/12/06 16:31:21.13 5+EzAZJI0.net
>>10
裸玉はMATE20、10枚落ちはMATE32
8枚落ちと歩三兵は、今のPC将棋ではまだMATE判定不能だと判明しました
>>11
ありがとうございます!このページ面白いですね
将棋 - ウィキバーシティ
URLリンク(ja.wikiversity.org)
>>1-7
のテンプレに加えると良いでしょう

14:名無し名人
18/12/07 04:22:01.79 JWIO1K+d0.net
URLリンク(twitter.com)
> There are also 100 shogi games for players to enjoy with a top 10 selected by Shogi legend Yoshiharu Habu
(deleted an unsolicited ad)

15:名無し名人
18/12/07 04:29:30.77 AAMKRQRm0.net
ついにAlphaZeroの棋譜公開か。
羽生善治セレクトって凄いな。全部で何局の棋譜から選んだんだろ

16:名無し名人
18/12/07 04:58:07.25 JWIO1K+d0.net
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
URLリンク(science.sciencemag.org)
Fig. 2 が興味深い

17:名無し名人
18/12/07 06:30:22.68 KCSvX4YVd.net
elmoに9割勝てるソフトが出てきたところでやっと棋譜公開かよ

18:名無し名人
18/12/07 06:33:05.44 X/8uPo8i0.net
またuuunが胡散臭い知り合いの外人登場させてなんか言いそうだなww

19:名無し名人
18/12/07 07:26:51.47 AH7+k66C0.net
suimonくんがブログのネタにしてしまったなw

20:名無し名人
18/12/07 07:27:47.31 cJOIwiVP0.net
>>14
今頃公開するということは完全に行き詰まって
撤退するということか

21:名無し名人
18/12/07 07:29:29.96 AH7+k66C0.net
ろくな記事じゃなかった
千田の解析待ちかな

22:名無し名人
18/12/07 08:17:41.55 9nOiKk+S0.net
なんかちょろっと棋譜見ただけだけどelmoが単純に弱いような
でもAlphaが強い事は確かそう

23:名無し名人
18/12/07 08:33:40.49 9nOiKk+S0.net
Alpha入玉多すぎ

24:名無し名人
18/12/07 08:44:16.38 xP56I0KZ0.net
78番目の棋譜のこの局面で△4六歩の攻め合いが最善と判断する最新のソフトは少ない感じ
gpsとか昔のソフトの方が最善になるっぽい。alphazeroは受け好きに見えるけど無難な3四銀じゃなくて
攻め合いを選ぶのはかなり攻撃的
後手の持駒:角 
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂 ・v金v玉 ・ ・v桂v香|一
| ・v飛 ・ ・ ・ ・v金 ・ ・|二
| ・ ・v歩 ・v歩 ・v銀v歩v歩|三
|v歩 ・ ・v歩v銀 ・ 歩 ・ ・|四
| ・v歩 ・ ・ ・v歩 ・ 歩 ・|五
| 歩 ・ 歩 ・ ・ 銀 ・ ・ ・|六
| ・ 歩 銀 歩 歩 歩 ・ ・ 歩|七
| ・ ・ 金 玉 ・ ・ ・ 飛 ・|八
| 香 桂 ・ ・ ・ 金 ・ 桂 香|九
+---------------------------+
先手の持駒:角 歩 
後手番

25:名無し名人
18/12/07 08:54:27.54 CSKRirU10.net
その図は46とって47歩成るで46角見て後手充分に思えるけど
そう進んでも37に歩受けて僅かに先手持ちなんだねえ
短時間しか読ませてないがkai7 は評価値+100~150な感じだった

26:名無し名人
18/12/07 09:06:34.49 /lbQEwv90.net
1番目だけ見たけど泥仕合って感じ
羽生さんの選んだ棋譜って何番になるの?

27:名無し名人
18/12/07 09:09:49.90 9nOiKk+S0.net
>>26
羽生セレクションの棋譜DL
棋譜の管理で見たけど引き分けの棋譜無くない?

28:名無し名人
18/12/07 09:15:48.38 /lbQEwv90.net
Aperyqhapaqにも勝つって書いてある。YaneuraOuの文字も(笑)
For the shogi match, one game was selected at random for each unique opening sequence of 25 plies (when AlphaZerowasblack)or10plies(whenAlphaZerowaswhite).
ってどういう意味だろう。なんの定跡?

29:名無し名人
18/12/07 09:17:19.49 /lbQEwv90.net
>>27
そんなのあったっけ?100棋譜あるけど

30:名無し名人
18/12/07 09:23:30.55 9nOiKk+S0.net
>>29
URLリンク(deepmind.com)

31:名無し名人
18/12/07 09:26:52.90 /lbQEwv90.net
>>30
なるほど!ありがとう!
なんか5手目▲9六歩ってこれから流行りそうw

32:名無し名人
18/12/07 09:31:35.43 /lbQEwv90.net
こういうのってどうなんですか?教えて詳しい人
To evaluate performance in shogi, we used Elmo version WCSC27 in combination
with YaneuraOu 2017 Early KPPT 4.79 64AVX2 TOURNAMENT as a baseline program,
using 44 CPU threads (on two 2.2GHz Intel Xeon Broadwell CPUs with 22 cores) and
a hash size of 32GB with the usi options of EnteringKingRule set to CSARule27,
MinimumThinkingTime set to 1000, BookFile set to standard book.db,
BookDepthLimit set to 0 and BookMoves set to 200. Additionally,
we also evaluated against Aperyqhapaq combined with the same YaneuraOu version
and no book ?le. For Aperyqhapaq, we used the same usi options as for Elmo
except forthebooksetting.

33:名無し名人
18/12/07 09:48:27.42 UnnKFmow0.net
未だにボードゲームネタとかどーなってんの
DLもまるで成長していないイメージにしかならんぞ

34:名無し名人
18/12/07 09:52:13.40 /lbQEwv90.net
>>33
そういう君にはカスパロフのこの言葉を

Chess has been used as a Rosetta Stone of both human and machine cognition for over a century.
AlphaZero renews the remarkable connection between an ancient board game and cutting-edge science by doing something extraordinary.
Garry Kasparov, former World Chess Champion

35:名無し名人
18/12/07 09:56:47.99 /lbQEwv90.net
羽生さんの言葉も
Some of its moves, such as moving the King to the centre of the board, go against shogi theory and - from a human perspective - seem to put AlphaZero in a perilous position.
But incredibly it remains in control of the board. Its unique playing style shows us that there are new possibilities for the game."
Yoshiharu Habu, 9-dan professional, only player in history to hold all seven major shogi titles
玉が中央に進出するっていうのは12番目の棋譜のことを言っているのかな?

36:名無し名人
18/12/07 10:00:31.28 9nOiKk+S0.net
全体的に中段玉とかバランス型の玉型がお好き

37:名無し名人
18/12/07 10:13:09.58 xP56I0KZ0.net
玉の空中遊泳で凌ぐ棋譜たくさんあるなw

38:名無し名人
18/12/07 10:15:48.77 xP56I0KZ0.net
>>35
羽生さん選んだ18番も腰掛け玉

39:名無し名人
18/12/07 10:16:08.61 qy5JBJSwa.net
本当にゼロから学習してるのか?既存の定跡に近いものがたくさん
違った学習法だから見たことない指し方、展開期待してたのに、拍子抜け

40:名無し名人
18/12/07 10:33:59.70 f7hH/VNk0.net
AlphaZero「青野流最高や!」

41:名無し名人
18/12/07 10:53:34.15 xP56I0KZ0.net
横歩は江戸時代からあるけど▲3四飛のまま戦うのは400年間見落としていたともいえる
相掛かりで78金受けないで24歩つく棋譜や大駒や歩の不成まで何個か混じってるのは
勝負に影響がない類の「悪手」は残ってるんだねw

42:名無し名人
18/12/07 10:53:40.73 W/fTE0Ks0.net
長年培われてきた定跡やら戦型がかなり洗練されたものだということがわかったな
その中で新しい展開を探していくって感じで、全く未知のゲームになるわけではなくて安心した
囲碁みたいに謎の手順だらけになってやばいかと思ったわ

43:名無し名人
18/12/07 10:55:57.68 3Kpmw/kH0.net
初期配置による制約が必然の手順を生むのだろう

44:名無し名人
18/12/07 10:56:32.33 /XA9FbqkM.net
結局のところ良い手が有っても相手がそれを回避するから棋譜に残らないっていう1点に尽きるかと

45:名無し名人
18/12/07 10:59:26.94 9PuO9Y4pM.net
棋譜だけ見せられてもな
ソフト自身の解析見なきゃ意味がない

46:名無し名人
18/12/07 11:01:51.89 /lbQEwv90.net
ちょっと待って。>>28 にも書いたけど
定跡に使用についての
For the shogi match, one game was selected at random for each unique opening sequence of 25 plies (when AlphaZero was black) or10plies(when AlphaZero was white).
ってどういう意味だろう?

47:名無し名人
18/12/07 11:02:02.94 W/fTE0Ks0.net
初手78金が結構多いな
後手の34歩と84歩を先手は歩を突かずに待ったほうが得だってことなのか?

48:名無し名人
18/12/07 11:05:55.42 xP56I0KZ0.net
21番の棋譜ここで▲6七玉も普通のソフトは指さないだろうな
中段玉マンぶりが表れている
後手:elmo
後手の持駒:歩二 
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v玉v金 ・ ・ ・ ・v香|一
| ・ ・v銀 ・ ・v銀v金 ・ ・|二
| ・ ・v歩v歩v歩v歩v桂v歩v角|三
|v歩 ・v飛 ・ ・ ・ ・ ・v歩|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 ・ ・ 歩 歩 歩 歩 ・ ・|六
| ・ 歩 歩 ・ ・ 銀 桂 ・ 歩|七
| ・ 角 金 銀 玉 金 ・ ・ ・|八
| 香 桂 ・ ・ ・ ・ ・ 飛 香|九
+---------------------------+
先手:AlphaZero
先手の持駒:なし
手数=46 △7一玉 まで

49:名無し名人
18/12/07 11:09:12.63 xP56I0KZ0.net
>>47
そこらへんは囲碁でも言われていたけどほとんど差がないけど学習の過程である特定の指し方が
強化されて選ばれやすくなっているだけなんじゃないかな

50:名無し名人
18/12/07 11:17:40.78 W/fTE0Ks0.net
>>48
浅い読みだと100点くらいは評価下がるから深く読まないと見えてこない手なのかもな
>>49
その微妙な差が重要なのか気にしなくても良い物なのかを人間が判断しないといけないから大変だわな

51:名無し名人
18/12/07 11:31:16.08 2+4FHj8x0.net
>>32
Xeon44コアのTCECでもハッシュサイズは16GBだから、32GBのハッシュサイズは
十分すぎるくらい十分だと思われる
設定についてはほぼ申し分ないかと
>>46
アルファ将棋が先手のときは25手まで、後手のときは10手まで定跡進行にした
定跡の選択は1局ごとにランダムに変更、ってことだね
どちらも「先に定跡を抜けるのはelmo」という点はいっしょだけど、
なぜこの数字を選んだかはわからない

52:名無し名人
18/12/07 11:31:29.23 s7iNIX9s0.net
最近の角換わりばかりの棋譜に食傷気味だったからかもしれないが
相掛かりがよく見られて楽しめる棋譜多いと感じた

53:名無し名人
18/12/07 11:33:41.39 qy5JBJSwa.net
>>48
米長羽生の名人戦であったな
この手見た瞬間羽生が負けを悟った、と

54:名無し名人
18/12/07 11:36:23.76 /XA9FbqkM.net
ハッシュは1手当たりのノード数によるでしょ
10億ノードぐらいまでなら32GBぐらいで十分だけど
それ以上ならあればあるだけいい

55:名無し名人
18/12/07 11:47:13.75 q5S/13hLM.net
elmoは1手120億局面で対局しているから
AlphaZeroの手を評価するには
最低でもNNUEkai7で1手120億局面は欲しいね
それでも互角くらいだろうから倍の240億局面が理想だけど現実的ではない

56:名無し名人
18/12/07 11:48:00.95 xP56I0KZ0.net
>>53
羽生さんも棋譜見たときその記憶がよみがえったかもなw
中盤で差をつけてからの勝ち方が真綿で首を締める的な「ぬるい手」が多いのは
囲碁のモンテカルロ法の影響かな.詰みがあるときも詰まさないのがちらほらあるし

57:名無し名人
18/12/07 11:53:50.57 /lbQEwv90.net
>>51
どうも定跡を使ったのはElmo側でAlphaZeroは使っていないようだね。Table S9を見ると
Table S3を見ると、Training timeは12時間って書いてあるけど、それだけ?はぁ

58:名無し名人
18/12/07 11:58:50.99 s7iNIX9s0.net
Rotaさんが最新orqha or NNUEkai7 vs aperypaqやってるかなっと思って調べたけどやってなかった
aperypaqにも勝率9割近いね

59:名無し名人
18/12/07 12:06:18.84 yg9YTxCu0.net
改めて見るとelmoのNPS2500万の3時間対局ってすごいな
AlphaZeroじゃなくともそれだけリソース注ぎ込んだ最近の強豪ソフトの長時間対局棋譜(しかも100局も)というだけで価値があると思う
今の最強ソフトってAperypaqに85%以上の勝率残せるのかね?
AlphaZeroはそのくらい勝てるみたいだけど
レートからの期待勝率ではなく、実際に対戦してどのくらいの勝率なんだろう
最近のごちゃまぜ系列のソフトって相性問題がより過敏になっている印象
ソフトによってレート差と実際の勝率で差があることがよくあるよね

60:名無し名人
18/12/07 12:09:59.21 W/fTE0Ks0.net
>>59
レート的に今の最強でも80%くらいが限界だと思う
もうちょいで追いつきそうってくらいかな

61:名無し名人
18/12/07 12:12:06.50 z45Z2oM3M.net
>>59
その凄いことを出来るのにやらないのがnishimon

62:名無し名人
18/12/07 12:13:05.18 OjGAznUX0.net
対elmoWCSC27勝率だけ見るとNNUEkai7とほとんど変わらないけど対Aperypaq勝率を見るとNNUEkai7よりR100-150ぐらい強いのかな

63:名無し名人
18/12/07 12:15:05.97 W/fTE0Ks0.net
でも結局マシンリソース的に互角の手合いなのかがわからないからなんとも言えないんだよね

64:名無し名人
18/12/07 12:19:31.31 ewrvbiI7M.net
>>39
やねうら王/Rezeroも手法こそ従来と同じでも人の棋譜を参考にしてないのにあの結果なことを考えると予想できてたことでしょ

65:名無し名人
18/12/07 12:22:39.86 z45Z2oM3M.net
そんな奥の深いゲームじゃないってことだろ

66:名無し名人
18/12/07 12:23:17.96 q5S/13hLM.net
リゼロは探索部に人類の工夫(ただ捨ては避けるとか)が含まれているから
完全なゼロベースとは言い難い

67:名無し名人
18/12/07 12:23:57.27 I0a4Ys7N0.net
AlphaZeroの棋風が既存のソフトと全く違って新鮮だな

68:名無し名人
18/12/07 12:26:29.66 H1Bl6dBm0.net
>>59
1局3時間の1000局
ディープブルー開発者、カスパロフ、羽生のコメント付き
Deepmindらしいやり方
initialQ(FPU)論争を終わらせるために、MCTSの疑似コードまで付いてる
terminal stateも前の論文は不明瞭だったのが
512手で引き分けと明確化された

69:名無し名人
18/12/07 12:27:16.55 f7hH/VNk0.net
やはり相居飛車の定跡型なのかー

70:名無し名人
18/12/07 12:45:29.40 H1Bl6dBm0.net
Cpuct
C(s) = log ((1 + N(s) + cbase)/cbase) + cinit

71:名無し名人
18/12/07 12:51:00.76 /XA9FbqkM.net
再現が難しい数字出して一方的に殴るのはgoogleの得意分野

72:名無し名人
18/12/07 12:51:27.09 /lbQEwv90.net
どうやらAlphaZeroは2時間の学習でelmoを超えたらしいからね

73:名無し名人
18/12/07 12:54:59.78 H1Bl6dBm0.net
self.pb_c_base = 19652
self.pb_c_init = 1.25

initialQとCpuctをいじる必要がなくなった
LCZ 20xxx系のCpuct 5とか強くなるわけないわ
今、見たらもう30xxx系がCpuct 3から1.3になってた、クソ早い

74:名無し名人
18/12/07 12:56:28.87 Cvpxljr8d.net
で、それを再現するのに2080Tiで何時間かかるやら
Leela zero chessですら最新stockfishにまだ追い付けない

75:名無し名人
18/12/07 12:58:01.85 z45Z2oM3M.net
ブレイクスルーというか、バーケードが破られた秘密が何か掴めるか

76:名無し名人
18/12/07 13:00:03.45 W/fTE0Ks0.net
>>74
2080Ti単品でやったら学習終わるまでにこっちが寿命迎えてしまう

77:名無し名人
18/12/07 13:04:30.39 xP56I0KZ0.net
成っても成らなくてもいいときは成らん.あえてね
取っても取らなくてもいいときは取らん.あえてね
挑発じゃないからね

78:名無し名人
18/12/07 13:08:54.93 Cvpxljr8d.net
三倍の電力差でaperypaqに勝率85%くらい
現在の最新ソフト(同スペック)で勝率70%くらい
仕事の片手間でソフト開発してる人からすればNNUE改造してる方が伸び代がありそう

79:名無し名人
18/12/07 13:22:57.78 xP56I0KZ0.net
41番105手目▲1三歩△同龍▲1四歩△同龍▲1六歩
先手勝勢の局面で歩を二枚プレゼント.まるで不利な方がやる水平線効果のような手

後手の持駒:角 香二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v金 ・ ・v銀 ・v金v玉 ・|一
| ・ ・ ・ ・ と ・ ・v歩 ・|二
|v歩v歩 ・ ・v歩 ・v桂 ・ ・|三
| ・ ・ ・v歩 ・ 桂v歩 ・v龍|四
| ・ ・ ・ ・ 金 ・ ・ ・v角|五
| 歩 ・v歩 ・ ・ 銀 歩 歩 ・|六
| ・ ・ 桂 歩 歩 歩 ・ 金 ・|七
| ・ ・ ・ 銀 ・ 玉 ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ 龍|九
+---------------------------+
先手の持駒:銀 桂 歩四

80:名無し名人
18/12/07 13:41:21.11 X/8uPo8i0.net
そろそろDeepmind垢にアホが凸る頃合い

81:名無し名人
18/12/07 13:42:43.89 VsRlYQN10.net
最強ソフトで棋譜解析キボンヌ

82:名無し名人
18/12/07 13:43:49.09 /lbQEwv90.net
elmo先手番の時、初手▲7六歩ばっかりじゃん
なんで?

83:名無し名人
18/12/07 13:50:32.31 /lbQEwv90.net
AlphaZero先生によると、初手は▲2六歩らしい (Fig 3B)
初手▲7六歩だと負けが多い
対する後手の応手は△3四歩ということかな?
△8四歩より勝率が高いから
でも自己対戦は▲2六歩△8四歩の進行が圧倒的に多いけど

84:名無し名人
18/12/07 14:14:36.39 f7hH/VNk0.net
26歩34歩には76歩からの横歩取り青野流があるぞw

85:名無し名人
18/12/07 14:17:58.77 Vj1KxhNZ0.net
>>78
平岡さんの以下ツイートにはaperypaqではなくelmoとあまりレート差がないelmoに追加学習したeloqhappaらしいんだが
AlphaZeroと対局したelmo以外の評価関数、Aperypaqではなくeloqhappaの方か(´・_・`)
澤田さんのネーミングセンスがキツいっす(´・_・`)
たしかあれはSDT5以前のやつだからelmoとそんなに強さ変わらないやつだったっけ?(´・_・`)

86:名無し名人
18/12/07 14:26:12.74 s7iNIX9s0.net
>>85
それ平岡さんが勘違いしてる可能性が高い
aperypaqが置いてあるURLがeloqhappaだから

87:名無し名人
18/12/07 14:26:20.09 VsRlYQN10.net
>>83
76歩34歩で後手ボロ負けしてるから、26歩34歩76歩で合流するのでは。76歩34歩の次の一手はほぼ間違いなく26歩だろうし

88:名無し名人
18/12/07 14:26:21.08 Vj1KxhNZ0.net
>>78
白ビール(ショットガン)の芝先生も平岡さんへの返信でeloqhappaをaperypaqと勘違いしている可能性があるって
AlphaZeroの中の人が勘違いしてる可能性あるね
URLリンク(twitter.com)
(deleted an unsolicited ad)

89:名無し名人
18/12/07 14:28:49.15 W/fTE0Ks0.net
というか時期的にaperypaqなわけないか

90:名無し名人
18/12/07 14:29:01.01 x1wsX+ZR0.net
URLがエロ河童なだけでAperypaqが一番上にあるから間違えないだろ
平岡さんの勘違いでしょ

91:名無し名人
18/12/07 14:29:39.19 f7hH/VNk0.net
>>87
おっしゃる通りですな。

92:名無し名人
18/12/07 14:37:41.42 Vj1KxhNZ0.net
AlphaZeroはelmoに三倍以上の電力で対局しているのでフェアじゃないよな
同じメーカー同士の家庭用パソコンでも三倍以上の電力のスペックなら強いからな

93:名無し名人
18/12/07 14:42:51.66 H1Bl6dBm0.net
stockfishの開発版は2018年1月バージョン使ってるよ
論文は
History:
Received for publication March 2, 2018
Accepted for publication November 7, 2018

94:名無し名人
18/12/07 14:58:48.39 W/fTE0Ks0.net
電力消費揃えたらAlphaZeroはR4300くらいってとこなのかな

95:名無し名人
18/12/07 15:04:24.46 7gao7c510.net
eloqhappa aperyqhapaq
澤田先生のオリジナリティ溢れるネーミングのせいでdeepmindを混乱させてしまった説

96:名無し名人
18/12/07 15:10:49.65 s7iNIX9s0.net
deepmindが勘違いしたんじゃなくて平岡さんが勘違いした
参照元として貼られたURLのeloqhappaを見て判断したんだろう
実際にaperypaqは一番上に置いてある
URLリンク(github.com)

97:名無し名人
18/12/07 15:14:00.88 Vj1KxhNZ0.net
>>96
そうはいってもaperypaqは2017.11.28リリースだが時期的に合わないんじゃないのか

98:名無し名人
18/12/07 15:17:13.59 f7hH/VNk0.net
【悲報】エロ河童に勝利9割か?

99:名無し名人
18/12/07 15:24:21.94 s7iNIX9s0.net
>>97
時期?
2017年12月に発表された論文と別だよ
今回はelmoも定跡使ってるし、ほぼ詰みまで指してる

100:名無し名人
18/12/07 15:24:56.52 s7iNIX9s0.net
stockfishも2018年のバージョン使ってる

101:名無し名人
18/12/07 15:25:26.76 W/fTE0Ks0.net
>>96
後から一番上に追加されたからからいつそのページを見に来たのかという

102:名無し名人
18/12/07 15:28:18.39 s7iNIX9s0.net
>>101
aperypaqは公開された時からずっとそのURLにあった
あとから追加されたものが一番上に表示されるわけではない(QQRもここにある)

103:名無し名人
18/12/07 15:29:39.48 Vj1KxhNZ0.net
>>99
例えAlphaZeroがelmoやaperypaqに今の最新ソフトより勝率が高いとしても三倍以上の電力差で対局して
いるのでソフトだけの強さでいえば今の最新ソフトよりやや弱い程度だろう、今の最新ソフトも三倍以上の
電力差のパソコンで対局したらAlphaZeroよりもっと勝率が高くなるはず

104:名無し名人
18/12/07 15:31:49.65 s7iNIX9s0.net
そもそもaperypaqが追加される前にページに来たならaperypaqの存在も知らずにelmo-qhapaqって書くだろう

105:名無し名人
18/12/07 15:32:42.46 W/fTE0Ks0.net
>>102
ん?
あそこの置き場は後からどんどん追加されていっているのでは?
QQRも追加されたんじゃなかったっけ?

106:名無し名人
18/12/07 15:33:39.55 /XA9FbqkM.net
キャッシュ32GBの使用率考えたら120億ノードでも実質半分ぐらいの性能しか出てないんでは?
まあHUGE HASHがデフォでオフだからしゃーないけど

107:名無し名人
18/12/07 15:35:35.35 W/fTE0Ks0.net
>>106
10億ノードで6GBくらいハッシュ使うからちょっと少なめかもね

108:名無し名人
18/12/07 15:37:09.92 H1Bl6dBm0.net
勝率91.2%からaperypaqで約87.7%まで落ちてるから
70 Elo差が縮まってて、上出来だろう
あの辺は同系統でレートインフレしてるだけだし

109:名無し名人
18/12/07 15:38:12.89 Vj1KxhNZ0.net
結論は三倍以上の電力差に加えて32GBの使用率考えたら120億ノードだと衝突して性能が十分出ていない
のでフェアじゃないのは確かだな、ソフトだけの性能は最新ソフトの方がやや強いのは間違いないな

110:名無し名人
18/12/07 15:39:55.44 s7iNIX9s0.net
>>105
そもそもなぜエロガッパを使ったと思うんだ?
エロガッパは当時最強でもなんでもなかったし
優勝ソフトでもないのでdeepmindが論文に載せるはずがない

111:名無し名人
18/12/07 15:41:36.22 x1wsX+ZR0.net
ただURLがエロ河童だっただけだろ
ユニバーサルメルカトル法並みの低能だなw

112:名無し名人
18/12/07 15:42:55.68 s7iNIX9s0.net
フェアかどうかはelmo側だけ定跡使ってるのもどうなのってことになる
wcscも環境は同じじゃないからフェアな大会じゃないことになる

113:名無し名人
18/12/07 15:45:15.82 W/fTE0Ks0.net
>>110
たしかにそうだが、向こうさんが何か間違えてる可能性もなくはないかと思ってね
結論としては電力消費やハッシュなんかを平等に近い条件に調整してあげると
ちょうど現在のR4350とかなり近いくらいの棋力ってことになるのかな

114:名無し名人
18/12/07 15:46:07.69 Vj1KxhNZ0.net
elmoの定跡は1年7か月前の大分古いもので今の最新ソフトには大してアドバンテージはないだろう

115:名無し名人
18/12/07 15:47:43.12 9nOiKk+S0.net
>>112
wcscは青天井とは言わないけど
金積めば積んだだけハード上げられるしフェアな大会じゃないと思うけどな

116:名無し名人
18/12/07 15:49:09.61 /XA9FbqkM.net
厳密にルールが決まってるならフェアと言われるだろうし
何でもありも当事者の責任で最高のものを用意できる点でフェアだと思う
ただ自分に都合のいい仮想敵を作って殴るのはフェアとは思えない

117:名無し名人
18/12/07 15:50:02.40 TBINl2+p0.net
ルール違反じゃないならフェアやろ

118:名無し名人
18/12/07 15:52:43.35 Vj1KxhNZ0.net
いずれにしても三倍以上の電力差に加えてハッシュの衝突などを考慮すれば今の最新ソフトよりやや弱い程度だろう

119:名無し名人
18/12/07 15:53:24.96 H1Bl6dBm0.net
消費電力ガーとか言い出すが奴がいるから
持ち時間を1/10にしても圧勝してる情報載せてるのになぁ

120:名無し名人
18/12/07 15:56:05.24 Vj1KxhNZ0.net
>>119
持ち時間を1/10しても三倍以上の電力差は変わらんのじゃないのか

121:名無し名人
18/12/07 15:57:47.14 W/fTE0Ks0.net
丁度1/3のデータが良い感じだよな
あれ見た感じだとやっぱりR4300~4350くらいっぽい

122:名無し名人
18/12/07 16:00:08.74 u67kZh3Gp.net
電力三倍ガイジw

123:名無し名人
18/12/07 16:03:02.68 Vj1KxhNZ0.net
>>122
電力三倍もあれば同じソフト同士でも圧勝できるだろうが

124:名無し名人
18/12/07 16:06:31.72 Vj1KxhNZ0.net
所詮は電力三倍差やハッシュの衝突であの勝率なら最新ソフトよりやや弱い程度だな

125:名無し名人
18/12/07 16:30:40.47 Dikglui10.net
deepmindの中の人は日本製のソフトは
田所浩二、YJSNPI、インテル長友、ターミナルさん、サイクロップス先輩
世界一イキ顔を見られた男、SEXしてるだけで面白い男
と名前は違うけど、中身は同じ野獣先輩みたいに
和製PCの本質は変わらないから、まあいいやみたいな感覚でしょ

126:名無し名人
18/12/07 16:57:52.10 f7hH/VNk0.net
最新ソフトより弱いのか
NNUEkai7でおk

127:名無し名人
18/12/07 17:02:52.95 cJOIwiVP0.net
どちらにしても一般家庭用のPCで使用できない
ソフトと使用できるでソフトを比較しても仕方がない
安いノートPCで使用できるようになるまで黙殺しよう

128:名無し名人
18/12/07 17:05:28.23 TBINl2+p0.net
今の時代AWSなりGCPなりあるんだからさ、一般家庭で使用できないわけじゃないじゃん

129:名無し名人
18/12/07 17:17:57.77 xP56I0KZ0.net
>>24
66番の棋譜も同じ将棋だね.353手の相入玉になってるけど
ちょっと調べた限りだと先手評価値少しいいけど手のひら返す可能性の高い変化かもね

130:名無し名人
18/12/07 17:22:29.60 yg9YTxCu0.net
ID:Vj1KxhNZ0
すごいね、この方
コンピュータ将棋界隈ってこういう病的な人けっこういるのかな
DeepMindが将棋に深入りしてこなかったのは懸命だったと思わされる

131:名無し名人
18/12/07 17:27:14.01 Vj1KxhNZ0.net
>>130
お前はアホか、電力三倍やハッシュの衝突により差が広がっている事実を言っているだけだろうが

132:名無し名人
18/12/07 17:29:19.55 Vj1KxhNZ0.net
>>130
こういうDeepMind厨みたいなアホがいるから困るw

133:名無し名人
18/12/07 17:30:25.79 yg9YTxCu0.net
そういうことを言っているのではないんですけどね
あ、もうけっこうですのでNGにしますね

134:名無し名人
18/12/07 17:30:59.92 UnnKFmow0.net
将棋に深入りとか元よりありえんし
それよりこういうレスで「懸命」とか誤字は恥ずかしいわ 冷静になったほうがいい

135:名無し名人
18/12/07 17:32:47.36 Vj1KxhNZ0.net
>>133
俺もお前をNGにしたわ

136:名無し名人
18/12/07 17:36:57.69 NYy01/Id0.net
5chならともかくTwitterで羽生さんをヨッシャル呼ばわりとか呆れるね

137:名無し名人
18/12/07 17:42:23.72 UnnKFmow0.net
DLはいい加減ゲームでなんかやりました系はやめたほうがいいわ
進捗ないからなんかお茶を濁しているようにすら思える

138:名無し名人
18/12/07 17:50:10.12 TBINl2+p0.net
アレができるようになったって言ってんのに進捗ないってどういうことよ
仕事が進んだからそれが出来たんじゃないの?

139:名無し名人
18/12/07 17:56:35.42 /jx211Ch0.net
DLなんて画像認識でもNLPでも医療の分野でも相当成果あげてるように思うが

140:名無し名人
18/12/07 17:59:26.54 sNT9oQNm0.net
人間抜いたときにギャーギャー言うタイプだなw

141:名無し名人
18/12/07 18:07:29.50 s7iNIX9s0.net
出来ることといったら
URLリンク(twitter.com)
のツイートをRTといいね押しまくって
deepmindに「チェスよりも将棋のほうが注目度高いやん!」と勘違いさせること
(deleted an unsolicited ad)

142:名無し名人
18/12/07 18:11:30.03 kNLZmx0Hr.net
コンピューターには稲庭戦法?W

143:名無し名人
18/12/07 18:39:59.30 sVWMkhojd.net
shotgun定跡をかいくぐって勝てたら本物だな

144:名無し名人
18/12/07 19:00:07.66 ewrvbiI7M.net
AlphaZeroと金沢将棋'98が何万局も対局したらどうなるのっと

145:名無し名人
18/12/07 19:42:51.40 xP56I0KZ0.net
「腰掛玉」で検索したら佐藤康光 九段の棋譜がみつかった
URLリンク(shogidb2.com)

146:名無し名人
18/12/07 20:01:43.51 gXKEWEvG0.net
たかが5chごとき一発で変換できなかったらできなかったでそのまま通すけどな

147:名無し名人
18/12/07 20:45:42.40 xP56I0KZ0.net
Alphazero blackとwhiteってのはチェスと囲碁将棋では先後逆なんだよね?
チェスの後手はほとんど全部ドローなんか。囲碁は白丸のホワイトの方が勝率高いけど
これは後手の方が勝率高いのだとしたらコミが変ってことか?

148:名無し名人
18/12/07 20:54:12.79 cJOIwiVP0.net
>>128
ShogiGUIの存在すら知らない大多数の一般PCユーザーが
AWSやGCPを使用するとはとても思えない

149:名無し名人
18/12/07 21:05:00.29 +czYwGmB0.net
横歩取りは死にそうだなとは思ってたけど角換わりも死んで相掛かりに収束するんだろうか。
というかAlphaZero以外のR4000超えソフトも、
横歩取りの先手勝率高い割には後手避けない気がするのは気のせい?

150:名無し名人
18/12/07 21:52:28.28 TBINl2+p0.net
>>148
なら尚更、「要求スペックの高すぎるソフトは一般家庭で使えない」は的外れやん

151:名無し名人
18/12/07 22:03:40.03 +czYwGmB0.net
31
やっとelmoが勝った棋譜を見つけた。珍しく横歩取り先手番でAlphaZeroが負けてる。
100も実質AlphaZeroの勝ちで、R4500近くはあるんじゃ

152:名無し名人
18/12/07 22:10:06.64 dCmoe/tB0.net
>>151
あれだけの消費電力に長時間対局だからi9のPCで1500万ノードの棋譜とは内容が違って棋力も高いのは当然

153:名無し名人
18/12/07 23:43:02.76 cJOIwiVP0.net
>>150
実質使用できないということです
もしこれらのサービスを知っていても
有料だとほとんどのユーザーが敬遠
して使用しないでしょう業務以外では
ネットがつながらない時でも自由に使用
できるのが将棋ソフトの長所だと思います

154:名無し名人
18/12/08 00:28:51.49 3JWvDYRH0.net
>>153
結局何がいいたいのか

155:名無し名人
18/12/08 01:26:34.00 H55Pz0oT0.net
NNUE最高や!🇯🇵🇯🇵🇯🇵

156:名無し名人
18/12/08 01:49:33.93 Ok90DByAd.net
‪ウォーエンブレムとかいう種牡馬の性癖wwwwwwwwwwwwwwwww [無断転載禁止]©2ch.net ‬
‪ スレリンク(morningcoffee板)‬

157:名無し名人
18/12/08 07:16:36.13 DhvtK3Hka.net
>>156
スゲー昔の話もってきたな

158:名無し名人
18/12/08 08:09:06.39 9FZcfG9E0.net
ルール以外何も教えない状態から学習してきたAlphazeroは間違ったルールで学習してきた可能性もあるのか。。
英語でちゃんと宣言ルールを説明している文書があるんかな?
平岡 拓也 ???\(´・_・` )/??@HiraokaTakuya
AlphaZero in Shogi has a bug in Entering King rule. For example 75.csa, and 100.csa.
AlphaZero was able to declare victory, but AlphaZero resigned.
URLリンク(twitter.com)
(deleted an unsolicited ad)

159:名無し名人
18/12/08 08:44:36.02 q3Q0wW3W0.net
「国際的な対局を行い、または国際大会を支援する」を事業とする将棋団体が有るらしいし
英文でのルールとか当たり前だろ?

160:名無し名人
18/12/08 08:49:11.55 B4R0Z8BB0.net
そもそも日本語のルールがね……

161:名無し名人
18/12/08 09:31:41.95 KYcu6M8I0.net
そもそも指し直しのルールがはっきりしないと有限ゲームなのかそうでないのかのレベルで定まらない…

162:名無し名人
18/12/08 10:10:33.17 2ANCDxDi0.net
>>48
12億ノード、深さ30でも67玉の評価値は上がってない・・・
はっきり言ってまだまだ未完成の評価関数のような気がする。
URLリンク(i.imgur.com)

163:名無し名人
18/12/08 10:42:24.04 4t19TCvu0.net
>>147
7目半のコミは白有利じゃないかと言われてる。
6目半がちょうどいいという説もあるけど中国ルール
(コンピューター囲碁は普通これ採用)では表現できない

164:名無し名人
18/12/08 11:40:22.00 0GScs9T+0.net
角換わりでelmo相手にたまに負けるあたり、特別不利な戦法というわけでもないのかな

165:名無し名人
18/12/08 11:57:29.31 zhl5EpjGa.net
もうこれからはeスポーツの時代だよな
何十年も将棋指してきた自分がいうのも難だけど時代が追いついてないような。。。

166:名無し名人
18/12/08 13:11:48.61 IK0lfrWL0.net
どうせ完全に同じ条件で対局すればNNUEkai7やorqhaの方が強いんだろな

167:名無し名人
18/12/08 13:27:17.52 fbp48rxVd.net
AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」

168:名無し名人
18/12/08 16:21:49.33 PgIwdBl7M.net
>>162
elmo側でさえ推定1手120億ノードだぞ

169:名無し名人
18/12/08 16:25:13.12 PgIwdBl7M.net
AlphaZeroの棋譜を候補手3で解析するとしたら
最新ソフトで最低300億ノードは欲しいところ
そうなるとメモリが足りないから
インスタンスを借りるにしても高価なメモリ特化型が必要で、検討するだけでも金が掛かりすぎる

170:名無し名人
18/12/08 17:17:22.69 EFAeRw8l0.net
【将棋】叡王戦パラダイス 12月号
URLリンク(live.nicovideo.jp)
>さらに今回は通常コーナー終了後、21時ごろから
>先日DeepMind社が公開した人工知能「AlphaZero」の棋譜を
>千田翔太六段に解説していただく二部構成です。

171:名無し名人
18/12/08 18:19:18.04 iu3hDVAL0.net
AlphaZeroには自己対戦で定跡作ってほしいわ

172:名無し名人
18/12/08 18:22:42.88 6DiR2bFM0.net
それ、囲碁だったらAlphaGo Teachっていうのがあるよ

173:名無し名人
18/12/08 19:07:13.31 0GScs9T+0.net
新しく公開されたorqhaの期譜もなにげにすごい。
最近の成長の早さ的にわりと近いうちにAlphaZeroに追いつきそう

174:名無し名人
18/12/08 19:14:34.81 uvZ7t8q10.net
>>173
ハードが全然種類が違うからAlphaZeroが強いわけがない、一般家庭用のデスクトップやノートPCレベルで同じ消費電力
で対局したら最新ソフトがAlphaZeroに圧勝するだろう

175:名無し名人
18/12/08 19:17:03.75 uvZ7t8q10.net
AlphaZeroは10万~100万レベルの環境では性能が発揮出来んだろう

176:名無し名人
18/12/08 19:21:30.91 iu3hDVAL0.net
ちょっと価格に差があるが雑に2080Tiと9900Kで持ち時間1時間くらいで対局してみてほしい

177:名無し名人
18/12/08 19:47:23.88 PgIwdBl7M.net
ソフトの強さはともかく
棋譜としては今回公開されたシリーズが最高品質なのは間違いないね
仮に最新ソフトがAlphaZeroと同じ強さだったとしても
このレベルの棋譜を作るにはAWSを使って課金しないと難しいし誰もしないだろう

178:名無し名人
18/12/08 19:49:41.49 IK0lfrWL0.net
googleさんはNNUEkai7やorqhaとやってくれよ

179:名無し名人
18/12/08 19:54:13.91 uvZ7t8q10.net
AlphaZeroの高額なハードや消費電力、持ち時間から最高品質なのを否定しているのではない、最高品質なのは棋譜を見たら分かる
しかしソフト自体の性能は10万~100万レベルのハードを使用し同程度の消費電力で対局したら、まだ最新ソフトの方が強いだろう

180:名無し名人
18/12/08 19:54:37.67 PgIwdBl7M.net
>>178
elmoは今でもダウンロード出来るんだから
NNUEkai7やorqhaが近い条件のelmoを相手にAlphaZero以上の勝率を出せる事を示さなきゃ話にならんよ

181:名無し名人
18/12/08 19:58:26.69 iu3hDVAL0.net
今の最新ソフトだとハイスペックな条件では勝ち越しは難しいだろうな

182:名無し名人
18/12/08 20:03:32.87 uvZ7t8q10.net
今回のAlphaZeroは高額なハードの恩恵で強いだけからな、10万~100万レベルのハードに落とし同程度の消費電力で
やったら最新ソフトの方が強いだろう

183:名無し名人
18/12/08 20:06:41.58 PgIwdBl7M.net
まあAlphaZeroも12時間しか学習してないし
NNUEに例えるならオリジナルT.N.K.評価関数くらいの本気度だろう
あとザッと計算したらAWSでインスタンス立てて
1局1000円くらいあればelmo側は再現可能っぽい
もう片方もインスタンス立てて1局1000円で動かせば
100局合計20万円くらいでAlphaZeroと既存ソフトの超高ノードでの棋力差がハッキリする

184:名無し名人
18/12/08 20:09:28.24 3JWvDYRH0.net
将棋ソフト開発者が現状白旗あげてるのに「電力がー」
ここ一年の否定厨
「棋譜も公開できないAlphaZeroは弱い」
「900点打ち切りで将棋に重要な終盤力は雑魚ってわかる」
「入玉ルールは無しはありえない」
「定跡使ってないからelmoは負けた」←普段レーティング測るときに定跡使わないくせに
現在
「電力がー」

185:名無し名人
18/12/08 20:13:13.27 uvZ7t8q10.net
将棋ソフト開発者はAlphaZeroのハード価格帯を10万~100万ノードにして同程度の消費電力で対戦することを
考えてないからな

186:名無し名人
18/12/08 20:14:07.34 uvZ7t8q10.net
〇10万~100万円

187:名無し名人
18/12/08 20:22:45.14 XaCR62jsa.net
消費電力やエネルギー言い出したら
そもそも人間が一番強いんじゃ・・・

188:名無し名人
18/12/08 20:26:35.43 H7Bo/6H20.net
>>187
人間より、スマホじゃね?

189:名無し名人
18/12/08 20:27:50.18 A9mbOR6n0.net
読んでる手数で考えたら人間が強いと思う

190:名無し名人
18/12/08 20:53:29.08 JWJA9Beb0.net
開発者がイキッてて草
お前らも同じことしてたのにアスペ丸出し

191:名無し名人
18/12/08 21:00:59.90 axbp45Re0.net
開発者様だろ。言葉遣いに気をつけろ。

192:名無し名人
18/12/08 21:03:09.94 0GScs9T+0.net
>>183
12時間しかといっても12時間でサチってる。T.N.K.もサチってたのかは知らんんが
とはいえGoogle先生がもっと本気出せばまた軽く+R200とかなりそう。
でもDMがまた赤字になりそう

193:名無し名人
18/12/08 21:04:03.72 kV/wBjDk0.net
そもそもソフトによって最適な環境が違うのに、低消費電力で動かしたら云々は見当違いやろ……
AlphaZeroにとって最適な環境がこれだっただけで
F1に対して、「エンジンが高すぎる、軽自動車のエンジンでやったら結果はわからない」って言ってるのと同じやん

194:名無し名人
18/12/08 21:06:59.55 0GScs9T+0.net
おれみたいな貧乏人にはNNUEkaiやorqhaということで

195:名無し名人
18/12/08 21:08:31.77 vTqCrvCc0.net
とりあえずAlphaZeroにはWCSCに参加して
優勝してもらわなければ外野がいくら騒いでも
最強の証明にはならない

196:名無し名人
18/12/08 21:12:26.72 Cyovag000.net
>>20
Scienceに投稿したんだから論文掲載号が発刊されるまでは情報だせんよ
あのへんの学術出版系は縛りが厳しい

197:名無し名人
18/12/08 21:14:16.39 HyJ3fOnM0.net
正直elmoとの棋譜より長時間での自己対局の棋譜のほうが見たいけどな

198:名無し名人
18/12/08 21:16:24.38 Cyovag000.net
>>35
ドワンゴと叡王戦は存在を消されたんだな(微笑)

199:名無し名人
18/12/08 21:54:40.72 uvZ7t8q10.net
ハードは消費電力が高いほどソフトの棋力も高く出来るからな、所詮、あえてelmoより電力3倍以上
使ったAlphaZeroは不公平なハードの力での結果だからな、同程度の電力でやれば最新ソフトの方が
強いからな

200:名無し名人
18/12/08 21:59:56.69 uvZ7t8q10.net
例えば今回はハード差があるデスクトップPC(AlphaZero)とノートPC(elmo)で対戦して有意な
デスクトップPC(AlphaZero)の勝率が高いといっているようもんで話にならんわw

201:名無し名人
18/12/08 22:01:29.28 WZp33Rgc0.net
こういうこと言われないためにAlphaZero側がむしろ消費電力が少ないぐらいの条件で対局すればよかった

202:名無し名人
18/12/08 22:10:40.47 iu3hDVAL0.net
思ったほど圧倒的に勝ち越せなくてスペック盛ったとかだったら嫌だわ

203:名無し名人
18/12/08 22:24:15.47 WZp33Rgc0.net
>>202
その可能性はあるでしょ インパクト出すためにマシンスペック盛るぐらいは必然の手筋

204:名無し名人
18/12/08 22:29:27.20 Ty0xY3GO0.net
AlphaZero : TPU v1 X 4 = 40W(max) X 4 = 160W
elmo : Xeon E5-2699 v4 X 2 = 145W X 2 = 290W
elmoの方が消費電力が大きい。ウソ言ったものの勝ちかよ。

205:名無し名人
18/12/08 22:35:53.74 iu3hDVAL0.net
>>204
対局に使ったのって第二世代なんじゃなかったっけ?
あとTPUのワット数ってどこに載ってるか教えてほしい

206:名無し名人
18/12/08 22:42:51.87 EFAeRw8l0.net
>>205
URLリンク(eetimes.jp)

207:名無し名人
18/12/08 22:51:05.85 iu3hDVAL0.net
>>206
サンクス
40Wは最初に発表された第一世代のほうだね
第二世代は性能アップと共に消費電力は倍増しているんじゃないかと予想されている
この記事では公開されてないからなんともいえないが80Wくらいだったとして320W
わりと公平なセッティングだったのかもな

208:名無し名人
18/12/08 22:54:04.15 a8V/86X50.net
>>206
>第2世代TPUは28nmプロセスを適用したチップで、消費電力は40W、動作周波数は700MHzである。主論理ユニットには6万5536個の8ビット乗算累算ユニットと24Mバイトのキャッシュを搭載しているという。
この部分は第1世代の話だね
多分記事が間違えてる
第2世代はヒートシンクの大きさから200Wオーバーという話も

209:名無し名人
18/12/08 23:04:51.60 Ty0xY3GO0.net
full-paper:
Stockfish and Elmo used 44 central processing unit (CPU) cores.
AlphaZero and AlphaGo Zero used a single machine with four first-generation TPUs and 44 CPU cores
Xeon E5 2699 v4:
URLリンク(ark.intel.com)
URLリンク(www.atmarkit.co.jp)
TPU v1 : 40W

210:名無し名人
18/12/08 23:21:32.98 iu3hDVAL0.net
>>209
サンクス
それにしても40Wってすごいな、GTX1060ですら120Wなのに

211:名無し名人
18/12/08 23:23:42.24 uvZ7t8q10.net
>>204
AlphaZeroはTITAN V(TDP250W)相当のTPUを4基使っており、elmoはXeon E5-2699 v4相当のCPU(TDP145W)を2基使用で
およそ3倍の電力差があるぞ

212:名無し名人
18/12/08 23:32:42.68 /DV+3gd50.net
TCEC シーズン14の3部リーグは4回戦総当たり全28ラウンドを終了して
Leela chess 0 が18勝1敗9分の1位、Komodo MCTSが14勝2敗12分の2位で
それぞれ3位以下を大きく引き離して2部昇格
KomodoMCTSの2敗はLc0からで、これを考えると従来型エンジンへのMCTSはまだ時期尚早か
2部は間もなくスタート

213:名無し名人
18/12/08 23:35:18.13 9FZcfG9E0.net
88番の棋譜仕掛けの後のちょっと珍しい手と終盤の面白さがいいな

214:名無し名人
18/12/08 23:54:40.71 0GScs9T+0.net
電力差が実は公平だったとしてもわりと手の届きそうな強さに希望を感じる
ということを去年も言った気がする
来年も言ってるかもしれない

215:名無し名人
18/12/08 23:56:33.78 uvZ7t8q10.net
ハードの消費電力が高いほどソフトの棋力も高く出来るからな、あえてelmoより電力3倍以上
使ったAlphaZeroは不公平なハードの力での結果だからな

216:名無し名人
18/12/09 00:15:48.31 qjHDtLMJ0.net
ルールだけ教えて2時間で強くなったところが重要なんだから電力とかどうでもいいじゃん

217:名無し名人
18/12/09 00:18:36.47 y4kVLvKe0.net
電力うんぬん言ってるやつは
論文4ページの下から4行目から見てみ
対局に使われたのは第二世代のTPU(推定200 wattsから250 watts)じゃなくて第一世代のTPU(公表40 watts)4基
ちなみに去年の論文では対局に使われたTPUのバージョンは書かれてなかった

218:名無し名人
18/12/09 01:04:44.97 hwy67+4T0.net
お前らってなんで対局時の電力しか考えないの?
学習にかけた時間は無視すんの?
もっと言えば、人件費も考慮しろよ
Deepmindの超高給取り研究者十数人と日本のIT土方一人
数億円と数百万やから電力以上の比やぞw

219:名無し名人
18/12/09 01:13:12.02 VGjiF8sU0.net
エコロジーの時代やし…

220:名無し名人
18/12/09 01:17:31.26 oHE6OQbDa.net
まぁ学習にかけた電力はドン引きレベルなのは確実

221:名無し名人
18/12/09 01:25:09.34 ueU4BKsP0.net
とりあえずNNUEkai7に勝率8割と見積もっておく

222:名無し名人
18/12/09 01:46:34.93 bHh5Xxq30.net
ねえよ、ねえ

223:名無し名人
18/12/09 02:56:43.59 y4kVLvKe0.net
「負けたのはaperypaqじゃなくてeloqhappa!」 ← aperypaqが置いてあったURLがeloqhappaだっただけ
「250WのTPUを4基使ってる!elmoとくらべて電力三倍!」 ← 40WのTPUを4基でした
言い掛かりじゃなくてAlphaZero見習って相掛かりやれよ

224:名無し名人
18/12/09 06:41:58.15 rHc6TuHhd.net
NNUEKAI7がaperypaqに勝率77%だからまぁ
わりと追い付けそうな感じ。
コンピューター将棋もR4500あたりで頭打ちになると盛り下がりそう

225:名無し名人
18/12/09 07:32:53.71 a9vjUCgu0.net
電王戦はアルファゼロに挑戦する棋戦として復活したら?

226:名無し名人
18/12/09 07:33:49.52 /YLHk49or.net
>>224
山下さんが将棋の限界がR4400~4500くらいって言ってたような

227:名無し名人
18/12/09 07:56:06.70 T35vp8UF0.net
どうせなら、矢倉や振り飛車もあったほうが盛り上がっただろうな
ちょっとopeningを調整したらいいだけだし

228:名無し名人
18/12/09 08:12:59.96 523uUMZd0.net
>>55
> elmoは1手120億局面で対局しているから
> AlphaZeroの手を評価するには
> 最低でもNNUEkai7で1手120億局面は欲しいね
> それでも互角くらいだろうから倍の240億局面が理想だけど現実的ではない
はっきり言って深さ35以降進むことは現実的に困難だと思う。
1階層深くなるのにとんでもない局面数を探索しなければならないからだ。
候補3 時間 356:17.1 深さ 37/51 ノード数 26868955647 評価値 74 読み筋 ▲7九角(88) △2四歩(23)
候補2 時間 356:17.1 深さ 37/56 ノード数 26868955647 評価値 177 読み筋 ▲7六歩(77) △同 飛(74
候補1 時間 356:17.1 深さ 38/56 ノード数 26868955647 評価値 204 読み筋 ▲5七銀(68) △5一銀(42
候補3 時間 236:39.6 深さ 37/51 ノード数 17782208909 評価値 74 読み筋 ▲7九角(88) △2四歩(23)
候補2 時間 236:39.6 深さ 37/51 ノード数 17782208909 評価値 155 読み筋 ▲5七銀(68) △5一銀(42
候補1 時間 236:39.6 深さ 37/54 ノード数 17782208909 評価値 177 読み筋 ▲7六歩(77) △同 飛(74
候補3 時間 210:01.0 深さ 36/36 ノード数 15736865173 評価値 98 読み筋 ▲6七玉(58) △3四飛(74)
候補2 時間 210:01.0 深さ 37/51 ノード数 15736865173 評価値 155 読み筋 ▲5七銀(68) △5一銀(42
候補1 時間 210:01.0 深さ 37/54 ノード数 15736865173 評価値 177 読み筋 ▲7六歩(77) △同 飛(74
候補3 時間 165:10.3 深さ 36/52 ノード数 12338603650 評価値 81 読み筋 ▲7六歩(77) △同 飛(74)
候補2 時間 165:10.3 深さ 36/50 ノード数 12338603650 評価値 98 読み筋 ▲6七玉(58) △3四飛(74)
候補1 時間 165:10.3 深さ 37/51 ノード数 12338603650 評価値 155 読み筋 ▲5七銀(68) △5一銀(42

229:名無し名人
18/12/09 08:30:47.36 1lAquVWv0.net
>>226
まじか
いつ発言されたのかは知らないが、本当だとしたらかなり鋭い分析だね。
Alphazeroのaperyqhapaqとの勝率とも合致する

230:名無し名人
18/12/09 08:47:22.32 MkOcHDZx0.net
囲碁界の人は謙虚に棋譜から学ぼうとしてたのに
将棋界は文句しか言わねえなあw

231:名無し名人
18/12/09 09:39:12.21 IhMiLK7pM.net
前回の論文の問題点をほぼほぼ解消したのにまだ叩かれるAlphaZeroかわいそう

232:名無し名人
18/12/09 10:04:43.83 jCZVdmHO0.net
そもそもpreprintって正式な論文の前段階だからな

233:名無し名人
18/12/09 10:15:46.74 1lAquVWv0.net
そうですね。まぁ査読を出す前の論文ですし。
いろんな指摘があるのはいいこと

234:名無し名人
18/12/09 10:24:18.02 XWvGmoEtM.net
そもそも論として
数十億ノードの世界でorqhaやNNUEkai7がelmoよりも強いという保障もない
検討用途を考えたら億単位のノードでの強さが最重要だから
それを証明してみせたAlphaZeroが現状では頂点でしょう
>>228
120億ノードは自分の計算ミスで
実際にはelmo側は1手30億ノードくらいっぽい

235:名無し名人
18/12/09 10:39:09.98 u2/Ipr2xp.net
depth32ですら中盤だと50億ノードくらい読むことあるからな
depth40で1億教師作れればalphazeroを軽く超えられるんだろうが現実的じゃない

236:名無し名人
18/12/09 10:50:46.50 wceCBXeY0.net
コンピューター将棋ってコンテンツが低レベルなガラパゴスコンテンツ過ぎてオワコンだなー
googleが汎用プログラムで12時間学習させるだけでガラパゴス王者をフルボッコw
井戸の中の蛙なことを知らずにお釈迦様の手のひらの上でイキってる孫悟空だな

237:名無し名人
18/12/09 10:59:18.19 ZUkyEdMt0.net
>>209
これ見るとAlphpaZeroは44コアのマシン1台と第1世代TPUx4
elmoは44コアのマシン1台
だよね?

238:名無し名人
18/12/09 11:09:18.04 y4kVLvKe0.net
そうだけど
Stockfish is designed to exploit CPU hardware and cannot make use of GPU/TPU, whereas
AlphaZero is designed to exploit GPU/TPU hardware rather than CPU.

239:名無し名人
18/12/09 11:18:02.42 i/ylB3Z40.net
最近ついにstockfishのVer10がリリースされた
某将棋エンジンと違い確実にレートが上がって
いるようだ このチームに将棋エンジンも作って
ほしいな

240:名無し名人
18/12/09 11:47:07.22 E3XDf7xYF.net
今はもうstockfishの最新を反映させても対して強くならないよ

241:名無し名人
18/12/09 11:52:05.40 C0iVFJRf0.net
将棋とチェスでは中盤に入ってからの展開がかなり違うからな
stockfishと同じように枝を刈ってもそうそう劇的に強くならないだろう

242:名無し名人
18/12/09 12:01:51.57 gOrXfzPJ0.net
ロタ
@Rota_JP
【orqha1018は横歩取りの後手番を持たない】
次のWCSCでは横歩取りは消滅する予感

243:名無し名人
18/12/09 12:17:31.74 2gz6K2uL0.net
ロタ如きが何を偉そうに

244:名無し名人
18/12/09 12:22:47.87 jCZVdmHO0.net
青野流は先手勝率7、8割の世界だからな
最低限対策(△7四飛)を調べてからじゃないと後手は大損するだけ

245:名無し名人
18/12/09 12:23:38.32 XWvGmoEtM.net
「消滅する予感」の部分は本人言ってないぞ
風評被害はやめよう

246:名無し名人
18/12/09 12:28:13.82 jCZVdmHO0.net
とは言っても去年の選手権のときに横歩取りの青野流は二局あって実は先手が負けているんだよな。
ハードが強力になれば事前のデータ通りにいかない可能性もある

247:名無し名人
18/12/09 12:31:19.26 C0iVFJRf0.net
常にdepth34くらいまで読める状況なら後手にもまだいい手があるかもしれないしな

248:名無し名人
18/12/09 12:55:06.98 ZUNl4RoE0.net
alphazeroはチェスのDeep Blueの衝撃には遠く及ばない
URLリンク(www.youtube.com)
alphazeroはElmoを少し超えただけだった
URLリンク(www.mikunimaru.com)
既にalphazeroと同等のPCソフトが登場している

249:名無し名人
18/12/09 13:13:45.97 xTXNMET7d.net
トロシュナの新馬戦の大外一気がすごいとワイの中で話題に‪
2018年10月21日 新潟5R 2歳新馬牝 トロシュナ
URLリンク(youtu.be) @YouTubeより‬

250:名無し名人
18/12/09 13:22:54.45 Mkh5glrJ0.net
実際問題、白ビールやPALのようなアンチコンピューティングに長けたソフトが
十分な設備・定跡ONでぶつかればAlphaZeroもそこまで圧倒的大差をつけることは出来ないと思うけどな
AlphaZeroの指し方はいかにも未完成でスキがある 近いレーティングのソフト相手にあのような舐めプが通じるだろうか?
AlphaZeroの学習がサチってるなら1年以内には追い越すだろう

251:名無し名人
18/12/09 13:27:06.00 jCZVdmHO0.net
なめぷなのはかなり差がついてからだよ。

252:名無し名人
18/12/09 13:47:11.52 gBiAkfkJa.net
AlphaZeroは80ブロックのネットワークを使えばもっと強くなるのかな?
もちろん学習に必要な計算量が多すぎるけど

253:名無し名人
18/12/09 13:57:28.44 RHPzR7XO0.net
AlphaZeroは、全くの自力の学習で強くなるよと示す論文であって、縛りプレイしてるから、
もっと効率的に学習することそのものは可能。
たとえば、最初はElmoの出す教師局面の評価値から学習して、その後自己対戦で学習、
とするだけで基本的な戦略の獲得のところはすっ飛ばせて、
最終レート到達までの時間やステップ数は早められる。
ただ、学術的にはそんな将棋ソフト用の特殊な学習の仕方をしても意味が無くて、むしろ、汎用的に学習できるよと示すために
あえて多少非効率でも自己対戦のみという縛りプレイでやってるんだよ。
強くすることそのものが目的の各種将棋ソフトとはその点で成り立ちが違う。

254:名無し名人
18/12/09 13:59:24.73 RHPzR7XO0.net
せっかく羽生竜王に協力してもらうなら、
桂馬が横にも飛べるルールで自己対戦学習したAlphaZeroと羽生竜王との対局とかして欲しかったな。

255:名無し名人
18/12/09 14:06:26.36 jCZVdmHO0.net
勝勢になってからなめぷなのはランダムに全部の手を学習させて勝率だけしか評価されてないから。
華麗な最短の寄せだろうが形勢が悪くならない悪手だろうが等価になる。

256:名無し名人
18/12/09 14:40:17.38 kRCLz1510.net
>>253
だよね
汎用的な学習という戦略の評価なのにアウトプットの優劣つけて騒いでるの馬鹿みたい

257:名無し名人
18/12/09 14:44:25.97 kRCLz1510.net
羽生とはNHKの取材通じて接触があったしこういうときに一番業界で有名な人を釣りだすのが
いつものDM/Googleのやり方なんでいってもしょうがないのだが
相掛かりスキーということで羽生でなく郷田に棋譜選定してもらいたかったな、てのだけが憾み

258:名無し名人
18/12/09 15:50:46.04 ueU4BKsP0.net
新しいハードの開発は個人じゃ限界があるし、google先生に遅れをとるのはしゃーない。
これからはTPUで開発する時代になるんだろうか。知らんけど
あえてCPUにこだわる利点は?

259:名無し名人
18/12/09 16:09:06.31 kgpuQiQE0.net
>>252
たぶん微差だと思うよ。
強くするために必要なパラメータ数はたぶん指数関数的に増えていくから、2倍にしてもたいして変わらんと思う。

260:名無し名人
18/12/09 16:14:40.53 ps7dLMWkd.net
>>236
>googleが汎用プログラムで12時間学習させるだけでガラパゴス王者をフルボッコw
Googleが専門家を集めて組織的に数年前に渡り開発したソフトが、個人が趣味で数ヶ月間?で開発したソフトに勝率9割くらいだった
ディープラーニングの実験だったとは言え開発効率ではelmoが優っていた
elmoに勝率が99.99%くらいでないと互角ではないと思う

261:名無し名人
18/12/09 16:26:49.96 ueU4BKsP0.net
やたらelmoばかりが比較対象になるけど
そろそろaperypaqに9割のほうがよくないかね

262:名無し名人
18/12/09 17:26:21.38 y4kVLvKe0.net
>>242
定跡使って横歩除いたら勝率の悪い後手横歩を回避しないNNUEkai7のほうが強い可能性あるよね

263:名無し名人
18/12/09 17:32:09.26 C0iVFJRf0.net
今のレーティングの数字って横歩にかなり左右されてるからな実際

264:名無し名人
18/12/09 18:02:28.84 jCZVdmHO0.net
相掛かり系でもちょっと変わった手順前後で横歩取りに誘導できるときもあるから
後手の横歩を完全に避けるのはけっこうめんどいよ

265:名無し名人
18/12/09 18:44:43.86 Ua5OT1f/0.net
>>253
AlphaZeroが青野流や雁木を自分で見つけたのはいいんだが,
振り飛車は自己学習で対戦した上で,勝率悪くて不利だとして指してないのかね?
AlphaZeroに対して先手中飛車やノーマル振り飛車が通用しないのかは,ちと気になる。

266:名無し名人
18/12/09 20:03:01.76 ZUNl4RoE0.net
第29回世界コンピュータ将棋選手権の余興で、AlphaZero vs 優勝ソフトの三番勝負はどうだろうか
優勝ソフトの圧勝で決着すると思うが、実現したら面白そうだ

267:名無し名人
18/12/09 20:14:08.60 w43mE8ae0.net
読みが勝ってれば勝てるゲームで勝率が100%に近くならない時点で強さ論ずる意味があるのかは疑問だが
99.999%位いって当たり前じゃね?

268:名無し名人
18/12/09 20:46:32.00 i/ylB3Z40.net
>>266
本当に自信があったら正式に参加するだろうし
その逆だったら余興にも参加しないだろう

269:名無し名人
18/12/09 20:59:08.97 kRCLz1510.net
>>258
TPU使ってるのは画像分析/深層学習を前提としたシステムだからで
そうでない従来型のソフトがTPU使っても意味ないんじゃね

270:名無し名人
18/12/09 21:23:36.46 5GqsS6pe0.net
このスレをコピペて荒らしてるの誰なんだろな
無関係なスレを張ったりしてるところを見ると囲碁板をあらしてる奴と同一人物ぽいが

271:名無し名人
18/12/09 21:31:42.29 LWq2PjgR0.net
千田の番組月刊でやってほしいわ

272:名無し名人
18/12/09 22:57:16.42 ueU4BKsP0.net
消費電力でも負けるとなるとCPUの長所が分からなくなってくる。動作が軽い?

273:名無し名人
18/12/09 23:02:23.85 jPOVUoJ20.net
汎用性

274:名無し名人
18/12/09 23:08:38.89 C0iVFJRf0.net
個人が手軽に使うならやっぱりCPUがいいよね

275:名無し名人
18/12/09 23:12:15.69 jCZVdmHO0.net
アルファ碁のときも言われていたけど実際には何十手先も先の局面を読んでるわけじゃないのに
直観力が優れているからあたかも読んでいるかごとくの指し手を選ぶことがあるってことなんだよね?
実際に読んでいる局面の量はかなり少ないわけなんだから

276:名無し名人
18/12/09 23:19:24.30 C0iVFJRf0.net
各局面での感覚が随分違うんだろうなとは感じたね

277:名無し名人
18/12/09 23:21:09.73 ueU4BKsP0.net
マシンパワーに押されてほとんどふさがれてるけど例外に弱いという弱点もある、
とも言われてたと思う。

278:名無し名人
18/12/09 23:36:46.60 jCZVdmHO0.net
12番の▲7六歩ってついたの普通のソフトだとずっと先手不利な状態が続くね。。
千田解説にあった▲8三角とか▲4一角の超絶攻防手を知ってないと絶対に指せない手だからな。。
後手の持駒:歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂 ・v金v玉 ・v銀v桂v香|一
| ・ ・v銀 ・ ・ ・v金v角 ・|二
| ・ ・v歩v歩v歩v歩 ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・v歩 飛 ・|四
| ・v飛 ・ ・ ・ ・ ・ ・ ・|五
| 歩 ・ ・ ・ ・ ・ 歩 ・ ・|六
| ・ ・ 歩 歩 歩 歩 ・ ・ 歩|七
| ・ 角 金 玉 ・ ・ 銀 ・ ・|八
| 香 桂 銀 ・ ・ 金 ・ 桂 香|九
+---------------------------+
先手の持駒:歩二

279:名無し名人
18/12/09 23:44:45.61 ZUkyEdMt0.net
AlphaZeroの消費電力は TPU x4 だけじゃなくて
それにプラス44コアCPUの消費電力も加算だから
elmoよりTPU分消費電力は多いよ

280:名無し名人
18/12/09 23:54:55.49 jCZVdmHO0.net
この6万npsっては読みの深さはどれくらいなんだろ?かなり枝狩りするのか他のソフトと同じ程度の枝狩りなのか知りたい
>AlphaZeroはMCTSを使うことで、例えばチェスではチャンピオンのStockfishが1秒当たり
>約6000万のポジションを検索するのに対し、わずか6万しか検索せずに済むという。
URLリンク(www.itmedia.co.jp)

281:名無し名人
18/12/09 23:57:35.72 RHPzR7XO0.net
なんで電力あたりの強さなんて評価で見てるんだ。
AlphaZeroのアーキテクチャだと、TPUの方ばっかり回って
CPUはスカスカの稼働率かも知れないから、実際のところの使用電力なんか分からんよ。
TPUは流石に100%使い切るだろうけど、両方を100%使い切ることはなかなか難しい。

282:名無し名人
18/12/10 00:08:36.20 hFUBAjRt0.net
消費電力はともかく、TPU 1基が180T FLOPSで、4基だと720T FLOPS
かたや48コアPCでも3T FLOPSぐらいしかないので
単純計算だと240倍ぐらい演算能力が違うように思うけど…
(実際はそこまでの差ではない?)

283:名無し名人
18/12/10 00:10:03.44 RNs3wWE/0.net
重いけど正確な評価関数で少なく局面を読むAlphaZeroと、
軽いけど精度が粗い評価関数で大量に読むこれまでのソフト、という構図。
現状の既存の将棋ソフトの構造では局面の評価値の精度はAlphaZeroに圧倒的に及ばない。
どっちの方向に将来的を感じるかと言ったら、より高精度な評価関数を持ちうるAlphaZeroの方。
AlphaZeroの方は精度をあまり落とさず更に軽量化して方向もある(ニューラルネットの軽量化は既にある手法)だろうし。

284:名無し名人
18/12/10 00:28:23.54 fj2KDBcj0.net
NNUEはどちら側なんだか。KPPTは見かけなくなったな

285:名無し名人
18/12/10 07:06:34.91 1tPbwWt50.net
「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす
AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利した。
URLリンク(www.itmedia.co.jp)

286:名無し名人
18/12/10 07:37:49.96 IpzUBUx80.net
枝刈り評価値上位3つぐらいで探索したとして50手先の最強の手を予想する
場合は以下の局面数を評価しないといけないことになる。
3^50 = 717,897,987,691,853,000,000,000.0000
    = 717,897,987,691,853 x 1兆局面だぞ!
これはどんな最強マシンでも不可能に思える。
だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。
具体的には20手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか
にかかっているかと思う。
そこまでの数学力がないので調べることがないが現時点での
探索みると深さ37開始時に18,339,449,975(約183億)
探索みると深さ38開始時に27,868,971,435(約270億)
掛かってる。 (候補手1の場合で候補手3の場合はこの3倍かかる)
枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま100億ノードで
深さが1づつ増えるのなら希望も持てるが果たしてどうなのだろうか?

287:名無し名人
18/12/10 08:06:22.15 /jHlt7TAM.net
>>278
*kifu for windows に張り付け
後手の持駒:歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂 ・v金v玉 ・v銀v桂v香|一
| ・ ・v銀 ・ ・ ・v金v角 ・|二
| ・ ・v歩v歩v歩v歩 ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・v歩 飛 ・|四
| ・v飛 ・ ・ ・ ・ ・ ・ ・|五
| 歩 ・ ・ ・ ・ ・ 歩 ・ ・|六
| ・ ・ 歩 歩 歩 歩 ・ ・ 歩|七
| ・ 角 金 玉 ・ ・ 銀 ・ ・|八
| 香 桂 銀 ・ ・ 金 ・ 桂 香|九
+---------------------------+
先手の持駒:歩二
*▲8七歩だと塚田スペシャル風手順で後手有利
▲8七歩 △9五歩 ▲同 歩 △9六歩 ▲同 香 △8六歩
▲同 歩 △同 飛 ▲8七歩 △9六飛
*なので▲7六歩は必然だが▲8三角とか▲4一角の超絶攻防手があって後手ペースか
*でも▲8三角とか▲4一角はムズイな

288:名無し名人
18/12/10 15:47:49.24 2FX4cVdX0.net
287の図で考えることは…
・▲7六歩△8八角成る▲同銀△3三角▲8六歩△同飛▲8七歩
 こう進んだ時の持ち角の価値と歩の数の差 (と評価値)
・▲8七歩△9五歩▲同歩△9六桂のとこからの変化
 ▲3七桂△9五飛▲3四飛とか
 ▲7六歩△9五飛▲3四飛とか
 飛回りが消えてるから人間同士なら前者選びそう
 後者は乱戦というか盤面全体の戦いと言うかに持ち込んで
 端をぼかしてしまおうという高等戦術だね
 この辺を突き詰めて調べると評価値どうなるかだなあ

289:名無し名人
18/12/10 19:00:11.45 3EnB4Srs0.net
俺も >>286 と同じで数学の証明問題が苦手で教えて欲しいんだが
>>11
の駒落ち必勝手順の証明で
「裸王では、下手が偶数手目に78飛76歩75歩74歩73歩成72と73飛成33角成と指せば、17手目に上手玉がどこにあっても残り3手で詰みである。」
これは「20手以下で必勝」という必勝手順の証明だが、最善手の証明ではない
最善手と証明するには、18手以下の必勝手順は無いと証明しないといけないって事でOK?

290:名無し名人
18/12/10 19:17:02.18 bpthwlnoa.net
>>289
最善手の定義とは何?
詰将棋においては手数は大事だけど
指し将棋においては手数はスコアに影響しない

291:名無し名人
18/12/10 20:35:31.87 FbdnoEqa0.net
ロタって1500万ノード厨の典型的ガイシで
AlphaZeroの棋譜を妄信するw
お前の1500万とAlphaZeroや現実の対戦するノードと剥離があるのすら理解できてない
今まで1GBで計測してて疑問視されてたのに急に変える能無し
レーティングサイトはuuunが苦肉で決めた基準なのに個人の主観入ってる時点でクソ
河童もパクられるのムカツク発言してたのに野良パクって平岡に苦言される始末
AlphaZeroの棋譜でてイキッてるマウントガイジしかいない

292:名無し名人
18/12/10 20:38:48.75 ltbukS4bd.net
ガイジは黙っててね

293:名無し名人
18/12/10 20:40:44.12 fj2KDBcj0.net
AlphaZeroをageるにしてもsageるにしてもなんかこう毎回極端というか
それはそうと河童絞りDepth16が地味に気になる

294:名無し名人
18/12/10 20:49:22.32 xKEYmk3k0.net
あれだけ計算資源投入した棋譜なんてそうそう作れないから、それだけでかなり価値があると思うんだがな
ここのところ毎回評価関数ではトップのもの作ってるし河童絞りは優秀だよな

295:名無し名人
18/12/10 21:06:33.67 AmMY0JAk0.net
>>246
それは単に青野流先手の定跡の作り込みが甘かっただけでしょ?
PALや白ビールは後手で持っても相手がそこにハマれば勝てる定跡を持ってた

296:名無し名人
18/12/10 21:09:20.58 AmMY0JAk0.net
>>266
デイビッド・シルバーを読んで論文の報告会を開いてもらうのが一番ためになりそう
そこでWCSCの様子を見て面白いと思えばなにが進むかもね

297:名無し名人
18/12/10 21:26:26.89 AmMY0JAk0.net
ニューラルネットワークとMCTSの終盤については今やってるTCEC見てると、
176スレッドのストックフィッシュが早々に評価値ゼロのドローを示してる時に
LeelaChess0は自分に+6.0とかの圧勝の数値を出してたりするんだよなあ

298:名無し名人
18/12/10 21:27:28.57 xKEYmk3k0.net
elmoに76歩を強要してるせいでalphazeroの後手番での真の力がイマイチわからない感あるのが残念
普通にやらせるとわりと負けるんだったらalphazeroはかなり後手番苦手ってことになるがどうなんだろう
自分は絶対76歩突かないくせに相手には必ず突かせるってちょっとひどすぎるよな

299:名無し名人
18/12/10 21:29:40.80 hckZRqqo0.net
elmoが対戦相手としては弱すぎて何にも分からんというのが実際のところ
せめてAperypaqの棋譜が公開されていれば… それでも弱すぎるが…

300:名無し名人
18/12/10 21:39:27.10 rDgjdwyu0.net
>>295 記憶違いしてたみたい。強い相手だと調べたらこんな感じだった。たぬき戦は決勝で定跡ではめたけど終盤力で負けたってのがあった
第五回電王トーナメント決勝
たぬき戦に負け Yorkieに256手で勝ち(例の騒動になったの)
第28回世界コンピュータ将棋選手権
Apery戦に256手で引き分け

301:名無し名人
18/12/10 21:58:24.06 sUaVtcua0.net
>>291
1500万前後のノードならhash1GBでも十分じゃないの

302:名無し名人
18/12/10 22:00:39.36 h3SjVhy50.net
囲碁みたいに自己対戦の棋譜出してくれればいいんだけどな
双方入玉が多そうやがw

303:名無し名人
18/12/10 22:03:57.65 rDgjdwyu0.net
256手で引き分けになるっていうルールも学習してくれたら
終盤や入玉の指し口も変わったんじゃないかな

304:名無し名人
18/12/10 22:22:29.42 AmMY0JAk0.net
選手権に向けては320手ルールでの学習が必要なのか

305:名無し名人
18/12/10 22:29:23.61 SoCIqijC0.net
選手権もまた手数制限無しの切れ負けルールになるかもしれないし

306:名無し名人
18/12/10 23:01:24.30 fj2KDBcj0.net
囲碁だけど絶芸の80ブロックってAlphaZeroの倍だったのか・・・
次元が違い過ぎてどっちがどれだけ強いのかまったくわからん

307:名無し名人
18/12/10 23:53:28.16 BcmnP2fFd.net
floodgateも選手権のテストに使用されるなら320手ルールを導入した方がいい気がする

308:名無し名人
18/12/10 23:56:52.25 BcmnP2fFd.net
floodgateの棋譜が定跡作成や学習に使用されることがあるかもしれないし

309:名無し名人
18/12/11 00:04:49.08 vRlRV4md0.net
盤面の評価値には手数の概念はない。
256手や320手で引き分けになるというのは、千日手と同様に
探索部で判断すべきこと。

310:名無し名人
18/12/11 00:21:12.73 QfCgzKYDd.net
>>309
シボレーでresign varueを下げて学習させた評価関数は入玉が下手になっていた。
直接的な評価で手数は関係なくても、学習などで影響が出る可能性がある。

311:名無し名人
18/12/11 01:08:49.74 gKBqiWe90.net
>>299
というか、一本調子なのが。
AlphaZeroに勝てないな~と思ったら、
戦法変えて奇襲したりいろいろやってほしい。
まあ敗局自動学習しないと無理…
大昔のやねうらおもてなし定跡って
どうしたんだっけ。

312:名無し名人
18/12/11 01:12:46.47 65hrnhtF0.net
>>290
200手で裸王に必勝でも最善手なの?

313:名無し名人
18/12/11 01:34:46.81 fznZ1SoZ0.net
最善手という言葉だから1手しかないように感じるかもしれないけど、必勝の手は全て最善手。
将棋のルールで短手数で勝ったほうがいいとかいうものはないから、引き分け手数以内に必勝になる手があるならそれはどれも最善手。

314:名無し名人
18/12/11 01:45:20.79 fznZ1SoZ0.net
>>309
ルール上引き分け手数が設定されている場合は、盤面の評価値に手数は関係あるよ。
たとえば320手で引き分けルールで、323手目に詰みがある局面の評価値は引き分けの0であるべき。
そういう理由かどうかはわからないけど、AlphaZeroの入力には手数も入ってる。

315:名無し名人
18/12/11 10:08:29.04 ll4wlTIid.net
竹俣ベニー
‪ベニー、細川投げる。1イニングに3死球
URLリンク(youtu.be) @YouTubeより‬

316:名無し名人
18/12/11 10:29:09.67 3PzVQiBHa.net
リサリサあたりはなんか投げそうだなw

317:名無し名人
18/12/11 12:49:40.38 0icly+uU0.net
>以前にAMDが「世界コンピューター将棋選手権」をスポンサーしていたことを思い出した。2003~2006年ころの話である。
URLリンク(news.mynavi.jp)

318:名無し名人
18/12/11 13:01:49.41 YOj2tBVLM.net
>>317
終盤のGCP使ってるって話(事実はAWSのほうが多い)から
深層学習使ってるって話に飛躍して更にAlphaZeroへ飛ぶってすごい展開だな

319:名無し名人
18/12/11 13:27:04.93 it7nvYRWr.net
>>128
AMDワンメイク大会とかできないかなあ

320:名無し名人
18/12/11 13:45:34.58 fznZ1SoZ0.net
AMD大会になると、DL勢がつらい。
ほぼ100%Cuda使ってるのをOpenCL使わないといけなくなるからなぁ。

321:名無し名人
18/12/11 18:32:32.15 V/6SYYjw0.net
AlphaZero宣言勝ちができないかどうかは知らんが、そうだとすると
初手76歩を避けたりするのに影響が出ている可能性が

322:名無し名人
18/12/11 19:23:10.72 6pZ3DHUs0.net
googleがelmoに勝ったらしい
「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす
URLリンク(www.itmedia.co.jp)

323:名無し名人
18/12/11 19:38:37.38 StempaLl0.net
素人意見だが、アルファゼロは2つのネットワークを持ってるから、
NNUEも2つ持ったら、もっと深く読めるようになって、強くなるってことはないのか。

324:名無し名人
18/12/11 19:51:54.65 TTFpRN3a0.net
tanukiチームあたりは来年さらに洗練されたNNUEの評価関数を出してきそう。

325:名無し名人
18/12/11 19:52:57.49 WUcLZa9U0.net
>>322 短いので引用
DeepMindは、AlphaZeroの目的はチェスや将棋、囲碁に勝つことの先にあり、
様々な実世界の問題を解決するシステムを構築することにあると語った。
AlphaZeroは、単一のアルゴリズムが一連の設定で新しい知識を発見する方法を
学べることを示しており、まだ初期段階ではあるが「複雑な問題に対する斬新な
解決策を見いだす汎用的な学習システムを構築するというわれわれのミッション
に自信を与えてくれた」という。

326:名無し名人
18/12/11 19:56:26.48 9Fx+yJDF0.net
DM「とりあえず囲碁将棋チェスボコっとくか
将棋ファン「うおおおAlphaZeroすげえええええええ」
DM「さ、次いこう次」
将棋ファン「AlphaZero!!AlphaZero!!」
いいのかそれで

327:sage
18/12/11 20:07:52.79 L5ONqwlXa.net
AlphaZero凄いとは思うが、我々にとっては絵に描いた餅とかわらんからな

328:名無し名人
18/12/11 20:27:02.58 Z8k3msDq0.net
潰れた店のレビュー

329:名無し名人
18/12/11 20:35:39.56 17eNz2Pe0.net
NNUEはまだどのくらいのサイズが適しているのかすらわかってない段階
来年までにはかなりのバージョンアップがあるだろう

330:名無し名人
18/12/11 20:38:24.16 OKLQvPki0.net
馬鹿「AlphaZeroマンセー!!」
開発者「プロレスで喧嘩売ろう!!」
んっ!両方ガイジw

331:名無し名人
18/12/11 21:04:32.70 g16vn0pE0.net
んっ!自分では何もせずにただ文句を書き込むだけのガイジ連呼ニキ

332:名無し名人
18/12/11 21:06:50.53 vHk7fT8TM.net
なんだ基地外が立てたスレか
このスレもおしまいだな

333:名無し名人
18/12/11 21:09:58.70 g16vn0pE0.net
>>332
私は>>1ではありません。

334:名無し名人
18/12/11 21:11:39.27 vHk7fT8TM.net
>>333
すまん基地外がテンプレ貼ってるスレだった
立てた人にはお詫び申し上げます

335:名無し名人
18/12/11 21:13:32.49 g16vn0pE0.net
>>334
自分では何もせずにただ文句を書き込むだけの基地外連呼ニキw

336:名無し名人
18/12/11 21:17:47.44 vHk7fT8TM.net
>>335
お前みたいなのは消えろって言ってんだよ
消えなきゃ有能な人は戻ってこない
戻ってきたら俺も消えるぞ

337:名無し名人
18/12/11 21:19:33.67 g16vn0pE0.net
>>336
はよ消えろよw基地外連呼ニキw

338:名無し名人
18/12/11 21:25:53.75 YvNG4gnE0.net
Gravitonプロセッサ試しに行ったけど
AWSのa1インスタンスでやねうら王のotherのコンパイル通らんな
LSB64で怒られたけど今日は時間ないからパス

339:名無し名人
18/12/11 21:36:09.52 xPtHhNfR0.net
最強をうたうGoogle産の将棋AIに、プロ棋士として望むこと
遠山雄亮 | 将棋プロ棋士六段、モバイル編集長兼プロデューサー 12/11(火) 11:38
URLリンク(news.yahoo.co.jp)
遠山ってバカなのか?
グーグルがコンピュータ将棋やってるのはAIとクラウドの性能を図るためで、
でそれ以上でもそれ以下でもないだろ。

340:名無し名人
18/12/11 21:59:36.17 lTpJCKKN0.net
>>321
宣言勝ちできるようになった瞬間に投了してるからプログラムのバグか
CSA形式の棋譜出力ミスの可能性が高いかも
宣言勝ちは%TORYO
じゃなくて
%KACHIと記述しなきゃいけないけど
将棋所ですら対応してない

341:名無し名人
18/12/11 22:38:58.23 V/6SYYjw0.net
>>339
そこは分かってても望むところでしょ
まあcrazy shogiが代わりを担ってくれると期待してる
>>340
なるほど

342:名無し名人
18/12/11 22:39:59.07 9Fx+yJDF0.net
>2017年4・5月に行われた第2期電王戦で、Ponanzaが佐藤天彦名人に2連勝し、完全に人間を超えたとされた。
山ちゃん…

343:名無し名人
18/12/11 23:45:28.59 fznZ1SoZ0.net
>>323
ネットワークを2つ(実際には一つのネットワークで出力が2系統)なのは探索の都合があるからで、
探索方式の違うNNUEでは直接的な恩恵はたぶん得られない。
ただ、1つのネットワークで出力が2つっていうモデルは、違う種類の教師を2種類使って相乗効果で学習を加速するという面もあるので、
そういう面での恩恵は受けられるかもしれない。

344:名無し名人
18/12/12 00:07:37.13 6dDPs6m/0.net
王様が中央に出てくる奴、AlphaZeroより前に見たことあると思ったらあった
URLリンク(shogidb2.com)

345:名無し名人
18/12/12 04:37:26.88 +PRWbD950.net
性能アピールするならもっと難しいゲームはいくらでもあるんだよな
こんな単純なゲームで何をアピールできるのか?
ゲームで性能測るならRTAって素晴らしい文化があるわけだが

346:名無し名人
18/12/12 07:41:05.36 y9g+dgdr0.net
最強をうたうGoogle産の将棋AIに、プロ棋士として望むこと
URLリンク(news.yahoo.co.jp)
> 驚異的に高いスペックのPCを使っていることで読みの深さが尋常ではないこと。

347:名無し名人
18/12/12 07:51:51.68 N57t3qRfd.net
>>346
AlphaZeroはelmoに9割の勝率当時のまま来年5月の選手権に出場したら結晶進出は難しい
そのくらいにコンピュータ将棋は進歩してしている

348:名無し名人
18/12/12 08:09:31.28 t/pOkJrN0.net
チェスは棋譜がだいぶ前に公開されていたこともあって早くもAlphazero本がでるようだ
どのオープニングでも駒得より駒の配置を重視する画期的な戦術が多いらしい
URLリンク(www.newinchess.com)

349:名無し名人
18/12/12 10:22:59.42 OXuwemAy0.net
DMハサビスさん
チェス将棋のハンデ戦の必勝手順 & ロスアラモスチェス5五将棋の必勝手順の解析してください

350:名無し名人
18/12/12 10:33:51.37 eDUHrII70.net
必勝手順とか完全解析は手当たり次第だからディープラーニングとは対極になるだろう

351:名無し名人
18/12/12 10:38:12.33 t/pOkJrN0.net
詰みとか囲碁のシチョウがらみとか一直線の超手順がらみは苦手なはずなのに
ところどころ長手数先の詰みを読んでいるとしか思えない手を指せるのが神秘的

352:名無し名人
18/12/12 18:44:03.53 6dDPs6m/0.net
絶芸が稀にシチョウ関連で負けるとやっぱ本質的な弱点はあるんだなという気持ちになる
将棋にも長手数の詰みを見落としてるパターンが稀にあるかもな

353:名無し名人
18/12/12 19:41:17.78 B36K6tNl0.net
こんなのが出るね
PFN、独自設計の深層学習用プロセッサ「MN-Core」
~行列演算特化で半精度演算性能524TFLOPS
URLリンク(pc.watch.impress.co.jp)

354:名無し名人
18/12/12 20:03:33.15 FirUhphx0.net
>>291
久しぶりにのぞいたら・・・
誰か剥離にツッコめや
乖離だろうが!って

355:名無し名人
18/12/12 20:12:40.95 t/pOkJrN0.net
珍しいものを見た2800点に負けてた
### 先手: Hefeweizen , 後手: pressure_
### まで、後手の勝ちです。
Hefeweizen > 「投了」
Hefeweizen > ありがとうございました。
pressure_ > ありがとうございました
Hefeweizen > 72手目の△43銀(32)が素晴らしく、-1237点 ⇒ 2121点となりました♪

356:名無し名人
18/12/12 20:29:57.03 7avQFakD0.net
>>339
遠山さんの記事を読んでいても思うけど、他にもQhapaqの人の投了ツイートとか、
数日前まではalphazeroのことはみんな半信半疑だったのに
棋譜と論文公開後ここ数日でponanzaの名人への勝利や棋神としてのブランドが完全になくなってる感や
長年の電王戦が実はただの将棋ごっこだった感が将棋界や開発者たちから漂うのが何だか悲しい
今日の竜王戦の戦型を見てもそれをひしひしと感じた


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch