▲コンピュータ将棋スレッド145at BGAME
▲コンピュータ将棋スレッド145 - 暇つぶし2ch550:名無し名人
18/12/21 19:57:21.17 3b6DemZlF.net
>>547
事実無根の書き込みにより、専門の弁護士の方に相談しました。
前向きに対応してくれるそうです。
忘れた頃に連絡が行くと思うので覚悟していてください。

551:名無し名人
18/12/21 20:03:25.49 cxzdmz3Gd.net
>>546
タッグならhumanじゃないやん
susei_humanじゃなくてsuimon_softzashiにしとけよ

552:名無し名人
18/12/21 20:10:22.90 bs5fIfvb0.net
>>551
そんなこと言いだしたらSora_Ginkoとかは空銀子じゃないしw

553:名無し名人
18/12/21 20:12:34.17 8v/F3nbQd.net
>>547が19:08
>>550が19:57
光速の対応でワロタ

554:名無し名人
18/12/21 20:32:26.73 G9TMfjO90.net
>>548
ヨッシャル無冠もうヤケになってGoogle Deepmindから100万ドルもらって
AlphaZeroと対戦しても何の問題もないな
「将棋の神と角落ちで互角」と自称するヨッシャル無冠の、角落ちからの指し込み7番勝負
たぶん2枚落ちで互角だろう

555:名無し名人
18/12/21 21:06:47.44 TZyyiUC9a.net
羽生さんは無冠に転落したから、もう忙しいとかいう言い訳でソフトから逃げるのは通用しないよな

556:名無し名人
18/12/21 21:07:27.56 Ri28mUCu0.net
当時でも6億積めば対局出来たろ

557:名無し名人
18/12/21 21:13:52.96 GfAUDvr3d.net
>>545
ありがとう
shogidroidで使ってみたらめっちゃ便利でワロタ
これからウォーズの検討これでやったろ

558:名無し名人
18/12/21 21:20:06.69 G9TMfjO90.net
>>555
李セドルと同じように、遠慮なくDeepmindから100万ドルもらって対局できるな羽生ヨッシャル9段

559:名無し名人
18/12/21 21:29:25.18 vVjEK5El0.net
>>550
珍しワxチュチョイやなw
図星で発狂は構わないけど弁護士云々で相談してもなく虚偽なら脅迫にあたる判例も知らず?
フラゲ運営に要望だしとくから後で合おうな

560:名無し名人
18/12/21 21:29:43.30 vVjEK5El0.net
ワッチョイな

561:名無し名人
18/12/21 21:30:46.99 K3DLXdzD0.net
羽生さんは対局したくて仕方なかったのに一番おいしい時期に連盟がやらせてくれなかったからな

562:名無し名人
18/12/21 21:31:44.79 vVjEK5El0.net
これがスイモンの真実

563:名無し名人
18/12/21 21:40:37.77 EzoSzAmT0.net
将棋神やねうら王の登場でShogiGUIも勇退かと思ったら
むしろパワーアップして突き放しに来ているな
MyShogiはどちらかというと将棋所の代替に落ち着きそう

564:名無し名人
18/12/21 21:44:54.21 G9TMfjO90.net
平手でAIといい勝負できる時期に逃げ回っていた、AI評論家で「角落ちで将棋の神と互角」の羽生ヨッシャル無冠
2019年にAlphaZeroといい勝負できるのは2枚落ちか、飛車落ちか

565:名無し名人
18/12/21 22:23:39.97 TyP7lsxa0.net
理想を言えば携帯中継対応してほしいところ

566:名無し名人
18/12/22 00:32:55.92 Jh3Gy1Qe0.net
コンピュータが羽生九段よりも強いことは明白
AlphaZeroよりも強いソフトの存在を証明するほうに興味がある
第29回世界コンピュータ将棋選手権で、優勝ソフトvsElmoの百番勝負はどうだろうか
AlphaZeroはElmoに90勝2分7敗だった
持ち時間15秒なら50分で結果が出る
優勝ソフトが91勝以上であればAlphaZeroを超えたことになる
AlphaZeroに参加を依頼してもお断りだろから

567:名無し名人
18/12/22 00:39:42.69 NHGr5YFl0.net
>>566
短時間になればなるほど弱いelmo(WCSC27)に15秒切れ負け???
vs elmo(WCSC27)はRotaさんをはじめ有志で計測するでしょう
それでも一手1500万ノード計測だからAlphaZero論文のelmoには遠く及ばない

568:名無し名人
18/12/22 02:09:15.01 RUq3h7n80.net
どっちが強いか競いたいなら同じスペック用意しなきゃ分からないだろ
統一スペックはプログラムの能力だけ見れるからな
スペック制限しないならどんなソフトも一番強いと言える

569:名無し名人
18/12/22 02:26:10.55 2606UDt10.net
>>567の言う通りで
1500万ノード程度では何も分からないよ
エンジンだって長時間では純やねうら王の方が強い説もあるし
15億ノードでの対局でも同じレーティング差を維持できている保障はない

570:名無し名人
18/12/22 04:56:38.55 i0QOwEq00.net
>>568

三浦に勝ったときのGPS将棋が単体PCのelmoに負けそうなんですが、それは?

571:名無し名人
18/12/22 05:57:30.70 wS0zHVtp0.net
対elmoの成績は3時間対局で99%くらいなかった?

572:名無し名人
18/12/22 08:22:19.78 tQS2RREB0.net
>>570
負けそうどころか100回やって一発入るか

573:名無し名人
18/12/22 08:30:32.84 ov2Tn7sH0.net
Alphazero は対局中は大した計算資源いらないんでしょ?

574:名無し名人
18/12/22 08:55:42.26 wS0zHVtp0.net
仕上げるのに莫大な金と時間と設備が必要なのであって、動かすだけなら今のNNUE型評価関数
を20年前のPCで動かして人間を圧倒的にに上回ったって言えたんだな

575:名無し名人
18/12/22 12:37:32.69 ov2Tn7sH0.net
>>574
その路線は保木さんがやった訳じゃん。

576:名無し名人
18/12/22 13:06:49.83 IkX/2KE80.net
>>573
囲碁チェス将棋に限らずDeepLearning全般に言えることだな
DQNにBreakOut(ブロック崩し)をプレイさせると、ブロック裏にボールを送るテク発見には高性能PCでも長時間かかるが
テク発見後のプレイは低性能PCでもミリセカンドでブロック裏を狙う反応ができる

577:名無し名人
18/12/22 15:27:25.29 TI8s9akf0.net
>>573
DNNが対戦時(Inference)に大した計算資源いらないのはその通り
でもそれは、学習時(Training)に比べて少ないというだけで絶対値は大きいよ
AlphaZeroの論文でも、学習時にTPU1を5000個+TPU2を64個に対して、対戦時はTPU2を4個
一見少ないように見えるけど、TPU2の消費電力は100-200W(公表されていないのでメディアの推測値)、4個で400-800Wぐらい
対戦相手のElmoは32コア64スレッドなので、CPUだけで300-400Wぐらいかな

578:名無し名人
18/12/22 15:45:55.22 NHGr5YFl0.net
>>577
何度も書かれてるけど、対局時に使われたのはFirst-generation TPU(TDP 40W)x4

579:名無し名人
18/12/22 16:07:37.97 gAKolBma0.net
TPUって8個にしたり16個にしたりがCPUと比較して簡単そうだけど
CPUだとあれ以上のスペックを目指すには
クラスタ化で全く別の探索を書き直しになるから汎用性はAlphaZeroの方が上という印象

580:名無し名人
18/12/22 16:26:51.23 Cc1GP9kg0.net
TPUもGPUも行列演算でしか有効でないから、評価関数の速度以外に恩恵はないんだけど。
評価関数の計算以外のところはCPUでやってるわけだからAlphaZetoがTPUでそれ以外がCPU、みたいな感じではないぞ。
AlphaZeroもCPUの処理能力はたくさん必要としている。

581:名無し名人
18/12/22 17:31:16.89 PDOQS+gN0.net
大まかに学習とか評価関数関係はGPUで探索はCPUってことなのかな?

582:名無し名人
18/12/22 17:35:46.83 VHDNuuh70.net
LC0が2080 TiでTPU 2個分NPS出てるし
来年7nmのGPUが出れば1GPUでTCECの44コアと互角になるだろう
>>580
TCECのLC0は4コアCPU+ 2GPU
CPUの性能はほとんど必要ない

583:名無し名人
18/12/22 17:45:44.02 VHDNuuh70.net
TCEC
CPUマシン
デュアルE5-2699 v4
 110万円
GPUマシン
Quad Core i5 2600k
1 x 2080 ti + 1 x 2080
 30万円
tcec was like Bobby Fischer vs the Russians
名言

584:名無し名人
18/12/22 17:50:58.45 wS0zHVtp0.net
なんかもうcpuって将来的にはまったく必要なくなるん?

585:名無し名人
18/12/22 17:53:15.92 gZgijcxy0.net
>>584
いや、GPUだとかを制御してるのはCPUやで

586:名無し名人
18/12/22 18:02:39.58 apSR+rOa0.net
重たい専用タスクを処理するコプロにに、仕事を割り振るのがCPUの仕事やで。

587:名無し名人
18/12/22 18:04:55.93 wS0zHVtp0.net
>>585
そか。なんかすごくアホな質問してしまった気がするがサンキュ
CPUで将棋ソフトの開発をする利点がわからなくなってきてた

588:名無し名人
18/12/22 18:12:30.40 gZgijcxy0.net
>>587
CPUの利点は、そこそこのコストでそこそこ強いソフトができるってことじゃない?
プログラム自体もGPUベースに比べて簡単だし

589:名無し名人
18/12/22 18:20:20.22 IZhxa/ehr.net
>>587
凄く大雑把にいうと
GPUは行列演算しかできないが、それだけはCPUよりメチャクチャ速い
CPUは色んな計算ができる
行列演算は3Dグラフィックには必須の機能なので、GPUはこれに特化している

590:名無し名人
18/12/22 18:31:21.56 IkX/2KE80.net
>>584
ARMはその思想でライセンス売り込んでるから、そうなれば孫正義という朝鮮系日本人の大勝利
最低限のx86互換だけは必要ならintel Quark, Atom, VIA Nano, Zhaoxin ZXとかの勝利、孫正義死亡

591:名無し名人
18/12/22 18:47:33.35 IkX/2KE80.net
ちなみに日本はアメリカや韓国と違って二重国籍を認めない差別をしているので
帰化して日本人になる前は安本正義という通名の在日朝鮮人だった
帰化して日本人になった後に孫正義という本名を名乗るようになった

592:名無し名人
18/12/22 19:01:41.33 FNphES/C0.net
北海道に行ったことがないの、けっこう損している気がする。

593:名無し名人
18/12/22 19:36:39.15 cos5+O+W0.net
川崎は飽きた

594:名無し名人
18/12/22 22:55:34.82 Cc1GP9kg0.net
ものすごいざっくりいうと、GPUやTPUがやってるのは局面評価の計算のみで、それ以外の全てをCPUがやってる。
探索も時間制御も通信も合法手生成も評価関数に渡すデータの整形もみ~んなCPUがやってる。

595:名無し名人
18/12/22 23:08:55.72 E2SgL17+0.net
AlphaZeroじゃ手の生成はCPUではやらない
DLの出力として次に指す手がはいってたはず
そのために局面の評価がそもそも不要のはず

596:名無し名人
18/12/23 00:00:03.78 T6kWmct/0.net
>>595
マジか!w
そんな作りのソフトをもし本当に作ったならグーグルは天才だわ。
まぁ、もっぺんよ~く考えてみるといい。
AlphaZeroとよく似た作りのdlshogiやらのソースを参考にするといいよ。

597:名無し名人
18/12/23 00:26:38.67 k9kz6OAy0.net
ポリシーネットで出した着手確率から非合法手を除いて、確率を再計算してる
入力は局面と手番と手数のみ
山本はポリシーの出力をフィルタリングしなくても
ほとんど非合法手指さないとか言ってた
URLリンク(twitter.com)
(deleted an unsolicited ad)

598:名無し名人
18/12/23 00:36:02.03 T6kWmct/0.net
>>597
ふむふむ。
んじゃ、そのポリシーネットでの合法手生成を使ってどうやって探索するか考えてみるといいよ。

599:名無し名人
18/12/23 00:39:54.68 3RiXK4Si0.net
>>583
参加者のほとんどがCPUオンリーで、かつ募金に頼って運営しているわけだから
GPUに割く金なんて本来はないんだよなTCECは
しかし、金銭で揃えるとして、たとえばTeslaP100使えばその分パフォーマンス上がるのかというと

600:名無し名人
18/12/23 00:51:06.00 bReu9idj0.net
サンプルを与えられただけで千日手とか連続王手の千日手とか打ち歩詰め判定とかみたいな
けっこう複雑なCPU処理を正しく学習できるのかどうかわからんが、
人間ならルールブックを与えて30分もほっとけば駒を正しく動かせるようになるから
案外そういうものなのかもしれんな!

601:名無し名人
18/12/23 00:52:46.47 k9kz6OAy0.net
>>598
なんか話そらしてるけど
ポリシーから非合法手を省くフィルタリングを
CPUでやってると教えてあげただけだよ
合法手生成とか書き方からして分かってなかったみたいだから

602:名無し名人
18/12/23 01:23:06.28 T6kWmct/0.net
>>601
そうか。俺のほうが知識がないようで悪かった。
で、ついでに聞きたいんだが、非合法手を合法手としてネットワークが出力した場合はフィルタリングは容易だと思うんだけど、
合法手を非合法手として出力した、つまり合法手を見逃した場合はフィルタリングできるの?

603:名無し名人
18/12/23 01:23:56.03 EZ9mg/EF0.net
DLが勝手に学習するといっても論理的にはなんら保証されるわけでもない
わりと適当でいい分野でしか使えない

604:名無し名人
18/12/23 01:47:34.39 bkgV2y7y0.net
そりゃそうよ
精度を求めない分野の精度は高いというのがメリットだし
失敗を学習できるAIが生まれて初めてAIのスタートだから
まだ成功の学習しかできないからソフトに過ぎない

605:名無し名人
18/12/23 02:15:01.65 k9kz6OAy0.net
>>602
非合法手として出力とかはない
AZの方策は非合法手を含めた11259通りの動きの着手確率を出すだけ
その後、CPUで合法手かどうかの判定をしてる、合法手生成みたいなこと
Illegal moves are masked out by setting their probabilities to zero,
and re-normalising the probabilities over the remaining set of legal moves
あと、山本の発言あった
―ずっとやっていても、二歩が発生しないということですか?
山本氏:これは悪魔の証明系なので、完全にないとは言えないし、
ひょっとしたら指す場面もあるかもしれない。
あるいは、複雑な王手のときに、うっかり利きを見落とす可能性はあるかもしれないですけど、
まず基本的には大丈夫です。
もし実用段階にするのであればPonanzaでフィルタリングすればいいので、
そこは別に問題はないのですが、驚くべきことはルールを教えていないのに、
局面と手さえあげれば、ちゃんと合法手を返せるということですね。

606:名無し名人
18/12/23 02:23:44.64 T6kWmct/0.net
>>605
ポリシーで合法手を生成して、探索するってのはもし合法手の漏れがあったら致命的でない?
着手確率から非合法手をフィルターする処理って確率が0でない手を合法手チェックすることでない?
合法手の確率が0になっちゃった場合困らない?
つまり、探索を行う場合はポリシーネットのフィルタリングとは全く別に合法手を生成しなきゃいけなくない?

607:名無し名人
18/12/23 02:48:31.74 k9kz6OAy0.net
大半の合法手は確率ほぼ0%だよ
極端な局面はこんなんになる
URLリンク(image.slidesharecdn.com)
こういう局面だと他の手はバリューネットでほぼ評価しない

608:名無し名人
18/12/23 02:54:16.74 T6kWmct/0.net
>>607
ポリシーネットの精度が100%ならそれを信用して0%は0%としておいて、その合法手はなかったものとすればいいかもしれないけど、
現状のポリシーネットの精度がどのくらいかは知ってる?
0%の手が最善手ではないと言い切れる精度なの?

609:名無し名人
18/12/23 03:16:05.41 k9kz6OAy0.net
TCECボーナスでLC0がSF10と戦って
2勝7敗31分
これぐらいの精度
どんなものなのかは自分でインストールして見ればいい
着手の確率や探索結果が見れるから
最善かどうかは完全解析しなきゃわからない、どんな手法でも

610:名無し名人
18/12/23 04:41:59.21 itOHWryQ0.net
>>605
本当の中身を知らずにテキトーなことを言ってる感が強いな

611:名無し名人
18/12/23 06:19:29.30 bReu9idj0.net
まあ将棋はぶっちゃけ人間でも指せる程度のゲームなので
次の1手の確率評価(直感)を探索(検証)すればほとんど(確率的に)大過無いのかもしれん…
ディープラーニングの真価が問われるのは次の1手が何なのか誰にも正解が言えないようなゲームだと思う
例えば合法手から元の局面は簡単に計算できるが局面から合法手を求めるのがメチャ困難な落とし戸関数が導入されたみたいなゲーム

612:名無し名人
18/12/23 06:28:00.12 mWe6vloB0.net
ponanzaは指し手の生成にNNを使ってて、局面評価は従来の評価関数との混合だったっけ。

613:名無し名人
18/12/23 06:31:16.31 5GJobL1X0.net
>>607
このアピール文読んだときは最強のポナンザだと思ったんだけどなぁ

614:名無し名人
18/12/23 06:38:24.23 k9kz6OAy0.net
dlshogiは初手、26と76以外はほとんど探索しない、数千simだと、他の手最大で数十  
もっと探索すれば変わるけど
<1:0:1g1f move_count:36 win_rate:0.500917
<1:1:2g2f move_count:1356 win_rate:0.537419
<1:2:3g3f move_count:30 win_rate:0.476619
<1:3:4g4f move_count:34 win_rate:0.487415
<1:4:5g5f move_count:30 win_rate:0.480811
<1:5:6g6f move_count:34 win_rate:0.485571
<1:6:7g7f move_count:4625 win_rate:0.523136

dlshogiもポリシーの着手確率みれたら面白いんだけど

615:名無し名人
18/12/23 08:05:15.17 EkGKFKle0.net
「僕はゲームをすることが問題とは思わない」。神戸大学医学部付属病院のネット・ゲーム依存外来を、母親に連れられて訪れた高校1年の男子は言い切った。成績が落ちていると気付いているが、「ゲームが悪いのではなく勉強の仕方の問題だ」と反論した。
診断した神戸大精神医学分野の曽良一郎教授によると、こうした患者でも2人きりでじっくり話すと「このままでは進級できそうもなく不安だ」などと本音を語りだす。1時間ほどやりとりしながら、治療の糸口を探っていく。薬物依存などに似ているという。
WHOは今年6月に公表した新しい国際疾病分類ICD―11に、「ギャンブル障害」と並ぶ形でゲーム障害を入れた。
(1)ゲームをする時間や頻度を制御できない (2)ゲームが他の関心事や行動に優先する
(3)問題が起きても続ける
(4)個人、家庭、学業、仕事などに重大な支障が出ている―
の4つが12カ月以上続く場合にゲーム障害とみなす。
URLリンク(i.imgur.com)

616:名無し名人
18/12/23 08:08:38.65 EkGKFKle0.net
suimon
@floodgate_fan
【異世界への誘い】
将棋にはまだまだ見たことのないような世界がある。
0:33
1,720回再生済み
埋め込み動画
午後9:29 · 2018年11月21日 · Twitter for iPhone
URLリンク(twitter.com)
suimon
@floodgate_fan
強引にでも1歩を手にしてしまえば、▲2四歩で後手陣のバーケードは破ることができる。
画像
午前7:08 · 2018年11月22日 · Twitter for iPhone
URLリンク(twitter.com)
URLリンク(twitter.com) (5ch newer account)
(deleted an unsolicited ad)

617:名無し名人
18/12/23 08:17:50.94 qYY7zssL0.net
量子コンピューターが実現できて物凄い強いソフトができたらプロの名人でも
4枚落ちでも全然歯が立たない時代がくるんだろうな。

618:名無し名人
18/12/23 08:55:08.95 ezrGhSDO0.net
こねーよ

619:名無し名人
18/12/23 09:49:45.97 /4bQxDkU0.net
6枚落ちまでは必勝手順が判明する
4枚落ちも判明するかもな

620:名無し名人
18/12/23 13:47:50.53 1YLY5elD0.net
必勝手順って言うのはアマ10級がわけも分からずその通り指せばプロにいつでも勝てるレベルの手順
それは永遠に無理だろ

621:名無し名人
18/12/23 15:04:45.27 pSSP0zjPM.net
>>620
完全なフローチャートができてたら将棋知らなくても勝てるだろ

622:名無し名人
18/12/23 15:29:58.39 5GJobL1X0.net
>>620
「アマ10級がわけも分からずその通り指せばプロにいつでも勝てる」レベル程度が必勝手順というのであれば
平手でもソフトの通り指せばプロに勝てるだろ

623:名無し名人
18/12/23 16:57:43.52 o86RdGlN0.net
>>621
その巨大なフローシートを覚えるより棋力アップのほうがコスパ良い疑い

624:名無し名人
18/12/23 17:00:03.44 ui4s9+izF.net
四枚落ちの下手最善手(ここでは最善=最短としておく)が何かは到底わかならないとして、必勝手順に四筋位取りが含まれるかは興味あるな。
銀多伝ならはっきりいって必勝だけど、どれくらいホントの必勝なのか

625:名無し名人
18/12/23 17:46:05.16 mWe6vloB0.net
相掛かりが最善なのか?
80、160、320ブロックでさらに先のほうで
違った結論にたどり着かないのかとか。

626:名無し名人
18/12/23 18:47:24.37 afXZv7wWd.net
AndroidのShogiDroidで使ってみたら
「やねうら王 v4.83 NNUE + tanuki- wcsc28評価関数」は800kNPS
「やねうら王 v4.79 KPP_KKPT + Apery SDT5評価関数」は1500kNPS
NNUEはNPS低めって聞いたけどこんなに低くて大丈夫なの?

627:名無し名人
18/12/23 19:08:08.19 ERU5dIyl0.net
相掛かりが最善なのか?(理由: AlphaZeroが指してたから)
安直ぅー!

628:名無し名人
18/12/23 19:18:01.67 EZ9mg/EF0.net
>>626
simdを多用するnnueエンジンを使うとcpuが熱くなりやすい
スマホでなくてもサーマルスロットリングで速度低下することがあるという話があったと思うが

629:名無し名人
18/12/23 19:35:48.21 mWe6vloB0.net
疑問形なんだがな

630:名無し名人
18/12/23 20:28:00.99 U/sU8G040.net
>>626
NNUEはNN方式で言わばKPPPPPPPPPPP…なので、
KPPTより局面評価精度が遥かに高い。
局面評価数が半分程度で済むなら問題ない。

631:名無し名人
18/12/23 20:52:38.16 Ii12Exwk0.net
>>626,630
ノード数が半分だったらNNUEが圧倒的に負ける
NNUEはKPPPP・・・ではなく二駒関係のKP

632:名無し名人
18/12/23 21:18:03.56 yUUC8mkf0.net
どんなにNPSが高かろうが30手以上も読めば1~2手深いくらいの差でしか無いんだから精度重視の方が良いと思う

633:名無し名人
18/12/23 21:27:44.17 EZ9mg/EF0.net
ARMプロセッサだろうがnnueで5割強しか回らんということはないから
ちゃんと冷やしてたらの話だが

634:名無し名人
18/12/23 21:35:26.48 q7wa2T2p0.net
完全情報ゲーで
機械学習を初めて有効に働かせたのって将棋?
Bonanzaの前にチェスで前例あった?

635:名無し名人
18/12/23 21:40:36.84 U/sU8G040.net
>>631
いやいや、KPをNNに放り込んで相互関係見てるから。

636:名無し名人
18/12/23 21:42:37.02 2rZAVeJk0.net
KP×P×P×P×P×P×P×P……みたいな感じだもんな

637:名無し名人
18/12/23 21:45:35.10 aIxO96zB0.net
ノード数と探索深さをソフト毎でまとめた表なんかない?

638:名無し名人
18/12/23 21:52:12.39 Ix7MO41P0.net
>>634
リバーシでNN使われてなかったっけ
ボナのが先だった?

639:名無し名人
18/12/23 22:01:34.40 5GJobL1X0.net
>>637
局面によって違う

640:名無し名人
18/12/23 22:03:05.97 aIxO96zB0.net
局面によって違うのなんて誰でも分かる
平均的なノード数と探索深さの関係という意味だが

641:名無し名人
18/12/23 22:05:17.51 5GJobL1X0.net
>>640
平均の定義とは

642:名無し名人
18/12/23 22:12:20.33 aIxO96zB0.net
的って書いてるだろ
厳密な意味ではない

643:名無し名人
18/12/23 22:32:28.59 bReu9idj0.net
>>630
精度が高いというか…
ありがちな展開について極めて要領良く振る舞えるだけなのでは…
(それを出し抜くのが簡単とは言っていない

644:名無し名人
18/12/23 23:43:29.67 ggoPSCw20.net
>>634
チェッカーとかリバーシとか最初から機械学習で作られてる
70年代とか80年代とかから

645:名無し名人
18/12/24 09:41:38.75 YJL2Zlhh0.net
今年はやねさんからクリスマスプレゼントとかお年玉とか無いのかなー

646:名無し名人
18/12/24 09:59:00.25 3qx+2P7d0.net
スレ違いですが Chessエンジンに興味がある方へ
現在ランク1位はstockfish10ですが最近
stockfishファミリーの中から新星が現れました
ロシアの女子フィギュアスケート界の如く突然
最強と思われるエンジンICCF.PrO.191218が
現れました stockfishファミリーのトップクラスを
集めて総当たりで繰り返し対決させて確認しました
ダウンロードは下記から
URLリンク(github.com)

647:名無し名人
18/12/24 11:08:59.99 YJL2Zlhh0.net
>>646
お?
仮にこれが探索のレベルアップならコードを参考にすれば将棋エンジンの探索部にもまだ伸びがあるか?

648:名無し名人
18/12/24 11:15:53.65 KaekC4tVM.net
forkして強くするのは大体はドメイン情報ぶち込んで強くすることが多いような

649:名無し名人
18/12/24 11:19:14.45 VcDFtTti0.net
SugaRってのとは全然別物だから名前変えてるのか?

650:名無し名人
18/12/24 11:22:24.50 iNc3a2980.net
>>646
紀平に負けたロシアかw

651:名無し名人
18/12/24 11:39:00.42 XW60xY+/0.net
>>646
興味ないことはないんだが、ただ強いですっていわれてもなんだかなって感じだ。
何故強くなったのか説明できるようになってから出直してくれ。

652:名無し名人
18/12/24 12:08:47.19 wPVTT9Py0.net
(ノ∀`)アチャー

653:名無し名人
18/12/24 12:15:36.45 VcDFtTti0.net
>>524
72.csa の26手目後手alphazeroの次の△4四歩は今の最上位ソフトでは出てこないけど
技巧やgpsfishだと第一候補になる。おもしろい
後手の持駒:角 歩 
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・v玉 ・ ・v桂v香|一
| ・v飛 ・ ・v金 ・v金v銀 ・|二
| ・ ・v歩 ・v歩v歩 ・ ・v歩|三
| ・v歩 ・v歩 ・ ・v歩 飛 ・|四
|v歩 ・ ・ ・ ・ 桂 ・ ・ ・|五
| ・ ・ 歩 ・ ・ ・ 歩 ・ ・|六
| 歩 歩 銀 歩 歩 歩 ・ ・ 歩|七
| ・ ・ ・ 玉 ・ ・ 銀 ・ ・|八
| 香 桂 ・ 金 ・ 金 ・ ・ 香|九
+---------------------------+
先手の持駒:角 歩 
後手番

654:名無し名人
18/12/24 12:55:39.81 VcDFtTti0.net
>>653
この将棋70手あたりまでずっと先手の評価値が500以上で快調に攻めてるようだけど
端攻めされた当たりから急落するな。厳密には無理攻め気味だったってことかな。。

655:名無し名人
18/12/24 15:00:15.79 XUpUjL5Mr.net
>>653
技巧とGPSは人間ぽい指し手を意図的に取り入れてる。

656:名無し名人
18/12/24 15:22:53.52 iasPJ3GM0.net
>>653

うちの1年前のやねうら王でも△4四歩から読み始めるけど?

657:名無し名人
18/12/24 15:39:11.44 wPVTT9Py0.net
△4四歩から読まないソフトは差し手生成にバグでもあるんじゃないの

658:名無し名人
18/12/24 15:44:32.28 YJL2Zlhh0.net
>>653
むしろ44歩と競ってる手が見当たらないんだが

659:名無し名人
18/12/24 18:38:56.91 mxhJYuG60.net
サンタさんにNNUEkai10をお願いした

660:名無し名人
18/12/24 18:46:09.82 M0BpzZ5i0.net
>>653
魔改造技巧は△4四歩のみを読む
kai7 は△4四歩~△5五角~△2三銀となって△2三銀確定
Apery28 評価関数をやねうら王で動かすと
△4四歩、△5五角、△2三銀を読み出して△2三銀を切捨てて
残り2つを比較しつづける感じ

661:名無し名人
18/12/24 19:08:36.46 wLIkGzrb0.net
>>653
この棋譜、QQR(4.82)、深さ20で棋譜解析したら、評価値1600から逆転負けしてるの興味深いね。
後で、ゆっくりとみてみるとするわ。

662:名無し名人
18/12/24 19:17:33.09 VcDFtTti0.net
74手目の△9八歩をなんで取らないのかと思ったら取ると△9六香と走る手が詰めろになって
後手勝ち筋になるんだな。角換わりの序盤に端に二手かけて緩手に見えたけど結果的に端攻めに生きるってのが
すごいわ

663:名無し名人
18/12/24 19:54:18.91 iNc3a2980.net
>>662
結果論すぎてワロタw

664:名無し名人
18/12/24 20:01:08.85 mxhJYuG60.net
kai7はR4300クラスの強さの割に、という表現が適切かどうかわからんが、
クセが強くて人間の感覚に近いイメージ

665:名無し名人
18/12/24 20:37:10.00 0kWvxSCQ0.net
orqhaの人はどうして最新版をリリースしないのか理解できない。
illqhaの人は最近音沙汰なしなのが気になる。強くならないので
やめちゃったのかな?
Kaiの人はさらに精進してorqhaの人を打ち負かして欲しい。

666:名無し名人
18/12/24 21:13:32.97 JaNdgQ/Dr.net
頭痛い
早く仕事から帰りたい

667:名無し名人
18/12/24 21:32:22.72 YJL2Zlhh0.net
>>665
開発者は大会本番で勝つためになんでもかんでも公開するわけにいかないでしょう
illqhaの人は全体のレートを上げるのに十分な役割を果たして満足したとかそんなとこかな?
kaiの人は緩やかながら定期的に公開してくれてとてもうれしい
でもillqhaの最新版はやっぱり期待してしまう

668:名無し名人
18/12/24 21:47:46.28 DfaD4N0p0.net
個人的には試行錯誤による成果を定常的に求めることは残酷だと思う
特に強くなるかもしれない仮説のストックが少ないと思われる学術畑でもない個人の開発者にとって
やねうらのおっさんは自称天才だからセーフ

669:名無し名人
18/12/24 21:53:48.35 3RBZLLcS0.net
その時の最強を超えたものじゃないとリリースしてはいけないという暗黙の文化が良くない

670:名無し名人
18/12/24 21:56:11.00 YJL2Zlhh0.net
>>670
叩く輩がいるからなー

671:名無し名人
18/12/25 00:13:14.33 YTfTDYk70.net
自分の前作を超えたとか
強さはほとんど同じでも棋風が大きく変わったとかは
発表して評価もらうほうが良いように思うんだけど
出す方にしたらそうはいかないものなのかねえ

672:名無し名人
18/12/25 00:35:20.19 7L5qZ90G0.net
illqha3が自分が思ってたより良い出来じゃなくて恥ずかしい思いをしたから余計だろうね

673:名無し名人
18/12/25 00:37:19.47 7L5qZ90G0.net
違うわ、illqha2.1か

674:名無し名人
18/12/25 09:57:26.23 X84YEnUDp.net
誰かクラウドファンディングで評価関数作らないかな
めっちゃ強いのができるなら金出してもいいのに

675:名無し名人
18/12/25 10:52:27.00 fd4f8UVw0.net
金集めて各種リソース確保してって
頑張れば出来るんだろうけど
それをやって後からフリーのモノに追い抜かれると
ツラいだろうな~
文句言う出資者は出そうだ
出資者が納得しててもアンチが居たらネタにするだろうし
難しいだろうね

676:名無し名人
18/12/25 11:18:13.78 AlQbp0V20.net
一口3000円でも数百人集まればかなりの質の教師が作れそうな気はするからいいかもね
depth18で1億くらい教師作れたら結構強くななりそうな気するけど

677:名無し名人
18/12/25 11:23:59.32 QnSeZA4GM.net
金集めたはいいけど設定間違えて回してたら
金返せ詐欺野郎!訴訟!刑事告訴!ってなるの怖すぎ

678:名無し名人
18/12/25 11:30:55.11 0iUvVT/D0.net
floodgateをめぐる喧嘩でこうなるぐらいだからなw
>>550
>>559

679:名無し名人
18/12/25 11:32:41.53 /7hSGgpLr.net
>>677
MorphyOneかな?

680:名無し名人
18/12/25 11:56:07.29 PmNusvk5a.net
そういうひとって、クラウドファンディングで金返せはおかしいやろって気づかないんかな

681:名無し名人
18/12/25 12:40:38.91 z6aqZDOd0.net
契約にもよるが民事訴訟はともかく刑事告訴は無理じゃね

682:名無し名人
18/12/25 14:03:49.29 WubazekK0.net
山本みたいにスポンサー探した方が良いだろうな、強いソフト作れる人は

683:名無し名人
18/12/25 14:05:43.15 J14+31EUd.net
しかしAlpha 先生って
何から何までかっこよかったなあ。

684:名無し名人
18/12/25 14:46:52.66 FYICJzo+a.net
DEC最後の輝き

685:名無し名人
18/12/25 16:40:07.06 1P6FU6y80.net
Macで動くこのエンジン将棋盤ってやつどうなん?
URLリンク(kisagai.com)
結構お高いけど最低限の機能はありそうに見える

686:名無し名人
18/12/25 18:07:49.01 X1IjwciR0.net
>>623
6x6オセロと同じだな
後手の必勝手順は判明済みで、PCなら簡単に手順再現できるが人の脳では暗記し切れない
なので互先で遇数回やれば今でも人vs人のゲームとしては成立する
その場合、先手番でいかにドローに持ち込むかの勝負になる

687:名無し名人
18/12/25 18:07:57.12 AlQbp0V20.net
検討ガチ勢の人達は検討時にどのくらいのノード数読ませてるものなのか知りたいわ
やっぱりかなり深くまで読ませるべきなの?

688:名無し名人
18/12/25 18:22:51.56 2D7CPebV0.net
79.csa の99手目elmoの▲7一銀成は大悪手
▲2四歩で勝てそうだったのに。。
後手:AlphaZero
後手の持駒:角 金 銀 桂 香 歩二 
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・v飛 ・ ・ ・v歩v桂v香|一
| ・ ・ ・ 銀 ・ 金 ・v玉 ・|二
| ・ ・ ・ ・ ・v歩 ・ ・v歩|三
| ・ ・ ・ ・ ・ ・v桂v歩 ・|四
| ・v桂 ・ ・ ・v銀 ・ 歩 ・|五
| 歩 ・ ・ 銀 ・ 歩 ・ ・ 飛|六
| 馬 歩 歩 歩 歩 ・ ・ ・ 歩|七
| ・ 金 ・ ・ ・ ・vと ・ ・|八
| ・ 玉 ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手:elmo
先手の持駒:金 歩三 

689:名無し名人
18/12/25 20:28:17.30 vp3i2Glz0.net
>>688
▲7一銀成を読んでいるときは104手目の△5三角が詰めろになるのが読めていなかったということかな

690:名無し名人
18/12/25 20:41:41.57 fd4f8UVw0.net
自分の環境だとkai7でも飛取る手から読むね
人間なら詰めよで入ることと
△9七桂不成は▲同金で桂持てば3五に足すのが厳しくなることから
初段あるか無いかくらいでも2四取込みから読むはずだろうね
こういう人間なら一目というのをソフトが逃して負けるのは珍しい

691:名無し名人
18/12/25 21:07:15.31 Y0Eawlhy0.net
>>688
>>690
うちのkai7-ditto4Sだと始めから24歩が最善手になって71銀成は悪手だしソフトの指し手に問題はかなった
URLリンク(iup.2ch-library.com)

692:名無し名人
18/12/25 21:24:51.45 iqi9oGum0.net
将棋ソフトで詰めろになる手を検索できるソフトとかありますか?
現局面が詰めろかどうかが分かるソフトならあるみたいなんですが。

693:名無し名人
18/12/25 21:25:37.40 Y0Eawlhy0.net
こっちは検討用ではなく対局用で候補手1の設定からだとやっぱり最初は飛取る手から読んだ、1億8千万ノードあたり
から24歩を読んだ
URLリンク(iup.2ch-library.com)

694:名無し名人
18/12/25 21:41:23.67 Y0Eawlhy0.net
gikou1だと対局用で候補手1の設定で最初から24歩を読むので最新ソフトより優れている部分もあるってことなのか

695:名無し名人
18/12/25 21:49:36.44 z6aqZDOd0.net
DLならなおさらだが特定のケースに対する挙動を論じるのは全くナンセンス
統計的に有益なものがもたらされるかどうかが重要なのだから

696:名無し名人
18/12/25 22:54:36.21 3xQa+LOva.net
>>695
そう思うのは勝手だが具体的な敗因を確認するのは無駄ではないぞ。

697:名無し名人
18/12/25 23:37:34.05 OvU1VJ4R0.net
>>692
簡単に受かる詰めろ調べても意味ないし何か意味あるの?

698:名無し名人
18/12/26 00:53:33.80 HztYDiUD0.net
>>695
自動運転でAIが起こした特定の事故を「人なら防げた」と論じるのと同じ愚かさだな
統計トータルで人(クレーン車で小学生ミンチ作ったヒキツケ発作てんかん患者や高速逆走ボケ老人を含めて)よりAIの運転が安全なら十分OK

699:名無し名人
18/12/26 05:37:27.45 KQw+fQMk0.net
千田解説でも取り上げてた88.csa
80手過ぎから評価値的に見るとAlphaZero悪手指した!って感じになってるけど
実は90手目の△4九角に対して▲6八玉とすると(30手以上の長手数の)トン死することを
見落としてた誤評価の模様。Alphazeroがどう評価していたのか知りたいな。。

700:名無し名人
18/12/26 06:11:04.91 xukDBWXua.net
振り飛車最強の戦法が三間飛車藤井システムだと判明

世界コンピュータ将棋選手権で8位に入賞した唯一のソフト振り飛車党HoneyWaffleは三間飛車や初手78飛戦法を多用
URLリンク(www.thirdfilerook.jp)
どの戦型が一番勝ちやすいのかをソフト同士で自己対局させた結果振り飛車1位は石田流に
URLリンク(blog.livedoor.jp)
このサイトでは藤井システムが一番
URLリンク(qhapaq.hatenablog.com)
これらを踏まえた結果振り飛車最強戦法は三間飛車藤井システムという結論に達した

701:名無し名人
18/12/26 08:13:40.08 uMjkgH6b0.net
このスレやべぇw
コンピュータ将棋スレにもfloodgateでのソフト指しは問題ないって言ってた奴がいたけどまさか同一人物じゃないよな?w
[徹底議論] 振り飛車って指さなくてもよくね? 3
スレリンク(bgame板)
768 名無し名人[] 2018/12/26(水) 00:13:21.83 ID:
>>758
このスレの目的は振り飛車は必要無いという検証をするためにある
ソフトで指すことに問題はない。
むしろ居飛車党ソフトと振り飛車党ソフトで検証するのが理想

702:名無し名人
18/12/26 08:32:20.26 BahQiip50.net
TCEC14の1部リーグは8回戦総当たり28回戦を終了して
LeelaChess0が13勝2敗13分の19.5ポイントで優勝(1敗は勝ちゲームをクラッシュで落としたもの)
2位はKomodoMCTSで8勝1敗19分の17.5ポイント
この2エンジンがプレミアリーグへ昇格
NNエンジンと従来型最強評価関数のMCTS版がプレミアリーグでどれだけやれるか、
スーパーファイナル進出争いに入れるかは興味深い

703:名無し名人
18/12/26 09:12:43.22 x785m63k0.net
>>697
2018-12-24 叡王戦渡辺大夢 五段 vs. 佐藤天彦 名人 第4期叡王戦本戦
URLリンク(shogidb2.com)
101手目の86歩が渡辺五段の勝負手で詰めろ逃れの詰めろになっていたんですが
佐藤天彦名人も解説の渡辺棋王も気が付いてなかった手なんです
コンピュータなら楽に気が付くでしょうが人間だと非常に気が付きにくい詰めろだったようで
頓死となり大逆転になりました。
評価値の好手悪手じゃない勝負手を探す目安にならないかなと思って
詰めろを検索するソフトがないかなと

704:名無し名人
18/12/26 09:54:18.73 gZt/LAck0.net
>>703
言わんとするのはわからない訳ではないが、ここの86歩はうちのソフトでも最善になる

705:名無し名人
18/12/26 10:49:57.05 KQw+fQMk0.net
90.csaの変化のこの局面▲7七玉だと15手詰の頓死なんだけど気づくのに結構時間がかかるのが不思議
今のソフトだと一瞬で気づく手数のはずだけど
後手の持駒:角 金
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ と ・v香|一
| ・ ・ ・ ・ ・ ・v金 ・ ・|二
| ・ ・ 銀 ・ ・v歩v玉v歩 ・|三
|v歩 ・v歩v歩 龍 ・ 桂 ・ ・|四
| ・ ・v桂 ・ ・ ・v歩 ・v歩|五
| 歩 歩 歩 歩 銀 歩 ・ ・ ・|六
| ・ 玉 ・ ・ 歩 ・ ・ ・ ・|七
| ・ 銀 金 金 ・v圭 ・ ・ ・|八
| 香v龍 ・ ・ ・v角 ・ ・ 香|九
+---------------------------+
先手の持駒:銀 桂 歩四

706:名無し名人
18/12/26 11:35:17.87 gZt/LAck0.net
>>705
はあ。確かに。
藤井くんだったら一目で詰ませるのだろうけど

707:名無し名人
18/12/26 11:48:09.17 X1eJCkdG0.net
>>705
詰め手順中、初形の7七玉の局面と比較すると、
8手目の6七同玉の局面では先手に角金金桂を渡しているので、
Stockfish特有の、Futility PruningとかRazoringとかProbcutとか、
マージン付きの評価値ベースの枝刈りで途中の駒損する王手がカットされて読めていないのではないかと。
同じようなパターンとして、電王戦FINALでもSelene対永瀬戦で後手が自玉が詰まない程度に大量に駒損して先手玉を必死に持っていく筋があったけど、
プロは一瞬で読めて解説してたのにほとんどのソフトは読めてなかったよね。

708:名無し名人
18/12/26 11:50:05.28 la3yAvNZM.net
>>705
kaiシリーズは「詰む詰まない」に多少弱いみたいだ
優先順位(直感)が悪いから時間かけないと発見できない
1スレ5秒で技巧とやったら勝勢の局面で技巧が詰めよかけたらで気づかず頓死食らってた
illqhaやorqhaで検討したらkaiより詰みを察知するのはやや早い
感想レベルですまん

709:名無し名人
18/12/26 11:50:50.28 gZt/LAck0.net
>>705
試しに25歩を置いてみたら、最初のうちは▲7七玉を読んでいたけどじきに頓死に気付いて▲9七玉になった

710:名無し名人
18/12/26 11:55:54.48 KQw+fQMk0.net
>>707
なるほど。そういえば昔から捨駒の多い詰み筋は手数短くても見落とすことがあった

711:名無し名人
18/12/26 12:00:03.65 gZt/LAck0.net
とすると、複雑な局面を保ちながら駒捨ての多い詰めろをかけると、人間もコンピュータに勝てるチャンスがあるということか

712:名無し名人
18/12/26 12:17:49.69 pqTB+KVE0.net
特定の局面だけで優劣を語るのはナンセンスでも、そういう局面を学習させて
より高みを目指すことはできるだろう。敵対的ネットワークみたいな。
ネットワークの表現力が飽和してない限りは

713:名無し名人
18/12/26 15:49:12.15 VO8yysHga.net
DeepLearning/機械学習を始めると必ずいるカス - BizDeep URLリンク(biz-and-deep.hatenablog.com)

714:名無し名人
18/12/26 16:01:12.68 LRNWp/j40.net
>>711
『複雑な局面を保ちながら』の部分が人間には無理

715:名無し名人
18/12/26 16:11:04.32 oYPkVH5U0.net
>>713
こういう記事を書く人ってたぶん疲労が溜まりすぎてる気がする。
記事を書くより休暇をとる努力をしたほうがいい。
まぁ、内容はわかる気はするけど。

716:名無し名人
18/12/26 16:22:18.06 Eu2u8+VLM.net
>>715
〇〇アンチパターンと読み替えれば為になる可能性も

717:名無し名人
18/12/26 18:12:20.61 3OvXE0Jjr.net
単なる愚痴っぽいので特に感想もない

718:名無し名人
18/12/26 18:30:23.62 n9KzSafW0.net
次のWCSCはやっぱtanuki-チームが優勝するのかな

719:名無し名人
18/12/26 18:59:21.26 oYPkVH5U0.net
タヌキチームかどうかはわからんけど、まぁやねうら王チルドレンだろうな。
やねさんの目論見どおり、公開してから使う人、開発に参加する人が激増して結果的に他を大きく引き離す開発力になってるから。
やはり天才なんだな。

720:名無し名人
18/12/26 20:01:11.18 Xi/F63Fkd.net
きむりん氏が何やら怒ってるな
メカ女子チームが解体してやねうらに吸収合併されるらしい

721:名無し名人
18/12/26 20:04:29.86 TJef+Zuu0.net
衰退した業界で吸収合併はよくある話だが
一強になって多様性がなくなるのは嫌だね

722:名無し名人
18/12/26 20:06:26.99 Xi/F63Fkd.net
強くないチームは一見さんお断りみたいになって、常連チームだけの争いになり、業界が縮小していく感じかな
ただでさえ、もうほとんどの人間には将棋の内容も理解できない領域だし

723:名無し名人
18/12/26 20:12:10.91 oYPkVH5U0.net
競技としてやってる以上、多様性がなくなっていくのは仕方ない気がする。
どんな競技でもだいたい同じような戦法なり技術なりを使うってのが普通だし。
あと、たまに全然違うことやって優勝とかするとルール変えられてできなくするしねw
バサロ泳法とか。

724:名無し名人
18/12/26 20:25:41.02 tnN58GeF0.net
>>720
URLリンク(twitter.com)
「売却」とか「被害届」とか、勘違いも甚だしいな。
kimrin氏のなかでは一緒に参加してくれていたチームメンバーは自分の資産であり、
その資産を盗まれたという考えなのかな?
(deleted an unsolicited ad)

725:名無し名人
18/12/26 20:25:58.83 mITmSHgl0.net
やねりんの話でよくわからないんだけど、竹部さんがメカ女子抜けてやねうらチームに入れば済む話な気もするのにどこからチームの吸収合併という話になったのか

726:名無し名人
18/12/26 20:43:53.75 oYPkVH5U0.net
>>724
これ竹部さんが悪い気がするなぁ。
引導を渡すんだから、もう少しスマートな言い回しで言ってあげればいいのにね。
まぁ、それができないのが竹部さんという人間なのかもしれないけど。

727:名無し名人
18/12/26 20:57:29.90 Xi/F63Fkd.net
やねさんが引き抜こうとしたのか、竹部さんがよりネームバリューのある方に移りたくなったのか

728:名無し名人
18/12/26 22:18:29.16 C76Sl0nb0.net
何ら公益性もないのに内輪のやりとりを公開してる時点で駄目だろ

729:名無し名人
18/12/26 23:16:24.52 YL3pjiQ10.net
竹部に何の思い入れもないけど、
このキムって頭がおかしいんじゃね?
って思う

730:名無し名人
18/12/26 23:45:30.56 WkTxSJ3g0.net
将棋性の違いからの脱退

731:名無し名人
18/12/26 23:46:00.21 8q6Mzv/q0.net
きむりん(小六女子)
@kimrin
26分26分前
その他
減薬したのがまずかったか。なんか怒りっぽい。
URLリンク(twitter.com)
あっ……
(deleted an unsolicited ad)

732:名無し名人
18/12/27 00:02:52.98 kxSYLSBQF.net
【朗報】俺氏、またしてもスマホNNUEに勝利

733:名無し名人
18/12/27 00:02:59.87 t3EOXUg90.net
IT関係は精神病んでる人多い
死ぬまで勉強しつづけないといけないし、棋士みたいに尊敬されるわけでもないし、引きこもりっぱなしな人多いから

734:名無し名人
18/12/27 00:26:52.94 H8bMbwZa0.net
R4800から今度は飛車先の歩をまったく突かなくなる

735:名無し名人
18/12/27 01:21:43.56 OCgovMnwM.net
>>719
使う人は激増したけど
開発に参加する人は激増というほどなのか疑問だぞ
タヌキチームとmizar氏くらいじゃないか?

736:名無し名人
18/12/27 01:46:08.06 GXnI9A21a.net
>>735
そう見える人がいるのかぁ
これは発見だな
たまには見に来るもんだ
俺の視点だとelmoが大きいなぁ
あの式のお陰で学習ルーチンが一新されてシボレーが生まれた
そしてPonanzaやNDF含め多くのものが過去の遺物になってしまった
やねさんがオーパーツとまで言うわけだ
あとブログ上のやりとりとかが結構やねうら王の貢献になってると思うけど

737:名無し名人
18/12/27 03:32:03.12 c8JBcTPF0.net
みんなきむりんに優しくしてあげてほしい

きむりん(小六女子)@kimrin
この前会社行く時に坂を上っていったら上から降りてきた女の子二人組が「沼じゃね?www」って言ってるのを聞いてしまい僕は私は俺は。
6:55 - 2015年10月24日

738:名無し名人
18/12/27 05:04:18.95 Mlfh6kqba.net
助け合えよ

739:名無し名人
18/12/27 05:42:09.72 xK+hEzPd0.net
やり取り読んだけど双方アレですね

740:名無し名人
18/12/27 08:28:01.72 3aKTOEJF0.net
結論;賞金が出るとわかった瞬間に選手権にしゃしゃり出てくるやねが悪い(冗談
メカ活だけはいまいちよくわかってないけど、別に竹部がどこに行こうと何も問題ないのに
なぜかメカ女子将棋の看板がどうとか全然関係ない話になってるのがわからない
別にやねうら王withメカ女子将棋でエントリーするとかいう話でもないだろうし
そもそもそんなエントリーするほうがありえないだろと

741:名無し名人
18/12/27 09:34:54.35 RzIXkXyY0.net
>>735
>>736
毎回大会後のレーティングで1位になってる河童絞りの優秀さも忘れないであげてくれ

742:名無し名人
18/12/27 10:28:01.99 5hro4Km+0.net
91.csa 62手目△1四歩は候補に挙げるソフトがない模様
AlphaZeroは端歩をつく独特のタイミングや端攻めの多さってのが特徴的な気がする
後手:AlphaZero
後手の持駒:角 歩三 
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ ・ ・v金 ・ ・v桂v桂v香|一
| ・ ・ ・ ・ ・ ・v飛v玉 ・|二
| 金 ・ ・v銀v歩v歩 ・v歩v歩|三
| ・ ・v歩v歩 ・v銀v角 ・ ・|四
| ・v歩 ・ ・ ・ 桂v歩 ・ 歩|五
|v歩 ・ 歩 ・ ・ 歩 ・ 香 ・|六
| ・ 歩 銀 歩 歩 銀 ・ ・ ・|七
| ・ ・ 金 玉 ・ 金 ・ ・ ・|八
| 香 桂 ・ ・ ・ ・ ・ 飛 香|九
+---------------------------+
先手:elmo
先手の持駒:なし
後手番

743:名無し名人
18/12/27 12:02:27.24 /J3j3WBFr.net
>>742
40-60手後に効果がわかる
ぼんやりした端歩の意味は
KPPTでは理解しにくい。
depth8で5-8回絞ればちょっぴり理解できるのかもしれないが。
AlphaZeroは人間的な争点や展開を想定した
端歩の意味づけを理解してるのかも。
「ここは突いといた方が勝ちやすい」と。
膨大な学習が必要だったとは思うが。

744:名無し名人
18/12/27 12:10:24.46 T/D3helGF.net
>>742
知らんがな

745:名無し名人
18/12/27 13:09:04.99 9Ij6tl2OF.net
test

746:名無し名人
18/12/27 13:23:30.37 KoqtKnFGa.net
AlphaZeroのネットワークは現状のNNUEよりかなり大きいからその差が出てるだけでしょ

747:名無し名人
18/12/27 14:38:39.42 H8bMbwZa0.net
AlphaZeroのと現在出回ってるNNUE系評価関数のネットワークの大きさって単純に比較できるものなのか?

748:名無し名人
18/12/27 15:00:25.83 ZHjm1qIP0.net
発火点(すなわちパーセプトロン)の数の単純比較で大小比較すれば良いのでは?
3層パーセプトロンと、DCNNじゃ数えて比較するまでも無いくらい差があると思うけど。

749:名無し名人
18/12/27 15:23:09.08 M4zvlIBHd.net
>>743
Alpha先生の真髄ですね。

750:名無し名人
18/12/27 15:33:13.82 RzIXkXyY0.net
結局深く探索するより評価関数のサイズを大きくして精度を高めたほうがいいんだろうな
最終盤に深く探索できると詰みを見つけやすそうな気もするけどそこらへんもうまいこと学習できるんだろうか

751:名無し名人
18/12/27 15:37:19.94 ZHjm1qIP0.net
大局観か読みかという問題は、永遠の課題。

752:名無し名人
18/12/27 15:42:34.91 /ZRmxtZha.net
Alphazero同士だと先手勝率8割ってマジ?

753:名無し名人
18/12/27 15:52:38.03 fvoVxcPi0.net
ある意味何万局とさして培うような人間的な直観とかに近いよな

754:名無し名人
18/12/27 15:55:32.83 V4jbthxea.net
先手elmo後手elmo、先手aperyqhapaq後手aperyqhapaqのそれぞれのレートと、
論文の勝率から推定される先手AlphaZeroレートと後手AlphaZeroレートから、
先手勝率8割ぐらいではと推定してた人はいたね。

755:名無し名人
18/12/27 16:07:48.13 RzIXkXyY0.net
初手76歩と26歩でどれくらい評価値が違うんだろうな

756:名無し名人
18/12/27 16:15:23.24 5hro4Km+0.net
Alphazero
先手で1敗
後手では9敗(宣言ルールで勝てるのに投了してるもの含)
elmoとレート差がありすぎて極端な数字になってるだけでしょ。
あと自己対戦はレート計算するとき普通誤差が拡大する

757:名無し名人
18/12/27 16:45:10.19 V4jbthxea.net
考察してる人の動画
> AlphaZero論文のデータから見る将棋界の未来予想図①
URLリンク(nico.ms)
対elmoの結果から推定されるAlphaZeroの先手後手のレート差は339.2(先手勝率87.52%)
対aperyqhapaqの結果から推定されるAlphaZeroの先手後手のレート差は132.2(先手勝率68.16%)
elmoとはレート差あり過ぎて数値が極端というのは確かにあるだろうけど、
AlphaZero同士で先手勝率6割5分程度はあるかもね。
他のソフトで対aperyqhapaqとの対戦の先手後手の勝率差はそこまで大きくならなかったと思うので
AlphaZeroはやっぱり(他のソフトよりは)先手後手でレート差が結構ありそうに思う

758:名無し名人
18/12/27 16:57:05.55 H8bMbwZa0.net
評価の精度が煮詰まってくると探索部との相性が~ってなるし、
評価の精度に技術革新が起こるとやっぱり評価の精度が大事って話になるし
また評価の精度が煮詰まってくると(以下略

759:名無し名人
18/12/27 17:02:57.60 ZHjm1qIP0.net
行き詰ると、気分転換したくなるんだよな。

760:名無し名人
18/12/27 17:08:31.64 H8bMbwZa0.net
まあ囲碁よりかは大局感が効かない感はある
というか囲碁の大局感のしめる割合がでかい感がある

761:名無し名人
18/12/27 17:10:43.10 /J3j3WBFr.net
>>750
序盤は大局観、終盤は読み。
将棋は、終盤に攻める側が駒損することが多く、防御側の戦力が溜まっていくので
読みが外れて攻めが切れると一気に逆転する。
奇跡的に良くできたボードゲームだ。

762:名無し名人
18/12/27 17:18:50.03 ZHjm1qIP0.net
>>760
囲碁の場合、大差ない手が多すぎる。
そのため、読みの比率が下がるだけ。
人間にもコンピュータにも難しすぎるゲームだと思う。

763:名無し名人
18/12/27 19:07:30.14 nulO+GNKM.net
elmoが80スレッド1手60秒で対局した時の先後のレーティング差が分からないから無意味

764:名無し名人
18/12/27 19:54:38.84 UQloo+8q0.net
>>760
囲碁は探索では歯が立たないから仕方が無い
将棋は良い手を指せば速く詰み上がるが
囲碁は基本、石が尽きるまで探索せねば機械的には勝敗が求まらない
石は全部で300個以上あるから、つまり囲碁では現実的に詰み探索が成立しない
ということは、有効な評価関数を構成することが将棋より数段難しいということでもある
これまでは辛うじて人間がパターン認識力と仮説構築と検証の能力を駆使して大局観を擬似的に形成してきたが
いかんせん将棋の駒得ほどの精度は実現しようがなく、
>囲碁の場合、大差ない手が多すぎる。 (>>762)
「ようにしか見えない」という大変残念な状況なのだと思う

765:名無し名人
18/12/27 19:57:59.39 0y8xeeMt0.net
きむりんさんは竹部さんと絶縁か
まぁそういう結末になるのは予想できたけど

766:名無し名人
18/12/27 20:28:55.36 96tUBkFId.net
>>762
「人間には」難しすぎる。
ゆえに人間がその知識でコンピュータに教えようとしてもうまくいかなかった。
そこで、自分で感覚を掴んで強くなるコンピュータを作ったら、あっという間にニンゲンはブチ抜かれた。

767:名無し名人
18/12/27 20:38:20.45 Th7R4+nM0.net
だが、囲碁AIと囲碁の神様との差は、将棋AIと将棋の神様との差より
はるかに大きいと思うよ。。

768:名無し名人
18/12/27 20:46:14.72 tEgrgjrJ0.net
>>751
完全探索がムリな数規模の前で
評価精度が全てという帰着でしょうよ。

769:名無し名人
18/12/27 21:24:17.99 UQloo+8q0.net
その評価精度というのは
MCTSに対する全幅の信頼と
Deep Learningの黒魔術的な調整(または取捨選択)ノウハウと
有り得ない回数の自己対戦で支えられています!
2番目のは敵対的生成ネットワーク(GAN)に収束しつつあるのかな知らんけど

770:名無し名人
18/12/27 23:03:21.14 UQloo+8q0.net
3駒間の関係のK_0×P_1_0×P_2_0に対応する評価因子を
 f_[K_0, P_1_0, P_2_0](K, P_1, P_2) = 1 (K=K_0, P1=P_1_0, P2=P_2_0)
                      = 0 (上記以外)
と定義して、
f_[K_a, P_1_a, P_2_a](K, P1, P2)とf[K_b, P_1_b, P_2_b](K, P1, P2)の積を将棋の全ての局面について足し合わしたら、
KPP(T無し)の場合は手番に関する対称性から局面の総数は常に偶数で、
かつ任意の[K, P_1_0, P_2_0]に対して値が正になるやつと負になるやつが同数現れるから
 (上記積)= 1 (K_a = K_b, P_1_a=P_1_b, P_2_a=P_2_b)
        = 0 (上記以外)
となって、(上記積)の足し合わせは内積の定義を満たす
まとめ:むしろKPPTの方が内積の定義を満たすかどうか無根拠であり異端

771:名無し名人
18/12/27 23:10:04.90 4of0F0S/0.net
>>770
内積の定義を満たすってのは、満たしたら何かいいことあるの?
もしくは満たさなかったらなんか悪いことがあるの?

772:名無し名人
18/12/27 23:12:39.70 xK+hEzPd0.net
>>765
相入玉みたいなやりとりだったな

773:名無し名人
18/12/28 00:17:30.10 qFEAm8ru0.net
>>771
将棋の全ての局面(合法手だけで実現する局面に限定してもそうで無くとも良いが、KPPを考える限り必然的に偶数)を定義域D、
値域を実数Rとする任意の関数h:D→Rが与えられたとき、
 H(K_0, P_1_0, P_2_0) = Σ[(K,P1,P2)∈D]{ h(K,P1,P2) * f_[K_0,P_1_0,P_2_0](K,P1,P2) } -- (1)
を(K_0, P_1_0, P_2_0)∈Dについて計算したらば、
 h(K,P1,P2) = Σ[(K_0,P_1_0,P_2_0)∈D]{ H(K_0, P_1_0, P_2_0) * f_[K_0,P_1_0,P_2_0](K,P1,P2) } -- (2)
となって、評価因子f_[K_0,P_1_0,P_2_0](K,P1,P2)の(式(1)を係数とする)線形和(式(2))でもって
h(K,P1,P2)が非線形であっても近似でくる、
_人人人人人人人人人_
> ような気がする <
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^ ̄

774:名無し名人
18/12/28 00:28:27.55 gWGRHLgG0.net
>>773
近似できるできないの違いがよくわからんのだけど、近似できてもやっぱり誤差は出るんだろ?
近似できるものとできないものの違いって誤差の大きさが違うだけのような気がするんだけどどうなんだろうか?

775:名無し名人
18/12/28 10:06:12.74 CS1SRokW0.net
平日にタイトル戦の進行を追いながらfloodgateの前例を検索してツイートしているおじさんはハローワーク伊勢へGO


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch