【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★]at SCIENCEPLUS
【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★] - 暇つぶし2ch103:名無しのひみつ
20/12/29 12:46:37.86 HRTDgWgd.net
>>102
お客さんをフライパンで殴って判定があるの爆笑
おもしろそうだな

104:名無しのひみつ
20/12/29 12:49:15.51 QH8vbExr.net
Deep Learningですでに実現してなかった?

105:名無しのひみつ
20/12/29 12:50:01.18 d261AAaB.net
勝ち負けの判断能力だけ教えれば、結果から学習するの?

106:よっちゃん
20/12/29 13:01:33.83 JaMe1uh9.net
Announcement 478: Who did derive first the division by zero 1/0
and the division by zero calculus $\tan(\pi/2)=0, \log 0=0$ as the outputs of a computer?
URLリンク(blog.livedoor.jp)

107:名無しのひみつ
20/12/29 13:07:26.20 +u8plbL4.net
>>99
>即負けと判定されるなら、
AIが知り得るのはルールや勝ち負けじゃなくて「報酬」のみ
報酬を高めるために自分自身でルールを作る
このやり方は人でも同じ
あるやり方がうまく行ったなら失敗するまで何度もそれを続ける
何度も続けてるうちに失敗したらその時に何かしらルールがあると考え始める
「黒猫が目の前を通ったから失敗したのかな」と考える人もいるだろう
本当の失敗の原因は何なのか知らなくても別に問題ない
自然界で生き抜くためのルールは自分で作るもの
そういう環境でAIが鍛えられてる

108:名無しのひみつ
20/12/29 13:34:39.57 +u8plbL4.net
もっと極端なこと言うとルールに及ばず駒や盤の概念すらAIには教えられてないよ
AIはただメクラ滅法に自分の多数あるノードにONOFFの指令を出すところから始まる
AIの最初の目標は何か環境の応答
そこであるノードをONにすると駒が動くということを理解する
そして別のノードでも動くのを発見するけど動く方向が違うぞと
こうすればこうなるというのがわかれば自分でノードを再構成する
こういった無限とも思われるような試行・再構成を経て最終的に勝てるAIが作られていく

109:名無しのひみつ
20/12/29 13:42:24.02 PKkUMqfB.net
>>67
今後軍事戦術分野にも導入されたらそうなるだろうと俺も思った。
歩兵から、戦車兵、航空機まで統括した戦術立てる様になるだろうなぁ。

110:名無しのひみつ
20/12/29 13:54:47.76 +u8plbL4.net
報酬を高める方向にAIが進むわけだけども
最も大事なことはAIに与えられる報酬はAIが決めるということ
AIは数値の上下さえ知らない
1点より2点のほうが達成確率が低いとなると2点が確実にとれるように頑張る
そしてさらに3点も取れることを発見して3点が取れるように頑張る
AIにとっては点数がどうというより達成確率の難しい物を高報酬と選んで進んでいく
100万点より10点のほうが達成確率が低いなら10点を狙うのに至高の喜びを得るのがAI

111:名無しのひみつ
20/12/29 14:10:32.40 NIcyiDCc.net
 
>ルールを一切教えなくても
強化学習なら正解があって自己修正していくんだろ?
それは教えていることになると思うが

112:名無しのひみつ
20/12/29 15:56:45.60 Y+UmLwVA.net
AIをネットにつないで漠然と世の中の人を喜ばせるような学習をさせたら何をするようになるのかな

113:名無しのひみつ
20/12/29 16:08:52.02 Y+UmLwVA.net
>>111
そだね
反則したら試合が止められるとか勝敗がついたら試合が止められるとかの判定結果或いはそれを適用済の状態を与えない限り
盤上で駒が増えもせず減りもせず或いは勝敗がついた後も駒が永遠に走るだけの意味のないAIにもなりうる

114:名無しのひみつ
20/12/29 16:32:06.97 U5Vnpjgi.net
上上下下左右左右BA

115:名無しのひみつ
20/12/29 16:54:35.07 VTqWjqNu.net
がんばれ森川くん3号位なのかな

116:名無しのひみつ
20/12/29 20:11:29.01 3laBHCNC.net
OJTならぬOPT(On Playing Training?)というか
ルールも何も知らない状態でいきなりプレーして
反則するたびに失格!負けたらはい次!
と何度も繰り返し、
そのストップした時の駒の動きや相手の駒の状況を
記録させて行く

117:名無しのひみつ
20/12/29 20:59:35.57 eds2+ozg.net
>>64
AIが「賢者」になるんやで
人間に勝ち目無くなるわ

118:名無しのひみつ
20/12/29 21:01:53.99 eds2+ozg.net
>>84
ルールの穴というかゲームのバグを利用した攻略は絶対やるよな、これ

119:名無しのひみつ
20/12/29 21:03:03.56 eds2+ozg.net
>>87
飛車をとっても勝てないんだからそこで学ぶだろう。

120:名無しのひみつ
20/12/29 21:05:48.95 eds2+ozg.net
>>111
教えていないけど、ルール違反したらダメ出し食らって自然に学ぶって感じでしょ。
いう事聞かないガキ殴るのと一緒よ。

121:名無しのひみつ
20/12/29 21:31:45.41 eds2+ozg.net
これ、でも結局大した意味ないよね。
いままでのAI
・ルールはコーディングで強制(ルール強制ギブス)されていた
今度のAI
・ルールを学ぶところも含めて学習
って違いやろ。
でもルールを懇切丁寧に教えてくれる人間はどうせおらんから
ルールを予めコーディングした先生プログラムがどうせ必要なんだよね。
だったらオプションとしてルール強制ギブスをつけられるようにするだけでええやんと思う。
俺が期待したのは「学習したルール(セオリーでも可)を人間に伝えるために文章化できるAI」なんだけど。
これができないと科学者のような仕事をAIに任せられるようにならないし
知識として積み重ねることができない。

122:名無しのひみつ
20/12/29 22:06:52.52 VTqWjqNu.net
>>120
だから報酬系関係ねえだろって話じゃねえの
ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ

123:名無しのひみつ
20/12/30 05:22:43.14 XxP+T7v1.net
買ってから攻略本観ないでRPGやるみたいな感じだろうな。一見非効率なんだけど、攻略本観ない時の方がめっちゃ楽しいんだよな。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch