【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★]at SCIENCEPLUS
【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★] - 暇つぶし2ch67:名無しのひみつ
20/12/28 09:01:06.20 qYVZtVeV.net
>>1
スカイネットの原型

68:名無しのひみつ
20/12/28 09:08:36.39 Xyydxvuh.net
碁盤使って五目並べ始めちゃうやつ

69:名無しのひみつ
20/12/28 09:13:05.40 5i7nnso8.net
プレイヤーが多すぎるから、とりあえず千人ぐらいに減らすわ

70:名無しのひみつ
20/12/28 10:33:34.69 wRehkQN4.net
>>4
勉強を教えたって機械学習を知らないのかお前みたいなバカはそんなバカみたいなことを言う
それと同じ

71:名無しのひみつ
20/12/28 10:46:13.45 4W7Ilw/c.net
心配しなくても将棋なんて世界は相手にしない

72:名無しのひみつ
20/12/28 11:01:48.94 hj5XRtxZ.net
説明やチュ-トリアルを飛ばす
ゆとりと一緒

73:名無しのひみつ
20/12/28 11:02:07.43 hj5XRtxZ.net
説明やチュ-トリアルを飛ばす
ゆとりと一緒

74:名無しのひみつ
20/12/28 13:13:07.27 h8/EyZnu.net
私も、将棋で先手で二手ハンディをくれたなら、羽生にだって勝てる自信がある。

75:名無しのひみつ
20/12/28 13:32:43.89 sTLh12F1.net
>>41
それは無理だろう。なぜなら仮に将棋を例にとると
「将棋は相手の飛車を取るゲーム」として遊ぶこともできるからだ。
「王を取るゲーム」だとAIに教えない限り、そのように遊ぶことはない。
いや遊ぶかもしれないが、数ある可能性の一つとしてしか遊ばない。

76:名無しのひみつ
20/12/28 13:36:21.01 sTLh12F1.net
あるいは、持ち駒で役を作って相手の役より良いものを目指すポーカーのようなゲームとして
将棋を遊ぶこともできるだろうし、ババ抜きのように特定の駒を相手に取らせれば勝ちという
ゲームとして遊ぶこともできるだろう。

77:名無しのひみつ
20/12/28 14:00:33.78 2rlc43bT.net
具体的な目的だけを指示しそこに至る最適なルールを見つけるAIね。
できるけど、これやると、目的を”地球環境”とする左翼が出てくるわけ。
すると、最も効率的なルールは「人間に活動させない」となるわけ。

78:名無しのひみつ
20/12/28 14:50:46.82 2bQ7jSQ7.net
>>75
スレタイ読めないのか?
ルールを学習するんだぞ
飛車取りゲームとして学習するわけ無いじゃん
飛車取っても投了にならない時点で学習終わり
お前は馬鹿なのか

79:名無しのひみつ
20/12/28 15:05:19.80 Xyydxvuh.net
将棋なら二歩で即負けそう
人間なら「二歩は駄目」って一言言ってもらうだけで学べるのに

80:名無しのひみつ
20/12/28 15:15:03.29 vlplN+D/.net
>>79
それもその一回だけだろう
終局の判定は他のAIなりが判定するんだろうし

81:名無しのひみつ
20/12/28 15:21:37.98 J0d9D8ZG.net
以前、トリビアの泉でやってた、野球を知らないアフリカの部族にバットやグローブ、ボール、ベースなどを渡して、どういう遊びを創造するか?てのがあったけど、あれみたいなことになるんじゃないのか?
ラケットで相手を突いて対戦したり、ラグビーボールの上で何分立ってられるか競う競技を始めたり…

82:名無しのひみつ
20/12/28 15:23:03.14 Xyydxvuh.net
分からんぞ
全部の列の二歩を試すまで分からん奴かもしれん
そのうち計算量膨大になって対局中に隕石降ってくる確率の計算始めるかもしれん

83:名無しのひみつ
20/12/28 15:23:18.98 CYDzbKKE.net
人の手を必要とする多大な学習コストを減らすのがこういうAIの大きな目的の一つ。
重みの調整とかもね。

84:名無しのひみつ
20/12/28 15:28:25.01 +HOLK76t.net
ルールの穴見つけてそこばっかり攻める嫌なAIになりそうやなw

85:名無しのひみつ
20/12/28 15:44:20.26 Xyydxvuh.net
>>65
そっちの方は完全にルールが決まっている前提
そういう場合はAIは人間以上に強い
だけど基本はポンコツ
自閉症みたいだな

86:名無しのひみつ
20/12/28 15:48:17.64 UTaxBJg4.net
オナニーを教えなくても自然に覚えるみたいなもんか?(´・ω・`)

87:名無しのひみつ
20/12/28 16:48:21.01 sTLh12F1.net
>>78
>ルールを学習するんだぞ 飛車取りゲームとして学習するわけ無い
つまり駒の動かし方(これはルールだ)や、将棋は王を取るゲーム(これはルールだがw)だと教えてから学習しないと
飛車取りゲームとして学習し始める可能性があるってこった。
それに二歩とか、打ち歩詰め、連続王手の千日手、なんて「ルール」は
機械学習からは導かれない。人間が恣意的に設定してるから当たり前だが。

88:名無しのひみつ
20/12/28 17:40:09.57 eENkJ2PG.net
ルールは教えて無いけど
対局自体は見せて駒の動きやルールを学習してるんでしょ

89:名無しのひみつ
20/12/28 18:37:10.99 h8/EyZnu.net
相手の王を取れば勝ちなんだよと教えたAIは相手の王に手を伸ばしてそれを奪った。

90:名無しのひみつ
20/12/29 04:39:49.76 IwtSRmeN.net
使えそうなAIだな。流石効率厨

91:名無しのひみつ
20/12/29 05:12:36.43 t1cItzz8.net
超弦理論を証明するのはAI そして人間は理解できない

92:名無しのひみつ
20/12/29 07:08:42.25 0vYBmgvT.net
そもそもAIってそういうものを指してただろ

93:オーバーテクナナシー
20/12/29 11:03:53.58 BSmCAJhe.net
技術的特異点/シンギュラリティ198【技術・AI】
スレリンク(future板)

94:名無しのひみつ
20/12/29 11:27:57.64 0pzAaC9p.net
負けそうになったら「手が滑ったー」と言って将棋盤ひっくり返すのも正式なルールとして学んじゃうの?

95:名無しのひみつ
20/12/29 11:39:18.23 rUreRQES.net
駒の持ち方から学習

96:名無しのひみつ
20/12/29 11:53:29.23 KTxxdAJb.net
子供がゲーム版持って自分の好きなルールで遊んでる感じか?
最終的なルールの正解を教えないなら絶対正解にたどり着かねくね

97:名無しのひみつ
20/12/29 11:55:48.32 d261AAaB.net
教師なし学習?
強化学習?
遺伝的アルゴリズム?

98:名無しのひみつ
20/12/29 12:04:11.22 h16AAxeK.net
>>1
血税の合理的な予算配分をAIに任せれば
汚職政治家よりも、、まともな仕事をしてくれるだろ

99:名無しのひみつ
20/12/29 12:16:33.08 XaVtcveQ.net
なんだこの出鱈目
ルール一切教えなかったら勝ったか負けたかもわからんのに、ねーよ
逆に、例えば、ルール違反の駒の動かし方したら即負けと判定されるなら、駒の動かし方のルール教えてるのと同じ

100:名無しのひみつ
20/12/29 12:19:59.30 +u8plbL4.net
>>8
このDeepMindはブロック崩しも自分でルール解析して人間を超えたよ

101:名無しのひみつ
20/12/29 12:23:47.08 3laBHCNC.net
>>99
その辺をどうやって定義しようかねえ
例えば将棋なら最初から「この駒はこの方向だけ動く」とプログラムしておくのではなく
あるいは動かす側では全部の駒がランダムに動かしうる、
しかしルール違反の動かし方をした途端にルール違反で最初からやり直しになり
更にある所からある所に動かすと違反になる、というルールを配列かデータベースか知らんが
記録していく
そしてその記録部分の方向にだけ動くようになる
こういう構造のプログラムにして、上手くゲームを自動的にプレーできるようになったよ、って事かなあ
教わるな!目で見て覚えろ!って教え方がある(賛否両論あるが)けど
それに近いものをAIを使って実行できたって事だね

102:名無しのひみつ
20/12/29 12:37:14.62 3laBHCNC.net
URLリンク(www.gamespark.jp)
ラーメン屋の店主になって客にてきぱきと品物を出すゲーム
「カウンターファイト」
これをAIにプレーさせれば
実際の店でうまく作業できるロボットの開発に貢献できるかどうか?

103:名無しのひみつ
20/12/29 12:46:37.86 HRTDgWgd.net
>>102
お客さんをフライパンで殴って判定があるの爆笑
おもしろそうだな

104:名無しのひみつ
20/12/29 12:49:15.51 QH8vbExr.net
Deep Learningですでに実現してなかった?

105:名無しのひみつ
20/12/29 12:50:01.18 d261AAaB.net
勝ち負けの判断能力だけ教えれば、結果から学習するの?

106:よっちゃん
20/12/29 13:01:33.83 JaMe1uh9.net
Announcement 478: Who did derive first the division by zero 1/0
and the division by zero calculus $\tan(\pi/2)=0, \log 0=0$ as the outputs of a computer?
URLリンク(blog.livedoor.jp)

107:名無しのひみつ
20/12/29 13:07:26.20 +u8plbL4.net
>>99
>即負けと判定されるなら、
AIが知り得るのはルールや勝ち負けじゃなくて「報酬」のみ
報酬を高めるために自分自身でルールを作る
このやり方は人でも同じ
あるやり方がうまく行ったなら失敗するまで何度もそれを続ける
何度も続けてるうちに失敗したらその時に何かしらルールがあると考え始める
「黒猫が目の前を通ったから失敗したのかな」と考える人もいるだろう
本当の失敗の原因は何なのか知らなくても別に問題ない
自然界で生き抜くためのルールは自分で作るもの
そういう環境でAIが鍛えられてる

108:名無しのひみつ
20/12/29 13:34:39.57 +u8plbL4.net
もっと極端なこと言うとルールに及ばず駒や盤の概念すらAIには教えられてないよ
AIはただメクラ滅法に自分の多数あるノードにONOFFの指令を出すところから始まる
AIの最初の目標は何か環境の応答
そこであるノードをONにすると駒が動くということを理解する
そして別のノードでも動くのを発見するけど動く方向が違うぞと
こうすればこうなるというのがわかれば自分でノードを再構成する
こういった無限とも思われるような試行・再構成を経て最終的に勝てるAIが作られていく

109:名無しのひみつ
20/12/29 13:42:24.02 PKkUMqfB.net
>>67
今後軍事戦術分野にも導入されたらそうなるだろうと俺も思った。
歩兵から、戦車兵、航空機まで統括した戦術立てる様になるだろうなぁ。

110:名無しのひみつ
20/12/29 13:54:47.76 +u8plbL4.net
報酬を高める方向にAIが進むわけだけども
最も大事なことはAIに与えられる報酬はAIが決めるということ
AIは数値の上下さえ知らない
1点より2点のほうが達成確率が低いとなると2点が確実にとれるように頑張る
そしてさらに3点も取れることを発見して3点が取れるように頑張る
AIにとっては点数がどうというより達成確率の難しい物を高報酬と選んで進んでいく
100万点より10点のほうが達成確率が低いなら10点を狙うのに至高の喜びを得るのがAI

111:名無しのひみつ
20/12/29 14:10:32.40 NIcyiDCc.net
 
>ルールを一切教えなくても
強化学習なら正解があって自己修正していくんだろ?
それは教えていることになると思うが

112:名無しのひみつ
20/12/29 15:56:45.60 Y+UmLwVA.net
AIをネットにつないで漠然と世の中の人を喜ばせるような学習をさせたら何をするようになるのかな

113:名無しのひみつ
20/12/29 16:08:52.02 Y+UmLwVA.net
>>111
そだね
反則したら試合が止められるとか勝敗がついたら試合が止められるとかの判定結果或いはそれを適用済の状態を与えない限り
盤上で駒が増えもせず減りもせず或いは勝敗がついた後も駒が永遠に走るだけの意味のないAIにもなりうる

114:名無しのひみつ
20/12/29 16:32:06.97 U5Vnpjgi.net
上上下下左右左右BA

115:名無しのひみつ
20/12/29 16:54:35.07 VTqWjqNu.net
がんばれ森川くん3号位なのかな

116:名無しのひみつ
20/12/29 20:11:29.01 3laBHCNC.net
OJTならぬOPT(On Playing Training?)というか
ルールも何も知らない状態でいきなりプレーして
反則するたびに失格!負けたらはい次!
と何度も繰り返し、
そのストップした時の駒の動きや相手の駒の状況を
記録させて行く

117:名無しのひみつ
20/12/29 20:59:35.57 eds2+ozg.net
>>64
AIが「賢者」になるんやで
人間に勝ち目無くなるわ

118:名無しのひみつ
20/12/29 21:01:53.99 eds2+ozg.net
>>84
ルールの穴というかゲームのバグを利用した攻略は絶対やるよな、これ

119:名無しのひみつ
20/12/29 21:03:03.56 eds2+ozg.net
>>87
飛車をとっても勝てないんだからそこで学ぶだろう。

120:名無しのひみつ
20/12/29 21:05:48.95 eds2+ozg.net
>>111
教えていないけど、ルール違反したらダメ出し食らって自然に学ぶって感じでしょ。
いう事聞かないガキ殴るのと一緒よ。

121:名無しのひみつ
20/12/29 21:31:45.41 eds2+ozg.net
これ、でも結局大した意味ないよね。
いままでのAI
・ルールはコーディングで強制(ルール強制ギブス)されていた
今度のAI
・ルールを学ぶところも含めて学習
って違いやろ。
でもルールを懇切丁寧に教えてくれる人間はどうせおらんから
ルールを予めコーディングした先生プログラムがどうせ必要なんだよね。
だったらオプションとしてルール強制ギブスをつけられるようにするだけでええやんと思う。
俺が期待したのは「学習したルール(セオリーでも可)を人間に伝えるために文章化できるAI」なんだけど。
これができないと科学者のような仕事をAIに任せられるようにならないし
知識として積み重ねることができない。

122:名無しのひみつ
20/12/29 22:06:52.52 VTqWjqNu.net
>>120
だから報酬系関係ねえだろって話じゃねえの
ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ

123:名無しのひみつ
20/12/30 05:22:43.14 XxP+T7v1.net
買ってから攻略本観ないでRPGやるみたいな感じだろうな。一見非効率なんだけど、攻略本観ない時の方がめっちゃ楽しいんだよな。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch