ついに5対5の対戦ゲームでも人工知能が人間超え!OpenAIが『Dota2』の世界チャンピオンを2勝0敗で下す [177546566]at POVERTY
ついに5対5の対戦ゲームでも人工知能が人間超え!OpenAIが『Dota2』の世界チャンピオンを2勝0敗で下す [177546566] - 暇つぶし2ch1:番組の途中ですがアフィサイトへの\(^o^)/です
19/04/15 16:41:13.22 YxtGtlnI0.net BE:177546566-2BP(1000)
URLリンク(img.2ch.net)
人工知能を研究する非営利団体OpenAIが開発した「OpenAI Five」が2019年4月14日、対戦型リアルタイムストラテジーゲーム「Dota 2」の2018年度世界大会覇者OGに勝利を収めました。
チェスや将棋だけではなく、ゲームにおいてもAIの躍進は続いています。
Dota 2はマルチプレイヤーオンラインバトルアリーナ(MOBA)の1つで、100キャラクター以上の中から1つのキャラクターを選択して操作し、5人対5人で戦うゲームです。
プレイには、「どのキャラクターを選択するか」「レベルアップによってどのスキルを取得するか」「どのアイテムを装備するか」などの長期的な戦略も問われる一方、
戦闘はリアルタイムで進行するため、瞬間的な思考力や反射神経も問われます。
Dota 2は世界最大のゲーミングプラットフォームSteamを運営するValve Corporationによって開発され、継続的なアップデートが続けられており、
2018年度の世界大会・「The International 2018」の賞金総額は約2553万ドル(約28億6000万円)を記録しています。
OpenAIは「The International 2017」で発表されると同時にかつての世界王者と1対1の試合を敢行。そのまま勝利を収めるという鮮烈のデビューを果たしました。
その1年後には現役プロゲーマーが率いるチームに勝利を収め、継続的な進歩が報じられてきました。
そして2019年4月15日、OpenAI Fiveはアメリカカリフォルニア州サンフランシスコで行われた親善試合において、世界大会「The International 2018」の覇者・OGに勝利を収めました。
OGはThe International 2018の優勝賞金として約1123万ドル(約12億6000万円)を獲得しており、Dota 2におけるトップチームの1つです。
3番勝負・2本先取で勝利という形式で行われた一連の試合では、OpenAI Fiveは人間のプロの間ではあまり見ることのない、
お金を支払ってキャラクターを強制的に復活させる「BuyBack」を序盤から使うなどの「AI独特の戦略」をとり、1度も敗北することなく2本を先取。シリーズの勝利を収めました。
Dota 2の平均試合時間は35分ほどですが、2試合目の試合時間はわずか20分。
OpenAI Fiveには「短期的な利益を重視する」という選好があり、序盤にリードを得るようなプレイを行い、それによって得たアドバンテージによって押し切るような形で勝利を収めています。
今回の試合は親善試合の形式で行われ、OGはあくまでも楽しみながらプレイしていました。
また、Dota 2では100種類以上のキャラクターが選べますが、OpenAI Fiveは17種類のキャラクターしかプレイできず、一部のアイテムや一部のコマンドが使えません。
OpenAI Fiveはまだまだ発展の途上であり、今回の勝利は「AIの進歩の結果」というよりも「AIの進歩の過程」であるといえます。
URLリンク(gigazine.net)
↓ちなみに半年前は人間が勝利
人間の圧勝に終わった52分の戦い
今回の試合で、OpenAIはpaiNよりも多いキル数を記録していた。
試合の実況者たちは、完璧なタイミングで繰り出される組織的な攻撃に驚いていたほどだ。人間チームには抵抗不可能にも思える攻撃である。
しかし、戦略面ではボットが遅れをとっており、勝利に必要となるリソース収集と割当てで多くのチャンスを逃していた。
15分以上先を「計画」できない弱点
人間の場合、ゲームの目的や有効な戦略の立て方を学ぶことで(幸運なことに)数百万試合をプレイせずとも初心者からプロゲーマーになることができる。
一方で強化学習を行ったボットは、少なくとも現在は高いレヴェルでゲームに参加できていない。ボットたちは一瞬一瞬の最適なアクションを予想することで動いているのだ。
「ボットたちはゲームに『反応』しています。ゲームの世界を見て、そのときに何をするかを考えるわけです」と、カリフォルニア大学バークレー校のベン・レヒト教授は言う。
OpenAIのDota 2プロジェクトでソフトウェアエンジニアを務めているスーザン・チャンは、対paiN戦でその欠点が現れたと話す。
訓練中、ボットは自分のアクションの影響を最大14分先まで考えていた。
「単純に、15分以上先のことを『計画する』メカニズムが備わっていないのです」と彼女は言う。「これは間違いなく、試合でボットが見せた長期戦略の欠如につながっています」
URLリンク(wired.jp)


レスを読む
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch