21/06/13 10:09:14.14 h3baPGgw.net
デープマインドの人
必要なのは、強化学習と報酬ポリシーを探求するだけ
課題
1 異なるセンサー情報の統合
2 その処理された情報からひとつの高度な報酬ポリシーを自動生成
3 高級生物特有の社会的関係(絆)の概念化
4 今のままだと一生かけても無理なので、少量のデータで学習できる方法
別の記事からまとめたやつを引用する
現実世界から情報収集するための異なるセンサーは、
数学においては数学空間を情報収集するための
一般化できるアルゴリズムが必要ということ
これは前から散々言われているけど
今のところ、まだできていない
新しいコンセプトを組み立てる想像力など"あらゆる面"で数学で人間に勝るには
1と2と4が必要