【長文OK】2ch英語→日本語part187at ENGLISH
【長文OK】2ch英語→日本語part187 - 暇つぶし2ch565:名無しさん@英語勉強中
10/07/20 16:08:00
ハーイじゃあ全然関係ないけど
>>528訳しマース
ビール3本目だから怪しいけどw

まず前半
本稿で提示される、総合の方法は、概念としては、
状態を報酬に基づいて統合して状態を選ぶと言う意味で、
MDPの総合に使われるものと近い。
(リワードって日本語なんだろうね、英語だと明らかなんだけど)
確率的動的計画法は、価値関数の推定に基づいて、動的に状態を統合する
(Boutilier, Dearden, & Goldszmidt 2000)
Dietterich and Flann は、状態空間に置ける長方形の領域を、
目標に基づく報酬関数から、逆に求められる価値に基づいて統合している (Dietterich & Flann 1995)。
我々の手法とこれらの手法の相違は、
我々の手法は、部分的に観察可能な問題のみを対象としてデザインされ、
有限時間問題の時間軸のみに適用可能なことである。




次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch