思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

3値を超える評価関数は最強手筋の近似手段にすぎない

アク禁で書けないからここに書く(何

66x 名前: 名無し名人 [sage] 投稿日: 2009/12/23(水) 17:48:xx id:xxxxxxxx
>>659
数ある手の中で最善手が一意に決まるでおk
特に将棋のような二人零和有限確定完全情報ゲームにおいては
必勝(最悪でも引き分け)となる側は、局面毎に必ず存在する神の一手(最善手)をミスなく差し続けさえすれば
必勝(最悪でも引き分け)を保てるという性質がある
1手読みと言ってるけど本当は0手読みでいいぐらいだ
次回手番の局面は相手の出方依存で変わるが、どの局面にも神の一手があるわけだから心配は要らない


で、そのようなゲームの場合、4値以上の評価関数は、神の一手を、
終局まで達しない浅い探索で近似する手段としてのみ意味を持つ
つまり、良好な近似のために評価値に水平線の向こうの確率が(PGが知ってか知らずかに関わりなく)
結果的に評価値に組み入れられるから多値になる
(ただし、相手プレイヤーの性質に病的な仮定を置く一部例外を除いて、
神の一手をミス無く選び続ける場合の強さは超えられない)