思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

評価値集合全体に対する正当な半順序の設定が勝利の鍵だった

評価値集合の(部分でなく)全体に正当な半順序を設定できたとき、評価関数は探索条件に対して真に独立となる。すると局面の評価は探索木の詳細とは全く切り離して結論でき、もはや探索の延長は危険でも何でもない。固定深さまでの探索にこだわる理由も消失する*1

ただしそれはもちろん、世界将棋の連載で困難とされていた(記憶モード)、数十手先の任意の2つの局面の良し悪しについても常に正しく裁定を下せる絶対的な評価関数の実現を意味するので道のりはかなり逃走だ

また、探索を深くすれば評価値のバリエーション(評価値集合の要素数)を「減らすことができる」わけだが、具体的に減らす手立てがただちに導けるわけではない。つまり、評価値集合に正当な半順序を与える前に、そもそも対象となる評価値集合*2を確定するという難事業が待っている(ハズ)

やっぱり評価関数調整の手間をミニマルにする意味で、探索条件を固定深さまでの完全探索に限定することにも一定の正当性があるのではないか(←希望的観測

*1:ということに妄言禄を書いてて今更気づいた!

*2:順序を与える前に「評価値」集合と言ってしまうと語弊があるかもだが、つまり局面の同値類のこと。これを何らかの手段で確定せねばならない。