思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

なんで実用に供される評価関数は多値なん? Part II.(2)

昨日のエントリにつき大宇宙から返信を頂いた
前向き枝刈りはともかくオーダリングは評価の順序変更のみを意図しており、最善手の決定にもともと影響しませんかそうですか、、
つまりヒューリスティックに基づくオーダリング結果通りに評価値の大小順序を入れ替えたら最善手が変わってしまう。よって、オーダリングに従い調整するというくだりは削除
あと補足すべきこととして、「これ(十分多種多様のs_rootについて、調整操作(1)に既存の学習結果を壊す副作用が無いこと)は、評価関数の生成元汎関数Φが、ヒューリスティックを精度良く表現する評価関数H'を生成し得ることの十分条件になっている。」というのは真(のはず)だが、これだけではその時点で採択したヒューリスティック自体の正当化にはもちろんならない
ヒューリスティックが正当であると結論するには、十分多種多様のs_rootについて上記アルゴリズムで調整を行ってH'を取得し、さらにその状態で同じs_root集合について上記アルゴリズムで調整してH''を取得し、H'とH''が同値であることが言えねばならない*1
コンパイラがセルフコンパイル結果の収束をもって自己の正当性を示さねばならないように、無矛盾か否かが良否の基準だとかそんな感じの話*2

*1:これはH'とH''それぞれで探索しまくって最善手の一致を見てもよいが、そうせずとも良い。調整対象としたs_root集合についてH'に基づくEN(s_root, d)とH''に基づく(s_root, d)を比べてみて、評価値の大小順が入れ替わっていなければおk

*2:無矛盾が正義なのはもともとわかっていたことであって、それを示すやり方が変えただけにすぎないかも…今言ってる方法はs_root集合というある意味対局者の認識の上での相場に適応するやり方