なんで実用に供される評価関数は多値なん? Part II.(2)
昨日のエントリにつき大宇宙から返信を頂いた
前向き枝刈りはともかくオーダリングは評価の順序変更のみを意図しており、最善手の決定にもともと影響しませんかそうですか、、
つまりヒューリスティックに基づくオーダリング結果通りに評価値の大小順序を入れ替えたら最善手が変わってしまう。よって、オーダリングに従い調整するというくだりは削除
あと補足すべきこととして、「これ(十分多種多様のs_rootについて、調整操作(1)に既存の学習結果を壊す副作用が無いこと)は、評価関数の生成元汎関数Φが、ヒューリスティックを精度良く表現する評価関数H'を生成し得ることの十分条件になっている。」というのは真(のはず)だが、これだけではその時点で採択したヒューリスティック自体の正当化にはもちろんならない
ヒューリスティックが正当であると結論するには、十分多種多様のs_rootについて上記アルゴリズムで調整を行ってH'を取得し、さらにその状態で同じs_root集合について上記アルゴリズムで調整してH''を取得し、H'とH''が同値であることが言えねばならない*1
コンパイラがセルフコンパイル結果の収束をもって自己の正当性を示さねばならないように、無矛盾か否かが良否の基準だとかそんな感じの話*2