思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

予防線

ここに考えをぺらぺら書き散らしてるのは、誰かが見てるかもと思うと興奮する作業のモチベーションが上がるから好きでそうしているのだが、仮にひょっとしてもしかすると万が一本当に見てる人がいたりしてネガティブなコメントをよこしたりするとモチベが最急降下してしまうので予防線を張っておくテスト。

局面辞書再考

Don't care値を持つビットマップを考えたが、正直それは有害っぽいので却下。
ここでは局面の特徴量ベクトル抽出関数を一応線形分離可能性が保証されるように構成したから、中間ノードをべらぼうに増やす前提でだが、学習完了の解の存在は保証される(収束は自明じゃないケド、、)。これは積和論理が項の数さえ十分なら任意のデコーダを構成できるのとほぼ同じ話。で、仮に正しい解に到達した場合、Don't careセルは必然的に学習されているので、問題は発展的に消滅する。
逆に、事前にDon't careセルをDon't careセルに変更したパターンを学習パターンにしようとすると、学習の効率化には寄与するかもしれんが特徴量ベクトル抽出関数を考え直さねばならない。(Don't careセルを単純に空白セル扱いにして今の特徴量ベクトル抽出関数を適用すると、かえってDon't careセル学習の機会を奪ってしまう。)

パーセプトロン再考

>なんでパーセプトロンを持ち込んだごときでうまくいくと思うの?バカなの?死ぬの?

たしかにこれは痛いところで、パーセプトロンの学習結果から有用な局面解釈手段が得られるかどうかは(消去法的に今までだれもやっていなさそうだというだけで)全く未知数。理想的には学習結果をゴニョゴニョ解釈して遷移コスト(手数的に見た距離)に相関した何かが得られるようになるといいんだが、あたりを狙っている。
まあ今考えてる方法で無理なら無理で、学習対象そのものを多少シフトさせるとか妄想中。
そもそもいかに電波でお花畑な漏れとわいえ、実験抜き一発で結果が出せるとは思っていない。

巻き戻し再考

あるノードnを根とする部分ゲーム木の中には一般に、pが勝つ手筋と-pが勝つ手筋が見出せる(手筋:=葉ノードに向かうパス)。ここで、p, -pは対戦者を表す記号とする。
【必勝ノードの定義】
ノードn以降-p(p)がどのような手筋で指そうとも、p(-p)を勝たせられる(そのようなp(-p)の手筋を見出せる)場合、nはp(-p)の必勝ノードである。
【性質】

  1. {pの必勝ノード}∩{-pの必勝ノード}=φ。
  2. p(-p)の必勝ノードの子もまたp(-p)の必勝ノードである(さもなくば矛盾)。
  3. ノードn0の子ノードにp(-p)の必勝ノードnとそうでないノードが混在する場合、nはp(-p)の手番である(性質2.と必勝ノードの定義から言える)。

だから、n1->n2->n3->n4というノード遷移でpが勝った場合、pの必勝ノードを求めるための巻き戻しはn3から初め、1ノード飛ばしでn3, n1, ...の系列でチェックすれば十分と結論される。(∵n2が必勝ノードでなくかつn1が必勝ノードであることは有り得ない。また、n2が必勝ノードでありかつn1が必勝ノードでないことも有り得ない。)
判定はdf-pnで行う。もしn(k)で判定に失敗した場合はn(k+2)を必勝ノードとして記憶する。
(別の勝負で全く異なる経路を経てn(k+2)(と同じ局面)に来る可能性があるので、これでも全く無意味ということにはならない。)