思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

空腹で居ろバカで在れタダ飯を食らえ

<電波>
本当は“New Game AI Design”とか言って一席ぶちたい気分だが詳細に書いてるうちにまた欠陥を発見してもアレなのでかわりにおとぎ話をする。

小さな神様がいてそいつは足し算や引き算や九九やベクトルの外積や所与のf(x)の定積分とかいったいろんな計算を実例を与えただけで帰納的に模倣してしまうとしよう。
小さな問題についての学習能力は申し分ないことはわかった。重力に引かれた砂粒同士が容器に合わせて勝手に安定な組み合わせに落ち着くように、そいつは与えられた砂の質量(リソースの制限)と容器(問題の形)の範囲内でベストな形を勝手にとる。また砂粒同士の局所領域の変更が全体に波及しにくいから、未知の実例が来てもそれまでの学習がちゃぶ台返しになりにくい。そして仮に砂粒の量に制限がないなら、無制限の模倣能力を発揮することは原理的に明かなのだ。

未確認なのは両者の中間に属する現実的な複雑さについてのふるまい。(例えば)将棋のように10^220もある局面のうちの現実的にゲームに現れる部分集合の全要素について、合法手で得られる次局面をP(自分が勝つ)の降順に並び替え可能にするような評価値を返す演算を果たしてそいつは模倣可能か?

全くの勘だが小さな神様にはまだ無理っぽい木がするのでそこは人間が手をさしのべてやることにする。将棋だとして、詰みの成立条件にシームレスに繋がるような局面評価手段を設けて「ゲームの局面」がなす特徴空間内におけるP(自分が勝つ)マップをおおまかに教えたとしよう。すると小さな神様が学習するのはマップとの差分で良くなり学習の手間が減る(エントロピー符号化による圧縮と同様)。

理想とのずれは神様が学習するから「詰みの成立条件にシームレスに繋がるような局面評価手段」は本当に完全にシームレスである必要はなくて条件付きでいい。そういうものは、計算量はそこそこ必要だがいくつか考えられる。計算量の増大は、学習途上の神様に大枝を刈ってもらって凌ぐ。

学習すべき「差分」をどう設計するかによるが、これは上手く選べばゲーム木自体の探査(個別の対戦とは非依存)と同義にできるから学習サンプルのノイズは存在しないとみなせる(過学習の危険は少ない)。