思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

2009-01-01から1年間の記事一覧

3値を超える評価関数は最強手筋の近似手段にすぎない

AI

アク禁で書けないからここに書く(何 66x 名前: 名無し名人 [sage] 投稿日: 2009/12/23(水) 17:48:xx id:xxxxxxxx >>659 数ある手の中で最善手が一意に決まるでおk 特に将棋のような二人零和有限確定完全情報ゲームにおいては 必勝(最悪でも引き分け)となる…

TD法はなぜうまくいかないのか

AI

宇宙の熱的死を認めるなら、十分大きい時間が経過したときの宇宙の巨視的な状態の分布はエルゴード性を満たす(単一状態しかないから)。 いやそこまで風呂敷を広げずに二人零和有限確定完全情報ゲームに話を限ろう。この場合も同様に、 対戦者同士が常に同じ…

TD法はなぜうまくいかないのか

AI

(以下検閲削除)

注文の多い学習メソッド

AI

というわけで、学習に1ヶ月かかるがさらに試合中に百万局面読めといわれて疑問を感じないのはかなりお人好しだと思う 長くなったが前向き枝刈りはネ申がやれば無問題でありオールおk

基底関数の線形結合ベースの学習手法は裸の王様

AI

パーセプトロン、ニューラルネットワーク、ロジスティック回帰、サポートベクトルマシン…これらは全て何らかの基底関数の線形結合を用いて識別を行おうとするものであり、近似の万能性が数学的に証明される。だがヒルベルト空間みたいな贅沢な概念を前提とす…

たくさん読めば強くなる?--弱い評価関数のブースト手法

AI

そんな便利なもの存在しないというのが現時点でのGMA0BNの見解。

ミニマックス法(αβ法)の神話

AI

ミニマックス法は条件付き確率P( 自分が勝つ | 相手が最善手のみ打つ )を最大化する探索法でありαβ法はその高速版だ。ここでP(ω)は事象ω∈Ωの確率。 より正確に言うと、通常はゲーム木の高さより小さい値の深さ制限d_maxをつけて探索するから、 P( 現局面から…

df-pn#再誕

AI

改めて昨日の記事を読み返すとドー見てもネタバレになっている箇所があったのでいっそバラしてみるテスト。 df-pn探索において根ノードからの経路の記憶を持たずとも、根ノードからの深さがdであるノードにおいて登録した局面表のエントリeを、それからm回後…

今月がタイムリミットなのは万人にとっての普遍的真理

AI

機械学習とチューニングに要する時間を逆算すると年内にせめて学習部ぐらいは形にしないといけない(もちろん実戦を積ませようとするならもっと急ぐ)。ここでGMA0BNの迷走ぶりを報道するという当blogの使命を思い出したので、機械学習についてGMA0BNの過去の…

y…いやミスター・キシドー、

AI

あーあ漏れにもあれぐらい知能があったらなあ、、

二人零和有限確定完全情報ゲームが先手不敗か後手不敗のどちらかであることを証明できるから証明してみた

AI

二人零和有限確定完全情報ゲームGでプレイヤーA,B2人が対戦、A先手、かつ下記とする。 [仮定1] A,Bいずれも自分の手番で手xを打てば相手の負けが確定する場合、ミスなくその手xを打つ Gのゲーム木の高さについて、それが2以下の場合首記定理の成立は自明なの…

[AI](続)最短移動問題 角を1九から1四に4手で移動させる例。 Mismatch! act=-1, exp=4 19->55->33->15->16 nnodes=2129 1 2 3 4 5 6 7 8 9 - + + + + + + + + + |一 + + + + + + + + + |二 + + 2 + + + + + + |三 + + + + + + + + + |四 3 + + + 1 + + + + |…

駒の最短移動問題

AI

ふと引っかかった問題。 駒をある位置から別の位置に移動させる際の最短手数はいくつなのだろうか? しばらく考えたが、これは漏れの知能レベルでは難題だ。 単純な方法 基本的にヒューリスティックに規則を見いだして場合分けすれば済む話だが、見いだした…

にわか微分幾何学乙

AI

それはそうとして。 前回のエントリのアルゴリズムは間違いで、隣接行列の行を接続数降順で並べるんじゃなくて、まず列をノードの大小昇順で並べた後、上三角行列(左下に0が集中する)にしないと再帰にならんかったorz えらくノイズの多いblogだが、見方によ…

備忘録

etc

ここ数日つらつら考えていた問題についてちょっと前進した気がするのでここに書く。 2つの重み付きグラフ G1=(V1,E1) G2=(V2,E2) が与えられ、両者のノードの和集合V1∪V2の任意の2要素の間に大小関係が定義されているとする(早い話、枝だけでなくノードにも…

C#事始め

C#初心者が最初に学ぶべきことはマネージコード-アンマネージコード間のデータの受け渡しであることは論をまたない。 これを押さえれば、使い慣れた言語で生成した“Hello World!”文字列をC#に持ってきて表示させれは“Hello World!”のできあがりだからだ(何 …

れさぴょん魔改造

AI

局面を列挙する部分に5つのfeatureを盛り込もうとしたら、知能が足りないので丸一日かかった 一カ所Kyokumen::MoveTo()からKyokumen::AddMove()を呼んだとき、本当に正しくピン判定されるのか疑問に思えてしばらく悩んだ 遠回りの論理により結局間違いじゃな…

うさぴょん本

AI

[AI]駒移動型ゲームの局面間距離の評価手法 落とし穴法というものがある(のをうさぴょん本で知った)。 これは、盤上の駒移動に計量の概念を持ち込むことで改良できるはずだ(とっくの昔に誰かが思いついてると予想)。 シュワルツ!(と叫んで逃げる飛び去る局…

探索効率化の天王山・探索の並列化

AI

いったい天王山いくつあるんだYO! つか、探索自重の人なつもりので、これは へーそうれつか、 ぐらいで済まさしてもらおうかな、、

本ktkr

AI

Azomanから本がやっと届いた。 池泰弘『コンピュータ将棋アルゴリズム─最強アルゴリズムの探求とプログラミング』(I/O BOOKS) 松浦健一郎,司ゆき『パズルゲームアルゴリズムマニアックス』(ソフトバンククリエイティブ) 前者はうさぴょんとれさぴょんの作者…

探索効率化の天王山・GHI問題対策

AI

何を言っているのか(ry GHI問題については下記に詳しい説明がありますん↓↓↓ ttp://www.fun.ac.jp/~kishi/pdf_file/kishimoto_gpw2004_paper.pdf つか漏れは今のところコレしか読んでいない(何 GHI問題まとめ 深さ優先探索である手筋aが導かれる過程(深さ方向…

2009-10-29追記

『コンピュータ将棋アルゴリズム─最強アルゴリズムの探求とプログラミング』の著者名が間違ってたので修正しました。

反復深化に向かって

AI

αβ探索(またはdf-pn探索)において枝のカットを効率よく行うには子ノードの列挙順序が重要だ。 特に反復深化させる場合、第k回目の反復において深度d毎にαβ幅極小だった子ノードを記憶しておいて、第k+1回の探索(最大深度を第k回より増す)で深度dに達したとき…

df-pn探索のコード

AI

ようわからんが、df-pn探索アルゴリズムをC++で書き下してみる。 基本形(?) 多分こんな感じ…? #include <limits.h> class Node { public: void ResetChildNode(); Node& NewChildNode(); Node& NewNullNode(); bool HasValue(); void Dispose(); }; #define INFINITE </limits.h>…

df-pn探索おさらい

AI

df-pnが難しいという声がちらほら見聞されるが、ポイントを正しく押さえればこれはさほど難しくはない。 準備 まず「詰み」(=必至)を自明なものとそうでないものに分けよう。 自明な詰み そのノードの局面を見るだけで判断がつき、子ノードを見る必要がない…

予防線

AI

ここに考えをぺらぺら書き散らしてるのは、誰かが見てるかもと思うと興奮する作業のモチベーションが上がるから好きでそうしているのだが、仮にひょっとしてもしかすると万が一本当に見てる人がいたりしてネガティブなコメントをよこしたりするとモチベが最…

錯誤2

AI

駄目だった。 上の問題を定式化すると n1->n2->n3という遷移でpが勝利した場合、n3において成立した勝利条件は(ここでのゲームの仮定の下では) (セルの空間的範囲)×(その中の駒の種類) として記述できる。 このとき、n1においてどのセルの内容がn3におけるp…

錯誤の代償(適当

AI

昨日のエントリは深夜に書いたせいかほどよく錯誤していたorz いきなり詰み局面から着手して巻き戻そうとすると、話が爆発するのは当然だ。 昨日のエントリで 例えば、ノードn、○の手番でセル(5,5)から(9,5)にかけて ○○_○○と並んだ(「_」は空白)ならその5…

なんていうか、

AI

局面の辞書を書いてみたんですが、コレまともに使えるようにするには、詰みの必要十分条件を求めるルーチンが欲しいっすね… 例えば盤全体は11×11=121セルなのに、6×6セルの範囲内の駒の配列だけで詰みが成立する場合、3^(121-36)=3E40もの無駄な組み合わせに…

ウホッ、いいアイデア!!

AI

よさげなアイデアが浮かんだので、局面Nが詰みか否か判定するという目標は修正しなくていい。 前提 学習すべきパターンの集合が学習の進度依存で変化するような学習システムは学習の挙動が予測し難いので避けるべき。特に今の構想だと集合の中身が入れ替わる…