補足

AI

もちろん非探索ベースの学習手法（次手からいきなり最適政策の獲得に動くような）の時間効率と、探索ベースの学習手法（探索を挟んで問題を簡単にした上で学習にかける（またはDPに持ち込む））との時間効率の違いまで同一視するつもりはなくて、速くなった…

2010-05-25

Tree Strap Search読んだ

AI

3日間フルタイムで取り組んでようやく読み終えたorz語るべきことはあまり多くない希ｶﾞｽ、、 RootStrapやTD-Leafより対戦者の強さに鈍感であるとする根拠が不明確これについては後で書く Figure 2のグラフの続きを見せて欲しい TreeStrapがレーティングが頭…

2010-05-22

超訳！Tree Strap Search

AI

現実逃避したくなることがいっぱいだから現実逃避してみた。ここの超訳。無許可でしかも途中までで訳したより先は全く読んでないというおまけつき。ゲーム木探索結果による探索ブートストラップ手法 Joel Veness, David Silver, Wiliam Uther, Alan Blair(…

2010-05-20

5月末までに完成させましょう

AI

(ry

2010-05-20

合○アルゴリズムの件について

AI

独立して設計・製造された探索プログラムが行う探索において、評価値への誤差の乗り方はそれぞれ異なる傾向を有するハズ。それでも最善手が一致したなら、それは評価関数の誤差に対して感度が小さい手だったから、というのがありそうな説明であり、だとすれ…

2010-05-20

最善手の誤差感度と共謀数

AI

相変わらず固定深さまでの探索で考える。探索のルートノードはORノード（自己手番）である。探索の末端ノードもORノードに揃えたとする。前々回のエントリで固定深さまでのmin-max探索において無限に高精度な評価関数の存在を示せたから、この線からまず入…

2010-05-07

真打ち！モンテカルロ将棋

AI

といってもごく単純なアイデアだる昨日は、自己手番のノードa（ORノード）の子の1つa'選んで評価値をかさ上げするには、その子から到達する探索の末端ノード全てについて、評価値を等しくかさ上げするのだと言った。そうすればa'の評価値は間違いなくかさ上…

2010-05-07

山無し意味無しオチ無し（本日もGMA0BN平常運転ちう）

AI

昨日書いた評価関数構成法と称するものは、ノードaからゲーム終局まで連鎖する真の最善手の系列一式を要求するが、そんなものがわかっているならわざわざ評価関数を構成してmin-max探索を行うまでもないorzフーリエ変換云々は、保険としてのモンテカルロ法将…

2010-05-06

「評価関数の精度」再考

AI

この連休中において、評価関数を10倍速にすることに成功したから複数コア動員で置換表の助け無しに50万NPSぐらい逝ける気がする目処がたったそれはそうと、今日は、2chの某スレで煽ったり罵ったり怒鳴り合ったりしてるうちに気づいたことなどを書くこいつ…

2010-05-06

「!!!!」≠「!」

AI

省略しちゃ、ｲｶﾝ

2010-04-06

はあ、、

AI

まあ生きてりゃもう一回ぐらいやれるさ…

2010-04-01

解決しますた！

AI

某ｽﾚより生駒(成ってない駒)は移動元が敵陣の場合、禁手で無い限り移動先を問わず「成」も「不成」も選択できる。よってリンク先の局面の場合９一飛は「？？飛成」で16手、「？？飛不成」で16手、５三角は「？？角成」で1２手、「？？角不成」で12手、 …

2010-04-01

FAQ Ver.2

AI

Q1. 早く動くブツ見せてよ A1. It's a showmanship.Q2. 間に合うの？ A2. Trust me.

2010-04-01

ついで

AI

2月の頭ごろに公開デバッグしたTelexクラスにはさらに深刻なバグがあった氏にたい|||｡n_ ↓Receive()の中をこんなかんじみたくしてnb==0になるのを避けないと、待ってる間回り続けてCPU時間を消費するという、、orz // 読み出す DWORD nbMax = bufSz - wp; //…

2010-04-01

最多合法手局面の合法手の数をうちのプログラムで数えたら565手だった…！

AI

最多合法手局面の合法手の数が593通りだというのでうちのプログラムで数えたら565手だったorz ただ、これはたまたまであってバグではない木がするけど、、ひょっとして、プログラムよりもGMA0BN自体の深刻なバグの兆候…？【内訳】持駒_桂_(63-4)x1=59 持駒…

2010-03-13

ＦＡＱ

AI

A. 進捗は？ Q. も(ry

2010-03-13

妄言は一時の恥(多分

AI

およそ1年にわたりカテゴリー:AIで妄言を書きまくってきたわけですが、その集大成を文書にしました！→ここ文書も完成したことだし、あとは実(ry■2010/03/15 00:1200:38追記文書の2.4.項後半を修正してv.3v.4としました。(方式の有効性について説明を追加。)

2010-02-07

ボゾビット大量フリップ--俺がボゾビットだ！

programming

CSAサーバプロトコル ver.1.1.3を読みながらログイン→対局→ゲーム終了の流れを書き下していっていくつか疑問が残った。CSAサーバプロトコルを正しく解釈するクライアントの実装は実はﾑｽﾞいといわざるおえないサーバからLOGOUT:completeが送られてくるタイ…

2010-02-07

まじめふまじめ--俺がまじめふまじめだ！

programming

昨日のEchoサーバーもどきのサンプルはVS2008でWin32 コンソールアプリケーションとしてビルドして一応動作したのだが、流れでReleaseビルドでしかテストできていなかったのでDebugビルド時に起きる不具合を見逃したorzCSocket::Create()からMFCの初期化依…

2010-02-06

公開デバッグ、

programming

上のEchoサーバもどきにCSAプロトコルのGame_Summaryを256個ほど連続で送りつけてみてわかったのだが、計8448行のうちの最後の数行を読み込まないままエコーバックを中断し、次の入力があるまでそのままになってしまうバグをﾊｹﾝすたorzこれは、nb == 0でslvS…

2010-02-06

自分よりまず他人を疑え(ﾏﾃ

programming

ソケットを使ったプログラミングなどやったことがない反面、通信相手が送ってきたものを全部チェックするようなゴージャスな通信プログラムを作りたい、というわけでhttp://www.computer-shogi.org/protocol/WinSample07Jan.lzhを参考にせんとす(ry (48時間…