思うだけで学ばない日記 2.0

思うだけで学ばない日記から移転しました☆!よろしくお願いします。

2011-01-01から1年間の記事一覧

置換表の現代

置換表は腐った建物であって真実の扉を一回蹴れば崩れるのだが(←何を言っているのかわからないどうもその扉の前には雑草wwwwwwwwwwwwwwwが生い茂り、見通しが極めて悪くなっているようだwwwwwwwwwwwwwww雑草とは次のようなも…

強化学習がダメな10の理由

AI

自明。 明らか。 事実。 学習効率が棋譜からの学習に多分敵わない。少なくとも勝敗(つまり完全ゲーム木の末端の状態だけ)を報酬とするやり方は、学習途中のコンピュータープレイヤー自身が実際に終局までプレイしなければ学習が進まないから学習サンプルの…

お前、頭、奥ゆかしいだろ?

AI

第二のNB0AMGの方法を実装して動作させて検証すた、置換表サイズ12.5Mエントリ、探索条件は深さ2手から6手まで+1手づつの反復深化、前向き枝狩無し これで1000手分、一切クリアせずに通して思考させたが、l/bがlower>upperとなる矛盾は検出されなかった 使用…

Keep it clean.

AI

置換表の矛盾について、一昨日までは単純に後からやってくるlowerBoundかupperBoundが絶対に正しい!(なぜなら、後の方が探索の深さNが大きいから)、と単純に思っていたのだが、そうとは言い切れず(すわなち実は探索一発の中でも矛盾が生じ得り)、しかも…

置換表は反復深化と組み合わせると一層不安定化する…国家も同じだ

AI

何ていうーか、一昨日のエントリは、反復深化の際、置換表を成長するままに放置すると置換表に矛盾が生じることがあるという最終結論には修正の必要は認められないものの、途中の論理が例によって怪しさ炸裂だったorz 1 まず、T'がβカットされないときtが置…

置換表はいろいろなことを教えてくれるかもしれない…例えば人生とか

AI

今日おのエントリはGMA0BNが経験した狭い範囲のことがらをGMA0BNが怪しい思考能力でもって無理矢理説明することを試みるものであって*1、間違っているか、あるいはとっくに広く知られていることであって、どっちにせよ現実のコンピューター将棋プログラムを…

PV表示はいろんなことを教えてくれる…かもしれない

AI

記憶モードだがWikipediaのネガアルファ法のページにはこんな感じのコードが載っていた。 これは評価値しか出力しないが、正しく動く template<int end_ab> int NegaAlpha(int rdepth, int alpha, int beta) { EnumContext& node = nodes[rdepth]; if (rdepth <= 0) { in</int>…

ぼくの考えたKPPの理論(1)

AI

まず前置きとして、3駒間の関係は任意の3駒で考えるとかえって駄目だる。たとえは歩と金と銀の3駒を攻めに使っているとして、それらが同じ相対位置関係で盤の一角を占めても、相手の王将から近い場合と遠い場合とではぜんぜん勝利への寄与が異なることが明ら…

2人兄弟姉妹のもう一人が女の子である確率

以下標本空間を記号Ωで表し、その要素eの確率をP(e)と書く。2人兄弟姉妹がたくさんいるの中から1つをランダムに選んだ時点の(事象の生起を記述する)確率空間: Ω_1 = {初期事象} = { 姉妹, 姉弟, 兄妹, 兄弟 }, ∀e∈Ω_1: P(e) = 1/4 (とみなす) で、2通り…

モンティーホール問題

以下標本空間を記号Ωで表し、その要素eの確率をP(e)と書く。とした上で、3つのドアA,B,Cのうち、外れのドアを小文字で書くとしよう。ドア提示時の(事象の生起を記述する)確率空間: Ω_1 = {初期事象} = { Abc aBc abC }, ∀e∈Ω_1: P(e) = 1/3 (とみなす) …

【生存〜】3囚人問題【戦略〜】

以下標本空間を記号Ωで表し、その要素eの確率をP(e)と書く。とした上で、3人の囚人A,B,Cのうち、処刑される2人を小文字で書くとしよう。特赦される囚人が決定された時点の(事象の生起を記述する)確率空間: Ω_1 = {初期事象} = { Abc, aBc, abC }, ∀e∈Ω_1:…

【何の】地獄巡りツアー!!!【罰ゲームだ?】

AI

USIに対応すた、*1 USI超クールっすね 特に予測読みの処理手順がプロトコルに内包されてるところとかσ(・∀・)σ それより前の実装では思考部は評価値と最善手のみ出力すれば十分であるという妄信に基づき思考部と置換表を作成して*2、予測読み処理まで好きに…

『もしドラ』はマジキチ(超意訳

ライト読者 みなみと『マネジメント』との遭遇は、 転校初日に遅刻しかけた主人公が道の曲がり角で食パン咥えて走ってきたヒロインと衝突してご対面、とか ミディアムブラックホールが太陽めがけてピンポイントクラッシュでまあビックリ、みたいな よくある…

神への長い道

540 名前: 名無しは無慈悲な夜の女王 [sage] 投稿日: 2011/07/30(土) 10:41:57.76 >>539 新しいものなんでもかんでもの話をしているわけじゃないし 煽りにしても湿気すぎトル 小松左京の基本線は科学文明マンセーのオプチミストだが(少なくとも1990年代以前…

楽しい楽観合議

AI

昨日のエントリの最後の発言にはちょっと補足が要る。神のごとき評価関数が実現されれば合議は死ぬかもしれないが、それはそういった評価関数の表現方法として合議以上に簡便なやり方があった場合に限られる。さて今ネットでは楽観合議>悲観合議という噂で…

今日のGMA0BN

某所に、 傾いた塔 ちょっ、クラスタ化と合議の比較とか意味がわからない あまり詳しく述べるとネタバレになるけど、 クラスタ化は同じ評価関数で大規模探索を仕掛けて勝率を上げる技術っすよね? この根底には、採択した評価関数の精度に致命的な問題がない…

全く公平な二人零和有限確定完全情報ゲームは永遠の引き分け

AI

一昨年のネタの蒸し返し、およびウィキの「ゲーム木」の項に書いてあることをなぞっただけの話になるが、もうちょっときちんと書き直してみるテスト。 全く公平な二人零和有限確定完全情報ゲームすわなち先手と後手どちらにも必勝手順が存在しない二人零和有限…

掃き溜めのチラ裏

AI

ttp://web.econ.keio.ac.jp/staff/ito/pdf99/me99game.pdfに 注意1. 戦略は、戦術や手(move, gambit) とは区別される。将棋やチェスを例にとれば、毎回の 駒の動きがmove であり、ゲームの開始から終了までの各プレーヤーのmove の列(sequence) が戦 略とよ…

ぼくの考えたKKPとKPPの実装(4)

AI

KPPの説明 KPP[PSpec][PSpec'][PPos][PPos'][OUPosB] = KPP[PSpec'][PSpec][PPos'][PPos][OUPosB] = KPP[PSpec][PSpec'][fh(PPos)][fh(PPos')][fh(OUPosB)] = KPP[PSpec'][PSpec][fh(PPos')][fh(PPos)][fh(OUPosB)] ※添字の順序を変更した。アドレスがprinci…

ぼくの考えたKKPとKPPの実装(3)

AI

KPPの利用できる対称性を部分写像に分解して捉えようとするのは筋が悪かったっぽいorz*1 正直、 KPP[OUPosB][PPos][PSpec][PPos'][PSpec'] = KPP[OUPosB][PPos'][PSpec'][PPos][PSpec] = KPP[fh(OUPosB)][fh(PPos)][PSpec][fh(PPos')][PSpec'] = KPP[fh(OUPo…

バグっとるのはお前じゃ!

なんかもう色々すみま千円、orz つ[1000]

ぼくの考えたKKPとKPPの実装(2)

AI

テーブルの空間計算量 テーブルの空間計算量の削減には次の2段階があると思う テーブルサイズの削減 テーブル要素a,bのアドレスをテーブル要素aのアドレスで代表することによってテーブル要素b自体を無くする 実質データ量の削減 テーブル要素a,bの値をテー…

ぼくの考えたKKPとKPPの実装

AI

ネットで見聞きした情報を基にKKPとかKPPのそれっぽいものを作ってみるテスト いきなりパフォーマンスの最適化は考えずに、まずは自然な構成を目指す 定義: OUPos 王将の駒位置を表す変数 OUPosA プレイヤーAの王将の駒位置を表す変数 OUPosB プレイヤーBの…

【すっきり】2^30通りの謎【解決篇】

AI

昨日のエントリはなんかgdgdになってたorz、、 誤:序盤30手 正:31手から90手までの片側30手そして、「一致するのは10億局面に1回」という主張と、実際のソフト指し認定方法はあんまり関係が無い。前者は過去に指された一連の指し手との完全一致を問題にし…

2^30通りの謎

AI

序盤30局面の組み合わせが2^30通り(以上)というのは、「二人」零和有限情報確定ゲームだからそうなる つまり 30手の内半分は相手の手番である(対局者は2名) 非協力ゲームである 対局者の少なくともどちらか一方は、序盤30局面での真のナッシュ均衡解につ…

続☆電波利権

AI

およそPVとは二人零和条件由来の概念なので二人零和条件を満たさない評価関数を前提としてPVを論じたり探索してPVをぞろぞろ表示させてみたりすることは明らかにナンセンスな行為である*1ここで評価関数が二人零和条件を満たすとわ、任意の局面xについて次が…

【Rotated】R7B5P【Bitmap】

AI

王周辺の利き評価の問題は一応対策したが*1この評価関数はやめにしてKKPとKPPにしようっとメモリはKKPとKPPに使いたいので指し手生成はそこそこの速度あたりを目指して少メモリに収め隊、つまり指し手生成ではテーブルを極力引かないということであって、ビ…

正当性はどこから来るのか

AI

しばらく前のエントリで「正当な半順序」とか言い出したとき、正当性は多分十分に強い相手が繰り出す最善手からやってくるのだとぼんやりと思っていたわけだが*1 この説は実験で反証された──相手の手をカナーリ正確に予測できるようになった*2というのにてんーで…

都心駅前の駐車場事情は頭おかしい

車高1.5 mまでとかワゴンRですら停められないYO!日中400円/25分とか破産させる気か、車は駅から離れた現地のコインパークに停めっぱなしで人は駅前のホテル(P無し)からバス移動とするのが比較的経済的っぽい

黒歴史の金字塔

AI

水平線効果とアバウトな学習の不当な局面評価がコンボで襲ってくる/(>o<)\一般に、現局面からN手先に位置する自己手番の局面において、駒xを1手動かしたときの局面評価値の増加幅Δの大きい手があった場合、COMはN手先でその1手を実行するつもりの手を選…