2011-11-01から1ヶ月間の記事一覧
自明。 明らか。 事実。 学習効率が棋譜からの学習に多分敵わない。少なくとも勝敗(つまり完全ゲーム木の末端の状態だけ)を報酬とするやり方は、学習途中のコンピュータープレイヤー自身が実際に終局までプレイしなければ学習が進まないから学習サンプルの…
自明。 明らか。 事実。 学習効率が棋譜からの学習に多分敵わない。少なくとも勝敗(つまり完全ゲーム木の末端の状態だけ)を報酬とするやり方は、学習途中のコンピュータープレイヤー自身が実際に終局までプレイしなければ学習が進まないから学習サンプルの…