モンテカルロ法とキラームーヴの併用を実験してみた

 モンテカルロ法で1~3手間引いて探索すると速いが弱い。そこで原始的ではあるがモンテカルロ探索以前にランダムムーヴからキラームーヴ(駒取り)になったように、キラームーヴを間引かないモンテカルロ探索というのを面倒だが実装してみた。

 三手読みでも爆速だ!これはすごい!と思って指していたのだが、終盤アツくなると相手玉を詰ませるのではなくタダで取れてしまい、手ごたえが無かった。王手局面周りと詰将棋は別の関数で判定する必要が前々から思っていたが、いよいよやるか。

 いや、面倒だから今まで通りの三手読みに戻して今日のコーディングとテストは終了とした。以下戻してちゃんと治っているけどテスト対局で人間が勝ってしまうの図。

 何にしても、指し手が速いのは正義だと思う。正しい手を判定するために探索を全幅にして待つということをしているわけだが、それでも三手の範囲では負けてしまうわけで、では何手読むと正解かという所が見えないまま、ある局面の5手から7手を待つということを繰り返した学習界隈が優勝を1回取ってはいるものの、それでも満足というか将棋の全解明には至らなかった(また負けたので)

 まあ、そんな簡単に解決しないものだから人間が将棋でコンピュータに勝ったということが過去のニュースになって、面白そうだからやっているうちにヒトの手柄ではあるが「もうプロ負かしたよ」「プロも検討にコンピュータ使ってるよ」ということで、サッサとその手法を学びなさいというところで、ぼちぼちやっている成れの果てです。

 将棋は昔から強いソフトの方がよく売れると言われていると読んだ事があって、強くしたら売れるのかナーといっても「やねうら王」何本売れたんでしょね?企業秘密だとは思うけど、将棋ベーシック改のDL数が2000くらいだった時に商談をもちかけてやねうら王をOSSではなくCDに焼いてパッケージに詰めたら2000くらい出ませんかね?と。そうこうしている間に話だけがどんどん進んで1本1万円で1000本出たら1000万円ですよ!「1000本も出るのか?」「いや100本くらいにしておいたほうが」「そんなんプレスにかけるなら100も1000も変わらないんじゃ?」「良いんですか?やねさんの部屋が在庫のやねうら王で満杯になっても・・・」

 うーん、どう考えてもやねうら王はゴーヤマン。NHK朝ドラちゅらさん再放送も本放送も見ていない人は人の失敗をみて勉強しようさねー。俺しーらねっ!と。


🄫1999-2025 id:karmen