
将棋ベーシック改の最新版に自己対局テストを導入しました。終局までやらせてみようとすると永久ループでどうなっているか分からないので、一手ずつ先後と指させて視認すると、この局面で千日手になるものの、千日手の判定が無く永久ループでした。
そうさね、俺は昔のバカ記事で零和完全情報なんとかゲームが論理的最善手で先手必勝後手必勝または引き分けになるってはなし飲めないで、どんな論理であれ勝ちが最善の論拠なのだから全手の中から論理的最善を定義するあたりが間違っているのではと思ったんだけど、この局面どう考えても王手回避と金得で一歩も譲れず、引き分け以外となるとどちらかが「負けてあげる」しかないように見えますよね。
つまり駒得という論理に従う限り千日手になる局面を、他の論理が見つかるかもしれないから指させてみるという実験は俺が将棋ソフトに関わり始める前からそうだった。
という話みたいですね。ちなdlshogiで解析された最善手にはたややんの水匠で後手有利が見つかったのだとか。まだまだ分からないものではありますが、今日の俺の一歩。
まあ、自己対局で機械学習するといっても今のところ将棋ベーシック改はオートマトンなので、対局結果は毎回一定です。片方をランダムにして他方を学習させるとか、何か工夫しないと自己対局の実験は進みません。どうやって学習とか自己対局の実験に入って行くか、という結構大きめの開発テーマが目の前にやってきました。
ちな現状の自己対局のみを書くのは、以前からコードメンテをしていて、十分くらいで動くようになりました。さあ、これからどうしたもんでしょうか。
まあ、千日手の判定を入れてこの対局を千日手と判定して終わらせるか、それとも回避ロジックを入れるかというのが機械学習以前の次のステップか。賢い人がいると違うな。するべきことをどんどんリードしてくれる。生成系AIもな。まあ、今日は生成系AIの出番を待たずして自己対局まで漕ぎ着けたが。前から作って忘れていたに近いが。
そういや学習した棋譜を格納するDB部分の設計もまだなのであった。それ次な。
てか「いろは改」学習2年回して7位らしいですね。追い抜かれたソフトの開発者ほどのショックではないかもだけど、俺も軽いショックです。気負わずマイペースで行きましょう!
ストIIターボの対戦から入った迷路に将棋から覚えたノイマンのゲーム理論で出口が見つかった感じなんだけど、またMTGですごい迷路に入っちまって疲れた。そういう時はコンピュータ将棋の開発のほうが単純作業で解決する課題が残っていて休まる。
んで、迷路で疲れ果てた脳の病気がお薬とかではなく、本当に一歩ずつ快方に向かっていると思う。考えずに何かに打ち込んでみる時期もあったけど、本当にぼーっとしていると休まってまた考えて、一個ずつほぐれてゆく。メチャメチャ時間かかってるけど、だんだんと心が平穏になって来てる。その傍らには論理学があると思ってるけど、正論に見えたことが真実というわけでも無くて、論拠がどこかにあってそれが入口で、誤った前提を見つけて覆すことで一歩前進する感じです。
まあ、何の話か分からんと思うけど、大多数は子供の頃に受けた親か姉からの不条理です。親父、不条理な説教散々してくれたけど、俺が出て行って実家に戻ってからは父子家庭で俺と弟のメシを用意して姉んちの孫の世話までして、メチャ頑張ってくれてる。けど年だから、ここいらから俺も踏ん張らなきゃと思うと病気だからって甘えてられないと思い始めて少しずつ歩いて進めるようになってきたんだ。
言っても、まだパソコンで将棋とか趣味も良いところの仕事をしているわけですが。
もっかい言うけど、気負いすぎずにマイペースで頑張ろう!
▲ 7六歩
▽ 3二金
▲ 5五角
▽ 4二王
▲ 4六歩
▽ 5一金
▲ 6六歩
▽ 5四歩
▲ 7三角成
▽ 同桂
▲ 1八香
▽ 3四歩
▲ 6八飛
▽ 8五桂
▲ 8六歩
▽ 9七桂成
▲ 同香
▽ 4四角
▲ 4五歩
▽ 3五角
▲ 4四歩
▽ 5七角成
▲ 4三歩成
▽ 同王
▲ 3八飛
▽ 4七馬
▲ 2八飛
▽ 9四歩
▲ 3八銀
▽ 5六馬
▲ 7七桂
▽ 4二金
▲ 6五歩
▽ 3三金
▲ 7五歩
▽ 4二王
▲ 7四歩
▽ 6七馬
▲ 7三歩成
▽ 7七馬
▲ 6八銀
▽ 同馬
▲ 同王
▽ 9二飛
▲ 8三と
▽ 6二飛
▲ 7三と
▽ 6一飛
▲ 8五歩
▽ 2二金
▲ 8四歩
▽ 6四歩
▲ 同歩
▽ 同飛
▲ 5八王
▽ 8四飛
▲ 6二と
▽ 8八飛成
▲ 5七王
▽ 6二銀
▲ 9六香
▽ 8九龍
▲ 5八王
▽ 8八龍
▲ 5七王
▽ 8九龍
▲ 5八王
▽ 8八龍
▲ 5七王
▽ 8九龍
▲ 5八王
▽ 8八龍