« アベノミクスの危うさ(5)/花づな列島復興のためのメモ(226) | トップページ | 「いき」の構造の「見える化」久保田万太郎/私撰アンソロジー(23) »

2013年6月 5日 (水)

将棋ソフトにおけるイノベーション/知的生産の方法(58)

電王戦は、将棋ソフトとプロ棋士が正式に対局するということで注目を集めた。
「人間VS工知能」という興味である。
第2回電王戦は、将棋ソフトの圧勝であった。
⇒2013年4月 4日 (木):佐藤可士和さんの「キレ」と「コク」/知的生産の方法(46)
⇒2013年5月 5日 (日):将棋ソフトの進歩と解説ソフトの可能性/知的生産の方法(52)

将棋ソフトが一気に人間の強さに近づいたのは「Bonanza」の登場によってであるといわれる。
「Bonanza」の開発者は、保木邦仁さんという化学反応の専門家だ。
将棋が格別強いよいうわけではない。むしろ、定跡や形勢判断にさほど明るくないことが、「Bonanza」にそれまでの将棋ソフトと「次元が違う」強さをもたらしたらしい。

「Bonanza」は、それまでの将棋ソフトのレベルを突破しイノベーションを起こした。
将棋でいえば、今までの「定跡」を破って新しい「定跡」を編み出したことに相当するのであろうか?

「Bonanza」の開発については、保木さんと渡辺明九段の共著『ボナンザVS勝負脳―最強将棋ソフトは人間を超えるか』角川oneテーマ21(2007年8月)に詳しく解説されている。
渡辺九段は、永世竜王の称号を持ち、ポスト羽生世代を代表する人と言われている。

初心者だった保木さんは、2つの新規性のあるアルゴリズムを採用した。
「全幅探索」と「評価関数の自動生成」である。

「全幅探索」というのは、「選択探索」に対比される言葉で、1手ごとに指せる可能性のある手をシラミ潰し的に検討するという方法である。
チェスでは常識になっている方法だそうであるが、将棋では探索する対象となる「場合の数」が膨大すぎて効率的ではないだろうと考えられていた。

そこで、将棋ソフトでは、なるべく効率的な「選択探索」、つまり有効な手をいかに選ぶか、ということに主眼が置かれていた。
人間の将棋上達法に倣ったのである。
人間は、基本的には「選択探索」を洗練させていくことによって上達していく。
将棋ソフトの開発も、この人間の上達法をいかに真似るか、に主眼が置かれてたといえよう。
「Bonanza」は(というよりも保木さんは)、そこを「逆転の発想」で突破したというわけである。

もう1つの「評価関数の自動生成」の「評価」というのは、局面の評価ということである。
言い換えれば、ある局面になったとき、有利なのか不利なのかという情勢判断である。
今までの将棋ソフトは、棋力の強い開発者が、どう評価するかをアルゴリズム化していた。

ところが、保木さんは、さほど棋力のレベルが高くなかったので、過去のデータから1手ごとに評価するという方法を採用した。
過去のデータというのは、6万局の棋譜である。
こうすることにより、局面ごとに評価し直すことになって、臨機応変に判断ができるようになったというわけである。

人間には6万局の棋譜を暗記することは不可能である。
そう考えれば、それでようやくプロ棋士並みの棋力に近づいたということだから、逆に人間の能力の高さに驚くべきだろう。
しかも、将棋ソフトは、将棋においてはプロ棋士並みの棋力を持っても、チェスや囲碁は打てない。
大局観、構想力、新規な発想をもたらす柔軟性などは、人間に叶わないと考えられる。

|

« アベノミクスの危うさ(5)/花づな列島復興のためのメモ(226) | トップページ | 「いき」の構造の「見える化」久保田万太郎/私撰アンソロジー(23) »

書籍・雑誌」カテゴリの記事

思考技術」カテゴリの記事

知的生産の方法」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 将棋ソフトにおけるイノベーション/知的生産の方法(58):

« アベノミクスの危うさ(5)/花づな列島復興のためのメモ(226) | トップページ | 「いき」の構造の「見える化」久保田万太郎/私撰アンソロジー(23) »