将棋ソフトにおけるイノベーション/知的生産の方法(58)
電王戦は、将棋ソフトとプロ棋士が正式に対局するということで注目を集めた。
「人間VS工知能」という興味である。
第2回電王戦は、将棋ソフトの圧勝であった。
⇒2013年4月 4日 (木):佐藤可士和さんの「キレ」と「コク」/知的生産の方法(46)
⇒2013年5月 5日 (日):将棋ソフトの進歩と解説ソフトの可能性/知的生産の方法(52)
将棋ソフトが一気に人間の強さに近づいたのは「Bonanza」の登場によってであるといわれる。
「Bonanza」の開発者は、保木邦仁さんという化学反応の専門家だ。
将棋が格別強いよいうわけではない。むしろ、定跡や形勢判断にさほど明るくないことが、「Bonanza」にそれまでの将棋ソフトと「次元が違う」強さをもたらしたらしい。
「Bonanza」は、それまでの将棋ソフトのレベルを突破しイノベーションを起こした。
将棋でいえば、今までの「定跡」を破って新しい「定跡」を編み出したことに相当するのであろうか?
「Bonanza」の開発については、保木さんと渡辺明九段の共著『ボナンザVS勝負脳―最強将棋ソフトは人間を超えるか』角川oneテーマ21(2007年8月)に詳しく解説されている。
渡辺九段は、永世竜王の称号を持ち、ポスト羽生世代を代表する人と言われている。
初心者だった保木さんは、2つの新規性のあるアルゴリズムを採用した。
「全幅探索」と「評価関数の自動生成」である。
「全幅探索」というのは、「選択探索」に対比される言葉で、1手ごとに指せる可能性のある手をシラミ潰し的に検討するという方法である。
チェスでは常識になっている方法だそうであるが、将棋では探索する対象となる「場合の数」が膨大すぎて効率的ではないだろうと考えられていた。
そこで、将棋ソフトでは、なるべく効率的な「選択探索」、つまり有効な手をいかに選ぶか、ということに主眼が置かれていた。
人間の将棋上達法に倣ったのである。
人間は、基本的には「選択探索」を洗練させていくことによって上達していく。
将棋ソフトの開発も、この人間の上達法をいかに真似るか、に主眼が置かれてたといえよう。
「Bonanza」は(というよりも保木さんは)、そこを「逆転の発想」で突破したというわけである。
もう1つの「評価関数の自動生成」の「評価」というのは、局面の評価ということである。
言い換えれば、ある局面になったとき、有利なのか不利なのかという情勢判断である。
今までの将棋ソフトは、棋力の強い開発者が、どう評価するかをアルゴリズム化していた。
ところが、保木さんは、さほど棋力のレベルが高くなかったので、過去のデータから1手ごとに評価するという方法を採用した。
過去のデータというのは、6万局の棋譜である。
こうすることにより、局面ごとに評価し直すことになって、臨機応変に判断ができるようになったというわけである。
人間には6万局の棋譜を暗記することは不可能である。
そう考えれば、それでようやくプロ棋士並みの棋力に近づいたということだから、逆に人間の能力の高さに驚くべきだろう。
しかも、将棋ソフトは、将棋においてはプロ棋士並みの棋力を持っても、チェスや囲碁は打てない。
大局観、構想力、新規な発想をもたらす柔軟性などは、人間に叶わないと考えられる。
| 固定リンク
「書籍・雑誌」カテゴリの記事
- 藤井太洋『東京の子』/私撰アンソロジー(56)(2019.04.07)
- 内閣の番犬・横畠内閣法制局長官/人間の理解(24)(2019.03.13)
- 日本文学への深い愛・ドナルドキーン/追悼(138)(2019.02.24)
- 秀才かつクリエイティブ・堺屋太一/追悼(137)(2019.02.11)
- 自然と命の画家・堀文子/追悼(136)(2019.02.09)
「思考技術」カテゴリの記事
- 際立つNHKの阿諛追従/安部政権の命運(93)(2019.03.16)
- 安倍トモ百田尚樹の『日本国紀』/安部政権の命運(95)(2019.03.18)
- 平成史の汚点としての森友事件/安部政権の命運(92)(2019.03.15)
- 横畠内閣法制局長官の不遜/安部政権の命運(91)(2019.03.12)
- 安倍首相の「法の支配」認識/安部政権の命運(89)(2019.03.10)
「知的生産の方法」カテゴリの記事
- 『日日是好日と「分かる」ということ/知的生産の方法(182)(2019.01.02)
- 祝・本庶佑京大特別教授ノーベル賞受賞/知的生産の方法(180)(2018.10.02)
- この問題は、本当の問題です/知的生産の方法(179)(2018.09.13)
この記事へのコメントは終了しました。
コメント