当时个人电脑系统刚在世界范围内普及,许多围棋爱好者还专门购买电脑安装“手谈”软件,用作学习围棋和训练的工具,“手谈”软件在世界范围内销售量排名第一。可以说,“手谈”软件的成功在国内掀起了一波围棋人工智能研究的热潮。
“蒙特卡洛树”算法开启二代围棋人工智能
当如IBM深蓝那样的超级电脑,已经能够击败世界上最好的国际象棋棋手时,围棋软件却仍然无法击败业余围棋高手。
但是,从2006年开始,随着应用蒙特卡洛方法的树搜索即蒙特卡洛树搜索和机器学习在围棋上的应用,电脑围棋水平有了突飞猛进的增长,棋力普遍提升到业余高段的水准。
围棋的棋子多,组合可能性也多。蒙特卡洛算法是一种基于“随机数”的计算方法,这一方法源于美国在二战中研制原子弹的“曼哈顿计划”。频率决定概率,围棋对弈软件将最常见的对弈定式及棋形输入其中,从而达到较短时间提高棋力的功效。用通俗的语言解释这种算法:“简单来说,人脑下围棋靠的是逻辑思维,而蒙特卡洛算法就是一个抽样调查的方法。其实就是一个赌博概率式的方法,如果电脑下100盘棋,用这种下法赢了60盘,用另一种下法只赢了50盘,那么,它就会认定第一种下法,而淘汰另一种下法。”
蒙特卡洛树搜索算法的出现,可以看作是人工智能取得突破性进展的标志:计算机的思考方式,已经有点接近人类的思维方式了。目前使用蒙特卡洛树搜索的围棋对弈软件有疯石围棋(CrazyStone)、银星围棋(SilverStar)、天顶围棋(ZEN)等,都取得了不错的成绩。
2011年8月欧洲围棋大会,电脑围棋软件ZEN在19路盘上被让五子击败日本职业棋手林耕三六段。2012年3月,ZEN被让四子击败了日本超一流棋手武宫正树九段,这是围棋程序首次在被让四子的情况下战胜第一流职业选手。2013年,CrazyStone被让四子击败日本石田芳夫九段,2014年,CrazyStone被让四子击败日本依田纪基九段。可见围棋软件进步迅速,至少比起十年前对弈水平已经提高一大截,受让四子优势明显。
2015年10月,同样基于蒙特卡洛树搜索的Google旗下人工智能公司DeepMind开发的AlphaGo,在没有任何让子的情况下,以五战全胜的成绩击败了欧洲围棋冠军、职业围棋二段樊麾,这也是电脑围棋程序首次击败围棋职业棋手,当然也意味着围棋AI新时代的来临。
AlphaGo、绝艺以及人机协作