文章来源:找借口安静公众号
原址:http://mimura15.jp/?p=2754
原题:AlphaGoZero登場&棋譜感想
作者:三村智保
日期:2017年10月19日
2017年10月18日,AlphaGo的最新版本被发表出来了。
据说最新版本没有给它导入任何棋谱,完全让电脑从零开始学习围棋。
在此之前我非常期待DeepMind会开发什么新的程序,但是因为退役使我打了退堂鼓。
然后它呈现给我们到内容也非常震惊。
论文上说,新版AlphaGo仅用了三天时间,实力就超过了2016年3月战胜李世石版本的初代AlphaGo。
之后,再第40天的时候,把当时最强的AlphaGo Master击败了。
2017年5月,以压倒性优势击败柯洁九段并宣布退役的AlphaGo,在此之后依旧在幕后进步程序。
我们可以想象自我进行强化的现实,但是只教它简单的规则后让他自我对局,并且只用了40天就超过了所有人。我对这样几乎无法成为现实的事实面前,感到非常惊讶。
我从几盘被公布的棋谱里,选出3盘明显看到程序成长的棋谱,进行简单的解说。
第一局
看到第一手的时候以为这是最好的第一手棋,但是看到后面,才知道这个棋谱是AlphaGo Zero刚刚开始自我对局的棋谱。
或许围棋之神刚开始也是这么下棋的。
第二局
刚开始都下在了星位,而且还有点三三的下法,这个时候已经有相当的实力了。
第三局
这个时候AlphaGo Zero的棋已经很难判断有多强了。本以为这已经适最强版本了,但是这只是自我对局刚开始第70小时的时候,或许已经超过了对李世石的版本。
我还看了几盘吊打Master的棋谱,不过之后每一盘棋的布局,它们都是从角上开始行棋的。
然后程序的中后盘,和人类棋手所说的“棋理”感觉也没有差得很离谱。
程序从零起步,仅通过自我学习就发现了拥有长久历史的定式手顺,甚至还演变出了程序原创的定式。
还有一点,虽然没法确定,但是我们可以知道的是,AlphaGo Zero的计算力非常惊人。
AlphaGo Zero可以把战胜柯洁九段的AlphaGo完胜,或许计算力的差距吧。
我想在不久的将来,会有很多著名棋手研究AlphaGo Zero,期待他们对它的评价。
我也在看着棋谱的同时,期待棋手们的评价。