柯洁和alphago的对决(输了柯洁首战告负AlphaGo)
唐旭 若朴 发自东瑶村
量子位 报道 | 公众号 QbitAI
19岁的柯洁输了。
围棋人机大战2.0版的第一场,双方交锋至第286手棋,执黑的柯洁以约四分之一子的微弱劣势,败给围棋人工智能程序AlphaGo。
全程记录
10:30,柯洁和代为AlphaGo落子的黄士杰博士落座。
10:31,两位选手猜先,柯洁执黑先行。
随后,柯洁在右上角落下第一子,耗时13秒。
AlphaGo在右下角落下第一子,耗时45秒。
柯洁的第一步也被解读为尊重对手。柯洁第二步下出“三三”。这是AlphaGo的常用下法。随后双方开始你来我往。总体而言,AlphaGo落子速度比柯洁明显要快。
第54手,白棋下出一个断。现场讲解的华以刚表示,AlphaGo下棋的效率令人心烦,并认为这将是这盘棋的焦点之一。而柯洁也再次皱起眉头,小长考了很久。
柯洁用时一个小时后,常昊、张璇夫妇代替华以刚、徐莹在现场上台讲解。常昊、张璇上台之后,也再次讲解第54手的断,认为是一个出乎意料的“后中先”。
在国内棋手中,柯洁以下棋速度快著称。而今天柯洁用时约80分钟思考后,AlphaGo才用时约20分钟。双方的差距正在越拉越大。
97手!柯洁下出天马行空的一招。创新工场人工智能工程院副院长王咏刚评价说:“这分明就是两个AI在下棋!讲输赢仍然悲观,但柯洁在人类里足以封神!”
柯洁用时还剩1小时07分的时候,现场讲解的常昊和张璇判断战斗可能要进入官子阶段,而整个盘面柯洁比较辛苦。此时AlphaGo用时还剩2小时20分,大约领先14.5目(仅供参考)。
148手的出现,让观战的网友一阵惊呼,纷纷大呼不理解。
随着比赛的进行,柯洁的表情逐渐严峻了起来。或者用手撑在面部,或者抓住自己的头发,或者悄悄的摇摇头。与此同时,柯洁的耗时逐渐流逝。
柯洁时间还剩大约半个小时的时候,AlphaGo还有两个小时。行至第173手,明显双方都已经进入官子阶段。从盘面上看,如果AlphaGo不出错的话,黑棋的局势要差一点。
“这时可能要靠电力局的同志们了”,有网友笑侃。
在收官阶段,柯洁和AlphaGo相互步步紧逼,屡屡祭出强硬下法。下午2点06分,柯洁又开始一个小长考。
现场讲解的徐莹表示,收官阶段非常重要,她举例说以前的李昌镐经常依靠官子阶段的发挥,半目逆转局面。
192手之后,盘面上似乎已经没有重要的官子了。AlphaGo已经能够“心态平和”的落子了,华以刚表示这说明AI已经对盘面有了相当的自信。
华以刚判断,结果马上出来了。此时,柯洁还剩不到18分钟。
此时徐莹粗略点出白棋目数为:65 8,而华以刚点完黑棋的目数,判断黑棋贴不出7.5目。柯洁应该输棋无疑。
第247手,尽管柯洁落子有点犹豫,但他心里早已明白一切。
在最后细小的收官阶段,柯洁下棋如飞,而AlphaGo在看似不用想的时候,反而落子仍然非常谨慎。
单官阶段,柯洁一直坚持走完,没有轻易认输。
哈萨比斯:这不是人机大战
首日比赛之前,现场还举行了一个简短的开幕式。桐乡市委书记,国家体育总局棋牌中心主任、Alphabet执行董事长施密特、DeepMind创始人兼CEO哈萨比斯等先后致辞。
以下是量子位整理节选的部分发言。
△ 施密特
施密特:
非常高兴回到中国,中国对我来说意义非凡。这是一个珍贵的机会,可以打造一个更美的世界。去年我在韩国就说,不管胜负如何,人性终将获胜。电脑有自己擅长的事情,人类有自己的专长。
我们处在人工智能的时代,我们相信这能打造更好的生活,我们所面临的各个领域都有很多未解之谜,科学家通过人工智能,可以做到更多的事情。
这是一个伟大的围棋赛事,天才的选手和团队与AlphaGo对战,可以认为是人机合作时代的开启。
非常感谢今天你们能允许我们来到这里。
△ 哈萨比斯
哈萨比斯:
我对未来几天的比赛充满期待。我们非常感激中国围棋协会、体育总局、桐乡政府等帮助我们如期举行人机大战。柯洁是一个真正的艺术家,天才式的围棋选手。这场对弈将开启围棋界的下法新天地。
这次峰会的宗旨,是在世界最深奥、美丽的棋盘上,探索新的下法。可能再过一万年,我们也无法穷尽围棋的下法和定式。围棋变化繁多,非常神秘。
三年前,我们想也许人工智能有足够的能力下围棋。AlphaGo不是一个预编程的围棋程序,而是采用人类相似的方式进行学习。
一年半前,我们与樊麾进行对弈,现在樊麾也加入了我们。AlphaGo以人类无法想象的方式下围棋。一年前我们和李世乭进行了对局,我们也为之感叹。今年一月,我们给他取名“Master”,并在网上取得60连胜的成就。
这不是人机大战,而是人使用电脑发现新的奥秘和知识。和哈勃望远镜一样,探索宇宙,AlphaGo就是新的哈勃望远镜。
AlphaGo可以用在其他领域。我们相信在制药、医疗领域,都可以借由人工智能解决,帮助专家取得更大领域的突破。
希望通过未来与人类专家的合作,找到各种创新的方式。希望探索有新的创新,也希望AlphaGo在其他领域有新的突破。
最后我们想对围棋界表达深深的谢意,这已经超过我们最初的想象。希望能探索新的下法,我们最终的目的不是谁赢,因为最终的胜利属于人类。
我们希望在座的各位能一起探索围棋的真谛。我祝柯洁好运。
9时40分,柯洁上台参与活动,然后离场准备稍后的比赛。
决战前夜:柯洁不眠
昨晚23:15:44,柯洁在微博上发出《最后的对决》一文,字里行间都透露着这位少年天才的焦虑和骄傲。以下是《最后的对决》全文:
决战前夕,感慨万千…
在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:
无论输赢,这都将是我与人工智能最后的三盘对局
很多人可能会问为什么?
其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了…我相信未来是属于人工智能的。
可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言…它的热情——也只不过是运转速度过快导致CPU发热罢了。
我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这…最后一次…
拼尽全力后,无论结果…管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到…
不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。
相比于柯洁的心情复杂,阿法狗这边似乎显得颇为轻松。
DeepMind创始人兼CEO哈萨比斯,昨晚才抵达。而对于第二天一早就要打响的比赛,他的态度是:“我都等不及了”。
AlphaGo简介如何进行训练?
一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。
为了应对围棋的巨大复杂性,AlphaGo采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。
然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。
这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。
如何决定落子?
在获取棋局信息后,AlphaGo会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。
在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为AlphaGo的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。
【完】
招聘
量子位正在招募编辑记者、运营、产品等岗位,工作地点在北京中关村。相关细节,请在公众号对话界面,回复:“招聘”。
One More Thing…
今天AI界还有哪些事值得关注?在量子位(QbitAI)公众号对话界面回复“今天”,看我们全网搜罗的AI行业和研究动态。笔芯~
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com