企业培训资讯_企业培训干货

当前位置:首页 > 核心课程

揭秘新版AlphaGo,为什么它能战胜柯洁?|乐虎游戏

发布时间:2021-04-19    来源:乐虎游戏99091

本文摘要:告诉Google不会分享,但是不告诉就不会那么慢了。

乐虎游戏

告诉Google不会分享,但是不告诉就不会那么慢了。虽然只有1/4的孩子,但是AlphaGo昨天对柯洁稳健的打法已经显示出了强大的实力。DeepMind创始人兼首席执行官戴密斯哈萨比斯(左)和首席科学家大卫西尔弗(右)今天上午,中国——乌镇人工智能峰会论坛象棋峰会的另一个亮点开始了。

我也是第一次回到现场。第一批发言人不是别人,正是创造了棋手人工智能AlphaGo的两位关键人物:DeepMind的创始人兼首席执行官戴密斯哈萨比斯和DeepMind的首席科学家大卫西尔弗。哈萨比斯和西尔弗在一段时间的演讲中,分别阐述了AlphaGo之所以能取得现在的成绩的原因,并收集了大量Go内人士的评论。但最意想不到的是AlphaGo最新版本的披露。

AlphaGo高手:世界上最弱的电脑棋手还在想今年年初什么版本的AlphaGo和高手一起在对手狐狸平台上赢了60个职业棋手。在大卫西尔弗(David Silver)展出的PPT中,专门提到了AlphaGo的三个头衔:AlphaGo范(对抗范辉的版本)、AlphaGo李(对抗的版本)和AlphaGo大师(驾驶大师的版本)。这三个名字相对于V18/V20的流行版本更容易解读。两者的主要区别是棋艺水平。

谷歌还展示了三位玩家的ELO评分:2015年10月出道的AlphaGo粉丝评分约为2900分,2016年3月出道的AlphaGo Lee评分约为3700分(李时珍本人目前为3530分)。今年年初亮相的AlphaGo Master评分已经回到了4800分左右。考虑到世界第一人柯洁没有3625分,谷歌在AlphaGo Lee和AlphaGo Master之间也获得了——3的参考号。

现场目睹这个差距后,柯洁本人忍不住在微博上公开表达自己的感受:我已经听说了新alphago的实力.但是.让.让三个?我的天,这个差距有多大?很简单的解释就是一个单手轮流的玩家,输了倒计时,让你走下三步.就像武林高手决斗让你再砍三刀.我输给了一场多么可怕的比赛.值得注意的是,评分的价值本质上是通过一系列比赛的胜负来确认的。这个值在没有胜败的情况下更准确(强弱都有参考值)。

但在AlphaGo Master顺势之前,他面对的是连续60盘的职业棋手,成绩大概没有超过现实水平(世界上没有封顶)。(微信官方账号:)昨天我也在朋友圈提到了三联生活周刊科技记者的相关观点,就是要告诉大家最新版本的AlphaGo远不止人类有多厉害,这大概是唯一能证明的方法。当然,这三者在设备和操作上都有很大的不同。以下是根据场地布置非常简单的表格。

没有人会对这里的认可感到惊讶:从50个TPU到1个TPU,谷歌是在逆天吗?这个想法本质上是错误的。原因是AlphaGo大师本质上是AlphaGo Lee肩上的站。为什么AlphaGo大师的实力和AlphaGo Lee关系密切?如果要分阶段的话,AlphaGo Fan和AlphaGo Lee在本质上可以分为同一时期。

两者总体算法架构相同:“深度自学蒙特卡洛搜索树增强自学”。或者你可以解读为初中生和高中生的差异。

范辉的版本在数据积累和算法细节规则上没有打磨到极致,而后者则相当极端。到了AlphaGo Lee,本来就指出“棋手人工智能的障碍”——有太多的可能性让棋手穷尽地寻找一个合适的解决方案,这个已经解决了。

相当可观的棋手间蒙特卡洛搜索树根,谷歌在本质上发现了两个“懒”的方法:第一,在扩展下一步计算时,只指深度自学做出的人掉选项。(人类不出地方就不算。)二是估值网络。

一步一个脚印的摔下去,结果是无法计算的。因为随着预测步骤的快速增加,蒙特卡洛搜索树中必须计算的内容不会呈指数下降。

于是AlphaGo推出了评分系统。没有一个地方是百分百失落的,但是这个地方比其他地方好。

经过这两步横向和纵向的精简,AlphaGo达成了一个完全不可能完成的任务,——,在去年三月的比赛中击败了李师义。但是,除了最终的结果之外,AlphaGo在那场比赛中的少数派在某种程度上表现出了一点关注:往往有一些人类确实有问题的棋局;在第四场比赛中,当李师义成为神之一时,他的估值网络再次像悬崖一样波动。

这无疑反映了AlphaGo Lee本身的不成熟。那么如何才能更上一层楼呢?与之前“AlphaGo中的人类元素几乎被抛弃”的猜测不同,谷歌使用了更为稳定的路——创建了全新的神经网络,并在AlphaGo Lee的基础上开始了第二次“自学”,极大地记录了自学所学到的东西。

这也让AlphaGo Master显得比AlphaGo Lee更加细致稳重。这也是为什么AlphaGo在昨天三钱棋第一局结束时并不总是害怕柯洁的进攻,只使用最巩固的策略。当然,其他的疑惑依然不存在。比如AlphaGo Master是如何依靠单个TPU完成整个游戏的?AlphaGo大师在比赛中需要AlphaGo Lee的协助吗?另一方面,谷歌最终并没有自由选择“抛弃”人类,这最终解释了人类棋手2600年的历史并非没有解体。

可能算。真是奇妙的小悲伤。AlphaGo vs Ke Jie的下一场比赛,以及本次象棋峰会更好的内容,如果没有注意到的话,也会给你带来第一手的报道。允许禁止发表的原创文章。

以下是发布通知。


本文关键词:乐虎游戏,乐虎游戏电子

本文来源:乐虎游戏-www.baseballurns.com

分享到:
乐虎游戏-河北2队1天之内主帅全要换?球迷曝宫磊抵达石家庄 乐虎游戏_李学鹏左后卫三大接班人已浮出水面!一人深受里皮器重将挑大梁
热门文章
乐虎游戏-河北2队1天之内主帅全要换?球迷曝宫磊抵达石家庄
乐虎游戏_李学鹏左后卫三大接班人已浮出水面!一人深受里皮器重将挑大梁
乐虎游戏电子:球员被逼上派出所讨薪 大连球员致信足协:球队欠薪2年 已超700万
“有偿补课”“高烧”不退|乐虎游戏电子
乐虎游戏-河南理工学子专访焦作大学生创业之星王亚芳(图)
平顶山教育学院师生为白血病学生捐款-乐虎游戏
郭布罗氏现在还有吗,-乐虎游戏
【乐虎游戏电子】历史真实的诸葛亮,历史上真实的诸葛亮北伐全过程。
乐虎游戏:顽皮狗发布《最后生还者2》新剧情预告 乔尔现身、大量新画面曝光
专利纠纷和解两月后,苹果重新上架诺基亚健康配件
快手被搭讪四川最美网管熙熙ID恶搞成都最美网管微博账号名
南非网球名宿鲍勃·休伊特因强奸罪 被判入狱六年|乐虎游戏电子
乐虎游戏_浙江绿城逆转收获第一个3分 想要冲超任重而道远
乐虎游戏电子-南水北调公民大讲堂暨渠道防溺水安全知识宣讲走进九重镇渠首朝阳小学
乐虎游戏电子|经典润童心诵读伴成长
客户案例
×