100:0,新AlphaGo放弃了人类?

作者&投稿:职霄 (若有异议请与网页底部的电邮联系)
~
  • 01

    2017年10月19日,谷歌子公司DeepMind发布了AlphaGo的新版本。很多人知道AlpoaGo是一个人工智能程序,却不知道它其实是一个家族,早期战胜韩国选手李世石的是AlphaGo Lee。在乌镇击败世界冠军柯洁的是AlphaGo Master。本次发布的是AlphaGo Zero(阿尔法零),它经过3天的训练便以100:0的战绩击败了他的哥哥AlphoGo Lee,经过40天的训练便击败了它的另一个哥哥AlphoGo Master。

    AlphaGo Zero与之前版本相比,最大的区别在于,它不再依靠人类的指导来成长,即之前的AlphaGo Lee是依赖于人工录入的大量棋谱来帮助其学习如何下棋,说白了,它是在人的指导下学习,可以理解为是人类千年围棋经验教出的学生。

    而AlphaGo Zero使用了强化学习算法,即不再依赖任何棋谱,编程人员输入围棋基本规则后,不再进行任何教导,完全由其自己进行摸索,总结走棋方法,相当于人工智能完全按照自己的方法学习。AlphaGo Lee完败于摒弃了人类经验的AlphaGo Zero,这说明人类的经验可能误导了AlphaGo Lee,进而限制了它的发展。

    AlphaGo Zero的行棋方式在开局和收官阶段,与人类选手有较大的相似之处,而盘中的行棋风格的确与人类选手和之前版本的AlPhaGo有较大不同,而正是这种不同让其可以在100次与AlphaGo Lee的交战中立于不败,换个说法,如果当初AlphaGo Lee没有拜人类为师,而是向机器学习,那么对于拥有更强计算能力的AlphaGo Lee来说,胜负还未可知。

    除了零经验学习外,AlphaGo Zero的另一大特点是将之前版本AlphaGo的两个神经网络融为一体,在之前版本的AlphaGo上,如何走棋是由“策略网络”和“价值网络”两个神经网络来计算如何行棋的,即首先由“策略网络”利用之前累积的经验,判断在当前棋型下哪些位置适合行棋,之后由“价值网络”对在这些位置行棋后的种种可能进行模拟,计算胜率,最终选择出行棋位置。

    而AlphaGo Zero将二者融为了一体,对之前两个网络的特征提取等模块进行了共用,可以在计算出可能行棋的位置时便给出相应的“胜率”,大幅提高效率,减少了训练所需的时间。这也是AlphaGo Zero在训练了三天就打败了训练了几个月的AlphaGo Lee的主要原因之一。

    人工智能不仅是计算机科学领域发展的制高点,在所有行业都具有无限潜力和应用价值,目前世界各国普遍看好,人工智能技术将成长为下一次技术革命契机。即便最终人工智能没有达到革命级别的颠覆程度,AI已经在逐渐改变我们的生活。

    以往人工智能的进步都是建立在软件与硬件同步发展的基础上,神经网络算法最早在上个世纪中叶就被提出,然而受限于计算能力,神经网络算法一直发展缓慢。

    之后随着硬件计算速度的不断提高,已有的软件算法不断被实现并改进,改进的算法对硬件要求更高,从而进一步促进了硬件的发展,而AlphaGo Zero的出现完全建立在算法更新的基础上。

    前一版本的AlphaGo需要在48个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片,一块成本即达500万美元)上进行几个月学习,而AlphaGo Zero只需要4个TPU加上几天的时间便可完成学习。这种零经验学习能力非常适合在蛋白质折叠和其它缺少样本的医疗领域进行应用,可以很好地解决因缺少试验样本而导致研究进展缓慢的问题。未来的相关研究中完全可以输入规则后利用AlphaGo Zero的能力进行模拟,最后利用有限的样本进行验证即可。

    AlphaGo逐渐升级之路

    故事讲到这里,实在不得不佩服谷歌深厚的技术实力与精明的商业头脑。AlphaGo从诞生伊始,就得到了deepmind团队的精心包装,仔细回想起来,可谓是“城里套路深”。

    从最初战胜低段位职业棋手开始预热或者说炒作,到战胜人类顶尖高手李世石,AlphaGo的登场已经足够华丽。不过4比1的比分还是给了人类一线希望,这仅有的胜局中,李世石剑走偏锋,直接把AlphaGo逼出了“大脑短路”的症状,可见此时AlphaGo虽已经足够强大,但尚不完美。此后各路人类高手开始卧薪尝胆,精研AlphaGo的套路,寄希望于重新捍卫人类尊严。

    随后,一个神秘的“master”在围棋界顶级棋手的对战平台上取得了60胜0负的骄人战绩,这位master到底是何方神圣,是人是妖可谓是赚足了吃瓜群众的眼球。直到华丽的60胜达成,谜底才最终揭晓。

    此后便是吸引了全世界目光的乌镇对决,AlphaGo Master把柯洁打到毫无还手之力。虽然柯洁已经表现出了真正的人类最强者战力,却仍然被AlphaGo完全压制,只要出招有任何一点闪失,立刻会陷入AlphaGo“最小优势胜”策略的陷阱,再无翻身余地。

    乌镇对决之后,人类在围棋领域已经彻底甘拜下风,别说柯洁一人,五大高手联手作战比柯洁输得更快,AlphaGo一时风光无限。

    如今,乌镇硝烟刚要散尽,谷歌又搞了个大新闻出来!人工智能在摒弃人类经验后,用三天时间自学的AlphaGo Zero打败了人类几千年的经验。AlphaGo的进化版打败了原始版,不禁叫人想起《铁甲钢拳》里叫人热血贲张的机甲肉搏,一个AI输给另一个更牛的AI,中国AI战胜美国AI,这很有可能是未来棋类竞技中的真实场景。




alp偏低是什么意思(ALP偏低是什么原因)
ALP偏低是什么原因 原因有:一、生理因素,怀孕期间也有可能出现骨骼发育,这类情况下,骨组织中的碱性磷酸酶非常活跃,有些时候检查结果会偏低,不用太担心。华为alpal00手机怎么样 ARS-AL00是华为畅享MAX全网通版的型号。华为畅享MAX手机很不错的,手机参数如下:1、屏幕:屏幕尺寸7.12英寸,屏幕色彩为...

ALP 文件 是什么,如何打开?
115网盘普通用户允许上传单个文件大小是1G,超过1G的文件就需要把文件分成几段再上传,尤其是视频文件。你可以去下个hjsplit工具把两段视频接起来。把扩展名里的ALP改成00,全名就是001、002,它会自动识别的。hjsplit如果再不会用的话就继续问度娘吧。

alp-al00是华为什么型号 alp-al00的华为型号是什么
alp-al00是华为Mate 10手机。屏幕方面,华为Mate 10采用5.9英寸LCD全面屏,2560*1440分辨率,精彩超大屏,视觉新享受。拍照方面,华为Mate 10后置2000万黑白+1200万彩色像素,f\/1.6光圈,徕卡镜头,支持自动对焦 F1.6光圈, 徕卡镜头,支持自动对焦。前置800万像素,f\/2.0光圈,支持固定焦距。支持光...

华为alp-al00是什么型号手机
华为alp-al00是华为Mate 10全网通版手机的型号,是华为Mate 10(型号:alp-al00)是华为公司在2017年发布的一款智能手机,alp-al00正是这款全网通版手机的型号标识。华为Mate 10(型号:alp-al00)搭载了麒麟970处理器,采用了5.9英寸全面屏设计,支持指纹解锁和面部识别,配备了4GB+64GB的存储容量...

alp一al00是什么型号
ALP-AL00是华为Mate 10 全网通版手机。华为Mate 10手机配置如下:1、屏幕: Mate 10采用5.9英寸LCD全面屏,2560*1440分辨率,精彩超大屏,视觉新享受。2、拍照:Mate 10后置摄像头1200万(彩色)+2000万(黑白)像素,f\/1.6光圈,徕卡镜头,支持自动对焦(激光对焦、深度对焦、相位对焦、反差对焦)...

alp-al00是什么型号
ALP-AL00是华为Mate 20系列中的一款智能手机型号。华为Mate 20系列作为华为旗下的高端旗舰产品,凭借其出色的性能和创新设计,在全球范围内赢得了广泛的关注和好评。ALP-AL00作为这一系列中的一员,自然继承了Mate 20系列的诸多优点。它可能搭载了华为自研的麒麟处理器,为用户提供强大的运算能力和流畅的...

华为alp一al00是什么型号
ALP-AL00是华为Mate10全网通版手机。华为Mate10是一款由华为技术有限公司研发的智能手机,该机采用10nm制程的麒麟970处理器和6寸1080p屏幕,配备基于Android8.0的EMUI8.0操作系统。2017年10月16日在德国慕尼黑正式发布华为Mate10,华为Mate10系列国行发布会于2017年10月20日在上海东方体育中心召开。惊艳...

华为alp一al00是什么型号
华为alp一al00是华为Mate 10全网通版手机。在其配置方面,华为Mate 10采用EMUI 8.0(基于Android 8.0)系统,搭载麒麟970,八核+微智核i7+微智核I6处理器。屏幕方面,采用5.9英寸LCD全面屏,2560*1440分辨率。在拍照方面,华为Mate 10后置摄像头为1200万(彩色)+2000万(黑白)像素,f\/1.6...

华为alpal00是什么型号
ALP-AL00是华为Mate10全网通版的手机型号,它于2017年10月16日在德国慕尼黑正式发布,并于2017年10月20日下午14:30在上海东方体育中心正式发布,手机支持人脸解锁、抬手亮屏等功能。在核心配置方面,华为Mate10搭载了麒麟970处理器,该款处理器采用了4个A73大核(2.4Ghz)+4个A53(1.8Ghz)+独立...

华为alp-al00是什么型号
华为alp-al00是华为Mate 9系列的型号。该型号手机是华为公司于2016年推出的一款旗舰手机。下面详细介绍该型号的相关信息:华为Mate 9系列包括多个版本,其中alp-al00是其中的一种型号,通常指的是较早发布的版本。这款手机采用了当时的先进技术,配备了高性能的处理器和大量的存储空间,为用户提供了出色...

昌吉回族自治州19748106995: 完胜人类后AlphaGo为何要从棋坛退役? -
须版方苏: 根据报道,在5月27日“人机大战” 第三场比赛中,柯洁由于状态不佳,被 AlphaGo 拖入缠斗之后无奈宣布放弃.最终,AlphaGo 以 3:0 的成绩赢下本次乌镇围棋峰会比赛.对于 AlphaGo 的表现,“棋圣” 聂卫平现场点评:“人类目前最高也...

昌吉回族自治州19748106995: 阿尔法狗团队宣布"阿狗"退役是怎么回事? -
须版方苏: 1、【阿尔法狗团队宣布“阿狗”退役,50份自我对战棋谱献给人类】5月27日,升级后的AlphaGo所向披靡,最终以3:0赢下了这次乌镇人机大战.这也将是人机大战的最后3局比赛了.2、在最后一局比赛结束后的发布会上,AlphaGo之父、...

昌吉回族自治州19748106995: 世界第一围棋手柯洁也败了到底AlphaGo是个什么鬼 -
须版方苏: 终极一战的赛后发布会上,柯洁显得十分痛苦,他哽咽着表达了对AlphaGo心服口服的敬佩,“我看到了自己和AlphaGo的差距有多大,这是我永远都追不上的距离,我会继续改变自己,而AlphaGo将会改变世界.”这番话仿佛是壮士断腕后打算“隐退江湖”的诀别辞.必须得承认,AlphaGo真的超越了人类,棋坛五大顶尖高手组成的天团都被AlphaGo“杀”得一败涂地,在围棋这块领域,人类已经失守.

昌吉回族自治州19748106995: 古力认输是怎么回事 -
须版方苏: 1月4日晚,Master以60胜0负1和的战绩结束了快棋挑战人类高手的测试,随后AlphaGo团队的樊麾通过微博发布了DeepMind的正式公告,确认了Master就是最新版本的AlphaGo.随着古力认输,Master对人类顶尖高手的战绩停留在60胜0负1和...

昌吉回族自治州19748106995: 现在的alphago能不能让绝艺4个 -
须版方苏: 绝对不可能是故意输棋.应该是神经网络欠拟合,没有训练出78手那个局面.因为AlphaGo训练量还不够大,一定会有某些特殊局面欠拟合的.但是要能逼AlphaGo犯错,必须要下出非常规的绝妙手段,普通手段肯定都已经训练到了.谷歌让李世石当测试员,也是想测出这些局面.随着AI继续训练,这样的局面会越来越少,今后越来越难战胜.预先祝贺李世石成为最后一个战胜最强AI的人类.

昌吉回族自治州19748106995: 如何评价李世石和AlphaGo的比赛过程和结果?有什么值得注意的细节 -
须版方苏: 虽然不懂围棋,但是就个人对机器人的浅薄了解而言:Ⅰ 人类棋手在长期的对战过程中会形成一定的个人习惯,可以说是套路或是棋风; Ⅱ 对机器人来说,并不会存在这个问题,每当对手一子落地,它会经过高速的计算,将所有可能列出来,然后产生获胜概率最大的最优解;Ⅲ 机器人的数据库中已经对人类棋手曾经对战记录进行了深度运算分析,获取了棋手的隐形习惯—棋风.

昌吉回族自治州19748106995: 人机大战的三种结果及其影响 人类准备好了吗 -
须版方苏: 自从今年1月28日,科技界的超级巨头谷歌在全无征兆下,突然引爆其旗下开发的人工智能ALPHAGO以5比0横扫欧洲围棋冠军的惊天猛料,紧接着又向站在人类族群最顶端的天皇巨星级棋手,坐拥十四项世界冠军的李世石九段发起百万美金的...

昌吉回族自治州19748106995: Master宣布自己就是AlphaGo,60胜0负后还有谁能与之一战 -
须版方苏: 在围棋界被神秘高手Master狂虐一遍之后,豪取60胜的Master昨晚终于公布了自己的“真身”——果不其然,Master果然不是“人”,它就是各路围棋高手们猜测的人工智能AlphaGo——或者正确的说法是,它是加强版的新型AlphaGo.从去年...

昌吉回族自治州19748106995: 围棋人机大战,李世石和AlphaGo谁的胜算更大 -
须版方苏: 人机大战,李世石和alphago谁的胜算更大,前两场李世石都在局面占优的情况下输掉了比赛,人类输给了人工智能的言论于是满城风雨.赛前普遍认为alphago目前还没有战胜人类的实力,比赛渐入佳境,alphago二比零领先,于是人们惊呼人工时能的时代将要来领.猜想如果李世石没有放水的话,按照目前的形势这样下去肯定是alphago赢,但是如果最后来个三比二终极逆转,那这个终营销做得那是很好了.

昌吉回族自治州19748106995: 如何评价AlphaGo 最新版本 AlphaGo Zero -
须版方苏: AlphaGo这个系统主要由几个部分组成:走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋.快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍.估值网络(Value Network),给...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网