纠纷奇闻作文社交美文家庭
聚热点
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

100:0,新AlphaGo放弃了人类?

9月1日 相思宫投稿
  01
  2017年10月19日,谷歌子公司DeepMind发布了AlphaGo的新版本。很多人知道AlpoaGo是一个人工智能程序,却不知道它其实是一个家族,早期战胜韩国选手李世石的是AlphaGoLee。在乌镇击败世界冠军柯洁的是AlphaGoMaster。本次发布的是AlphaGoZero(阿尔法零),它经过3天的训练便以100:0的战绩击败了他的哥哥AlphoGoLee,经过40天的训练便击败了它的另一个哥哥AlphoGoMaster。
  AlphaGoZero与之前版本相比,最大的区别在于,它不再依靠人类的指导来成长,即之前的AlphaGoLee是依赖于人工录入的大量棋谱来帮助其学习如何下棋,说白了,它是在人的指导下学习,可以理解为是人类千年围棋经验教出的学生。
  而AlphaGoZero使用了强化学习算法,即不再依赖任何棋谱,编程人员输入围棋基本规则后,不再进行任何教导,完全由其自己进行摸索,总结走棋方法,相当于人工智能完全按照自己的方法学习。AlphaGoLee完败于摒弃了人类经验的AlphaGoZero,这说明人类的经验可能误导了AlphaGoLee,进而限制了它的发展。
  AlphaGoZero的行棋方式在开局和收官阶段,与人类选手有较大的相似之处,而盘中的行棋风格的确与人类选手和之前版本的AlPhaGo有较大不同,而正是这种不同让其可以在100次与AlphaGoLee的交战中立于不败,换个说法,如果当初AlphaGoLee没有拜人类为师,而是向机器学习,那么对于拥有更强计算能力的AlphaGoLee来说,胜负还未可知。
  除了零经验学习外,AlphaGoZero的另一大特点是将之前版本AlphaGo的两个神经网络融为一体,在之前版本的AlphaGo上,如何走棋是由“策略网络”和“价值网络”两个神经网络来计算如何行棋的,即首先由“策略网络”利用之前累积的经验,判断在当前棋型下哪些位置适合行棋,之后由“价值网络”对在这些位置行棋后的种种可能进行模拟,计算胜率,最终选择出行棋位置。
  而AlphaGoZero将二者融为了一体,对之前两个网络的特征提取等模块进行了共用,可以在计算出可能行棋的位置时便给出相应的“胜率”,大幅提高效率,减少了训练所需的时间。这也是AlphaGoZero在训练了三天就打败了训练了几个月的AlphaGoLee的主要原因之一。
  人工智能不仅是计算机科学领域发展的制高点,在所有行业都具有无限潜力和应用价值,目前世界各国普遍看好,人工智能技术将成长为下一次技术革命契机。即便最终人工智能没有达到革命级别的颠覆程度,AI已经在逐渐改变我们的生活。
  以往人工智能的进步都是建立在软件与硬件同步发展的基础上,神经网络算法最早在上个世纪中叶就被提出,然而受限于计算能力,神经网络算法一直发展缓慢。
  之后随着硬件计算速度的不断提高,已有的软件算法不断被实现并改进,改进的算法对硬件要求更高,从而进一步促进了硬件的发展,而AlphaGoZero的出现完全建立在算法更新的基础上。
  前一版本的AlphaGo需要在48个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片,一块成本即达500万美元)上进行几个月学习,而AlphaGoZero只需要4个TPU加上几天的时间便可完成学习。这种零经验学习能力非常适合在蛋白质折叠和其它缺少样本的医疗领域进行应用,可以很好地解决因缺少试验样本而导致研究进展缓慢的问题。未来的相关研究中完全可以输入规则后利用AlphaGoZero的能力进行模拟,最后利用有限的样本进行验证即可。
  AlphaGo逐渐升级之路
  故事讲到这里,实在不得不佩服谷歌深厚的技术实力与精明的商业头脑。AlphaGo从诞生伊始,就得到了deepmind团队的精心包装,仔细回想起来,可谓是“城里套路深”。
  从最初战胜低段位职业棋手开始预热或者说炒作,到战胜人类顶尖高手李世石,AlphaGo的登场已经足够华丽。不过4比1的比分还是给了人类一线希望,这仅有的胜局中,李世石剑走偏锋,直接把AlphaGo逼出了“大脑短路”的症状,可见此时AlphaGo虽已经足够强大,但尚不完美。此后各路人类高手开始卧薪尝胆,精研AlphaGo的套路,寄希望于重新捍卫人类尊严。
  随后,一个神秘的“master”在围棋界顶级棋手的对战平台上取得了60胜0负的骄人战绩,这位master到底是何方神圣,是人是妖可谓是赚足了吃瓜群众的眼球。直到华丽的60胜达成,谜底才最终揭晓。
  此后便是吸引了全世界目光的乌镇对决,AlphaGoMaster把柯洁打到毫无还手之力。虽然柯洁已经表现出了真正的人类最强者战力,却仍然被AlphaGo完全压制,只要出招有任何一点闪失,立刻会陷入AlphaGo“最小优势胜”策略的陷阱,再无翻身余地。
  乌镇对决之后,人类在围棋领域已经彻底甘拜下风,别说柯洁一人,五大高手联手作战比柯洁输得更快,AlphaGo一时风光无限。
  如今,乌镇硝烟刚要散尽,谷歌又搞了个大新闻出来!人工智能在摒弃人类经验后,用三天时间自学的AlphaGoZero打败了人类几千年的经验。AlphaGo的进化版打败了原始版,不禁叫人想起《铁甲钢拳》里叫人热血贲张的机甲肉搏,一个AI输给另一个更牛的AI,中国AI战胜美国AI,这很有可能是未来棋类竞技中的真实场景。
投诉 评论 转载

photoshop怎样导入视频文件今天小编要和大家分享的是photoshop怎样导入视频文件,希望能够帮助到大家操作方法01:首先在我们的电脑桌面上找到PS并点击它,如下图所示。02:……教你如何恢复通讯录里面丢失的联系人虽然现在的手机有非常多的功能,但是手机当中最为重要的莫过于手机通讯录,手机通话是根本啊。那么如果我们在使用过程中不小心删除或者在进行文件清理时候丢失了通讯录里面的重要数据怎么办……苹果手机中间按键坏了怎么办iphone这些年因为只有一个按键的中间点,也是引领了一段时间的手机的操作方式。那么如果这个中间按键坏了怎么办呢?下面我就来给大家介绍一下,补救的办法。工具材料ip……自学围棋的AlphaGoZero,你也可以造一个01遥想当年,AlphaGo的Master版本,在完胜柯洁九段之后不久,就被后辈AlphaGoZ(简称狗零)击溃了。从一只完全不懂围棋的AI,到打败……100:0,新AlphaGo放弃了人类?012017年10月19日,谷歌子公司DeepMind发布了AlphaGo的新版本。很多人知道AlpoaGo是一个人工智能程序,却不知道它其实是一个家族,早期战胜韩国选手……电脑上保存的微信聊天记录如何导回到手机上查看今天小编要和大家分享的是电脑上保存的微信聊天记录如何导回到手机上查看,希望能够帮助到大家。操作方法01:首先在我们的电脑桌面上找到微信并点击它,如下图所示。……如何查询养老保险个人账户余额如何查询养老保险个人账户余额呢?今天小编为大家讲解一下。操作方法01:打开手机,找到支付宝,点击并进入,如图所示。02:进入之后,找到城市服务,点……怎么样查询银行卡的开户行如何查开启行名称怎么样查询银行卡的开户行呢?今天小编为大家讲解一下。以中国建设银行为例。操作方法01:打开手机,找到中国建设银行手机APP,点击并进入,如图所示。02:……QQ截图时如何自动隐藏QQ聊天窗口QQ截图时如何自动隐藏QQ聊天窗口呢?今天小编为大家讲解一下。操作方法01:打开电脑,找到QQ,点击并进入,如图所示。02:登陆之后,打开与好友的……怎么查询单位、企业组织机构代码证今天小编要和大家分享的是怎么查询单位、企业组织机构代码证,希望能够帮助到大家。操作方法01:首先在我们的电脑浏览器中输入全国组织机构代码信息核查并点击回车键,……word文档中怎样增加段后间距?今天小编要和大家分享的是word文档中怎样增加段后间距,希望能够帮助到大家。操作方法01:首先在我们的电脑桌面上新建一个word文档,并点击它,如下图所示。……打开网页自动跳到别的网页的解决方法操作方法01:主菜单设置打开浏览器,然后点击浏览器右上角的【主菜单】图标,在弹出的下拉菜单中选择【设置】,如下图所示:02:标签设置在弹出的……
LabVIEW编程实例:模拟温度采集报警灯指示。。。LabVIEW编程基础:手把手教你创建子程序,生。。。我下的软件到底安全吗?java读取TIF,TIFF文件方法苹果快手上传长视频iphone上传长视频快手如何关闭139端口及445端口等危险端口黑客技术学习路线解析!非常具有收藏价值!。。。如何扩展智能电视内存10个最实用的运行命令电子书制作方法,制作电子书教程,电子书制作。。。当你没有扫描仪,又急需将文字扫描进电脑时。。。。轻松下载网络音频与视频万能秘笈!
在火车站怎么用无线网络一次拔河比赛治疗狗咬人的偏方体谅造句用体谅造句大全日全食六大奇观小学五年级第三单元的教案英语教材上多次出现WuYiFan,众家长提出质疑,官方及时回过生日作文600字热文聚热点网 梦想的风筝作文600字联想笔记本电脑经常蓝屏的解决办法借钱不还怎么去法院起诉王昭君热评聚热点网

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形