相关文章推荐
时尚的胡萝卜  ·  2023年河南省工业和信息化技术技能大赛暨第 ...·  2 周前    · 
捣蛋的眼镜  ·  摄影风格第八讲:达达主义的影与虚实三要素_手 ...·  11 月前    · 
另类的滑板  ·  《宫》11日韩国首播热门漫画改编电视剧(图) ...·  1 年前    · 
捣蛋的皮带  ·  东哥特人_搜狗百科·  1 年前    · 
逆袭的木瓜  ·  孙中山颂黄帝文《中华开国五千年》-公祭轩辕黄 ...·  1 年前    · 
小百科  ›  AI必须完爆人类?一文得见AlphaGo Zero的激动人心与局限-腾讯云开发者社区
AlphaGo 人工智能 科技 腾讯 阿尔法狗
暗恋学妹的饼干
1 年前
作者头像
AI科技评论
0 篇文章

AI要完爆人类?一文读懂AlphaGo Zero的伟大与局限

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP
返回腾讯云官网
社区首页 > 专栏 > AI科技评论 > AI要完爆人类?一文读懂AlphaGo Zero的伟大与局限

AI要完爆人类?一文读懂AlphaGo Zero的伟大与局限

作者头像
AI科技评论
发布 于 2018-03-14 12:05:58
601 0
发布 于 2018-03-14 12:05:58
举报

AI科技评论按 :每次AI领域有重大突破时,甚嚣尘上的“AI威胁论”必然会卷土重来。

2017年10月19日,DeepMind团队重磅发布AlphaGo Zero,再次震惊世人。相比上一代AlphaGo,该版本的AlphaGo实现了在AI发展中非常有意义的一步——”无师自通“,这也让去年败在未升级版本AlphaGo Master下的中国棋手柯洁惊呼”人类太多余了“。

相信看过之前的报道都知道,AlphaGo Zero的先进之处是可以完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己通过强化学习(Reinforcement Learning ),左右互搏来增长棋艺,最终达到百战百胜。

那是不是就代表AI从此将进入到无需人类知识,不受人类控制的时代 ?显然还达不到。

要想理解为什么,首先从围棋这个游戏说起。围棋是一种对弈游戏,具体来说就是信息透明,规则透明,结构明确,并且可用规则是可以穷举的。而如果到了一些数据无法穷举的领域,如语音识别,图像识别,自动驾驶等,AlphaGo Zero中的算法理念很难迁移过来,也很难“无师自通”。

那AlphaGo Zero中的算法可以借鉴到哪些领域?他的核心技术是什么?他的伟大之处又是在哪里?这还得请AI科学家来谈一谈。AI科技评论得知,此版本的AlphaGo所采用的核心技术就是出自华人团队的深度残差网络(ResNet)。 就此背景,我们联系到了深度残差网络ResNet作者之一孙剑博士来对这次的技术升级做阐述。ResNet技术正是他在微软亚洲研究院时期的发明。

旷视科技(Face++)首席科学家、旷视研究院院长

在他看来,本次技术提升足够伟大,但同样在真实技术落地过程中有着众多局限,并指出未来的主流深度学习技术还将会围绕大数据训练模式的方式。换句话说,AI想脱离人类控制还为时尚早。

孙剑博士在接受AI科技评论的采访过程中说道:“AlphaGo Zero的伟大之处是第一次让机器可以不通过任何棋谱,不通过任何人类的经验,在只告诉规则的前提下就实现了成为一个围棋高手,这种无师自通的学习模式在AI整个发展上是非常有里程碑意义的。”孙剑博士讲到AlphaGo Zero的技术意义时讲到,“但是同时这种无师自通在很多AI落地上也存在一些局限,因为严格的讲,围棋规则和判定棋局输赢也是一种监督信号,所以严格意义上来讲,说人类无用,或者说机器可以自己产生认知都是对AlphaGo Zero理解的不精确。”

在很多AI行业落地中,实际上弱监督学习或无监督或者所谓的无师自通还是无法在短期成为主流。比如,就人脸识别来讲,这个能力是人类后天学习的能力,是通过时间不断演化出来的一种生存能力,人只有具备了人脸识别能力,人类社会才能正常运转,把这种后天能力输出给机器,其实就需要人的监督信号。除了人脸识别,还有很多人工智能研究的方向,比如自然语言处理,都是在模拟人类的一种技能。让机器实现这种任务就需要海量的数据与更多的信号输入。再比如医学领域的图像识别—AI医学影像读图主要依赖于高水平医生对影像的数据精标,从而机器学习对疾病的识别,这关乎于人的生命问题,自然马虎不得。所以今天,甚至今后很长一段时间内,监督学习依然是AI研究与AI商业化的主流方向。

关于AlphaGo Zero中的算法可以借鉴到哪些领域? 孙剑博士没有直接给出答案,而是总结了从此算法为什么能在围棋领域表现如此出色的几点原因,首先,围棋它没有噪声,能够完美重现算法;其次围棋中的黑白子双方的信息时完全可观测的。最后,也是他认为最重要的一点,围棋对局可以用计算机迅速模拟,很快输出输赢信号。看一个领域是否能借鉴此算法,基本就要看是否满足以上三点。

AlphaGo的秘密武器:两大核心要素实现极简算法

其实AlphaGo Zero里面并没有新的巨大的理论突破,它使用的白板学习,早在之前的围棋系统Creazy Stone中就有用过。最主要还是用到了孙剑博士发明的ResNet技术, 谈到该技术时,他讲到: ”AlphaGo Zero的搜索过程简化了很多,例如把以前系统中的两个网络合并成一个网络、将深度残差网络的输入做最简化。谈到本次AlphaGo Zero在技术特点,他认为是“把19x19棋局图像直接送给神经网络,让神经网络看着棋盘做决策,这个非常简洁。”

AI科技评论认为DeepMind的这一成果的启发意义大于借鉴意义。与其想着把算法照搬过来,不如朝AlphaGo Zero启发的方向探索。在与孙剑博士在采访交流中,他表示本次AlphaGo Zero的提升主要有两个核心要素,一个是启发式搜索,一个是深度残差神经网络,而这两个又非常完美的实现了结合。其中启发式搜索的思想非常朴素,是个针对问题设计的一个高级定制版蒙特卡洛数搜索算法。另外一个核心要素是深度残差神经网络,让简单的搜索算法极大的提升了效率。

深度残差神经网络在2015年由孙剑在微软领导的视觉团队老师率先提出,并在当年在ImageNet以及COCO两大学术竞赛中包揽五项冠军,其中最重要的部分就是实现了突破性的152层的网络深度,从而让一些非常复杂的函数做映射时效率与有效性得到极大的提升。强大的网络使的AlphaGo Zero已经可以有能力学习把每一子下在那里的概率和对整个棋局的判断算的非常准确。

开放与互通是AI通往未来之路的不二法则

中国在今年发布了人工智能战略规划,起码从国家层面上是认可AI能给社会带来巨大进步。在讲到AI的未来的发展中,孙剑博士强调了开放与互通。他讲到他现在在旷视研究院每天第一件事情就是去网上开放的论文平台ArXiv看是否有新的、有意思的论文、思想发出来。

最后AI科技评论问道,ResNet被应用到AlphaGo Zero上,您有什么感受?孙剑博士表示:“这次应用在AlphaGo Zero中的ResNet残差神经网络,曾获得了CVPR 2016的最佳论文奖,我也非常高兴这个技术可以应用在AlphaGo Zero系统中,而这个应用过程其实并不需要我们直接进行接触而是一种研究成果的交流,人工智能研究最前沿的开源与开放,才能让我们在追求更优解的过程中有很多参考与理论支撑,可以极大的提升新技术产生的周期。”

孙剑博士还介绍到,旷视研究院今后还会不断分享、开放研究成果。今年7月份,旷视研究院在ArXiv公开了一篇ShuffleNet的论文,是一种可以运行在很多移动端上非常低能耗的神经网络算法,可以说是专为移动端而生的算法。发布至今不光的硬件产品、手机解锁产品使用,同时也有很多同行在使用。

AI科技评论小结:AlphaGo Zero虽没有新的突破性的技术,但这丝毫不影响它的伟大,它能够完美集成已有的技术,给研究者带来新的启发,本身已具有里程碑式的意义。他的局限在于目前只能运用到特定领域,不过,换个角度来看,这对于人类来说未必不是好事儿。总之,AI 还有很长的路要走,还需要更多像孙剑博士这样的科学家们,不断借助创新而实现更多的创新,不断借助伟大的思想创造伟大的场景。只有不断的开放最好的认知,才能让这个AI不断成长,让更多更强的AlphaGo Zero产生。

本文参与 腾讯云自媒体分享计划 ,分享自微信公众号。
原始发表:2017-10-21 ,如有侵权请联系 [email protected] 删除
其他

本文分享自 AI科技评论 微信公众号, 前往查看

如有侵权,请联系 [email protected] 删除。

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

其他
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
关于作者
AI科技评论
0
文章
0
累计阅读量
0
获赞
前往专栏
目录
  • AlphaGo的秘密武器:两大核心要素实现极简算法
  • 开放与互通是AI通往未来之路的不二法则
领券
  • 社区

    • 专栏文章
    • 阅读清单
    • 互动问答
    • 技术沙龙
    • 技术视频
    • 团队主页
    • 腾讯云TI平台
  • 活动

    • 自媒体分享计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 资源

    • 技术周刊
    • 社区标签
    • 开发者手册
    • 开发者实验室
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 商标注册
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2023 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2023 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
时尚的胡萝卜  ·  2023年河南省工业和信息化技术技能大赛暨第二届全国工业和信息化 ...
2 周前
捣蛋的眼镜  ·  摄影风格第八讲:达达主义的影与虚实三要素_手机搜狐网
11 月前
另类的滑板  ·  《宫》11日韩国首播热门漫画改编电视剧(图)_影音娱乐_新浪网
1 年前
捣蛋的皮带  ·  东哥特人_搜狗百科
1 年前
逆袭的木瓜  ·  孙中山颂黄帝文《中华开国五千年》-公祭轩辕黄帝网- 黄帝陵官网
1 年前
Link管理   ·   Sov5搜索   ·   小百科
小百科 - 百科知识指南