农药资讯 家电资讯  综艺频道
明星资讯 娱乐资讯 教育资讯 
文化资讯 新能源 宠物资讯 求职招聘
健康资讯 医疗资讯 趣闻趣事 化工资讯
人工智能
游戏资讯
 
围棋之后 人工智能下次突破哪个领域
http://nyiqrd.cn  2020-08-06 06:02:01  

经过2小时,4小时训练后,DeepMind的水平已经超过职业玩家。(01:32)

澎湃新闻记者 王心馨

3月10日,谷歌AlphaGo与李世石的第二场对局已落下帷幕。2:0,在五番棋中,李世石已命悬一线。

在棋类竞技中,围棋作为人类智能最后一个未被征服的堡垒,正在AlphaGo的进攻下逐渐沦陷。

凭借着DeepMind公司为它武装的四大利器——走棋网络(Policy Network)、快速走子(Fast rollout)、估值网络(Value Network)以及蒙特卡罗树搜索(Monte Carlo Tree Search),AlphaGo正在围棋领域攻城拔寨,锐不可当。

这样的剧情走向看起来有点像1997年,IBM“深蓝”与国际象棋大师卡斯帕罗夫的对决。但是,这两者之间有着巨大的不同:“深蓝”采用的是“暴力算法”,而AlphaGo要聪明得多。比起只能下国际象棋的深蓝,AlphaGo拥有更大的潜力,只要涉及到策略分析,AlphaGo几乎所向披靡。

深蓝下棋无敌,但只是下棋

先让我们回顾下1997年的那场“人机对弈”。

1997年5月,国际象棋棋王卡斯帕罗夫在第二次对决IBM研发的深蓝电脑时,以3.5:2.5败于机器手下。此事震动了全世界,一时间“战胜人类”的话题不绝于耳。

但后来有科学家发现,“深蓝”的技术并不全面,它太专业了。换言之,深蓝是专门为国际象棋设计的。它评估盘面的四项标准包括子力、棋子位置、王的性还有布局节奏——显然,这些指标完全依赖于国际象棋本身的规则,没有任何扩展性。

作为一台超级国际象棋电脑,深蓝重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步,计算能力11.38 GFLOPS,输入了一百多年来优秀棋手的对局两百多万局。这样的计算能力放到现在,还没有你我手中智能的CPU性能强。

此外有媒体报道称,当时,深蓝在棋局之间还曾被修改以符合卡斯帕罗夫的下棋风格,以免再次跌入陷阱(卡斯帕罗夫曾赢过深蓝)。

因此,将深蓝称为是不合适的,它更像是一个专门用来下国际象棋的程序。想让它学会围棋、五子棋,或者画画是不可能的。

AlphaGo开启通用模式后可应用到更多领域

但AlphaGo不一样。从这两天的比赛来看,人类似乎低估了AlphaGo的学习能力。尤其是3月10日的比赛,就连众多职业九段围棋高手都没能判断出AlphaGo一招看似业余的走法,其背后却已暗藏杀机。

AlphaGo能拥有如此巨大的威力,主要是得益于背后的、强化学习和蒙特卡罗树搜索方法。值得一提的还有,这些算法并非只能用在AlphaGo的围棋项目。这也让AlphaGo的未来充满想象。

在DeepMind创始人德米斯·哈萨比斯(Demis Hassabis)和他的团队搭建AlphaGo之前,已经使用这些技术做了一些会玩经典雅达利视频(比如,Pong,Breakout以及Space Invaders)的DEMO系统。在这些案例中,这些系统不仅比职业玩家还出色,它们还会以天马行空的方式玩,没有人类玩家会或者可以这么玩。

“DeepMind的做法是,不告诉机器哪种算法能得到高分,而是训练它,通过学习和分析结果来判断最优策略。”复旦大学与工程学院副教授邱锡鹏告诉澎湃新闻(www.thepaper.cn)。

从小到围棋对弈,谷歌还打算将AlphaGo背后的算法一步步地运用到更多的领域中。就在3月份与李世石开赛前,DeepMind公司就公开表示,将与帝国理工学院和皇家自由医院展开合作,试图将其技术应用于行业。

除了外,交易公司以及机构也对AlphaGo背后的算法展现出了浓厚的兴趣。

大型公司英仕曼(AHL Man)首席科学家安东尼莱德福(Anthony Ledford),在去年12月举行的蒙特利尔研究者的重要学术活动NIPS会议(神经信息处理系统进展大会)上表示,公司正在探索是否技术会有助于。

“这是早期阶段,”莱德福说,“我们已经拨出大量资金用于测试交易。如果一切顺利,将进入测试交易。”

对于人类生活而言,需要最优策略路径选择的,不单只是或者交易这些领域。随着算法越来越精妙,或许在未来的某一天,大家可以看到在军事领域里的运用。其实,围棋何尝不是一场抽象的战争?