阿尔法狗能学数学吗（地球最聪明的人说）

强暴未遂 2023-06-07 10:08:29

收藏赞

伦敦当地时间10月18日傍晚，阿法狗（AlphaGo）再次登上世界顶级科学杂志——《自然》。谷歌人工智能团队以《脱离人类认知，精通围棋游戏》为题，用整整5页的篇幅，隆重介绍了阿法狗的新版本AlphaGo Zero。

阿尔法狗能学数学吗（地球最聪明的人说）(1)

▲《自然》杂志官方网站公布AlphaGo Zero

一年多前，阿法狗便是2016年1月28日当期的封面文章，一篇题为《用人工神经网络和树状研究，精通围棋》的重磅论文，介绍了这个击败欧洲围棋冠军樊麾的人工智能程序。2个月之后，阿法狗在人机大战中击败世界顶级围棋棋手李世石，从此开始征服世界之旅。

阿尔法狗能学数学吗（地球最聪明的人说）(2)

▲历代AlphaGo 所需的算力对比，图片来源：DeepMind

阿尔法狗能学数学吗（地球最聪明的人说）(3)

▲AlphaGo Zero 成长曲线说明：第0天，AlphaGo Zero此前没有储备任何关于围棋比赛的知识，只输入了围棋比赛的基本规则；第3天，AlphaGo Zero已超过了AlphaGo Lee的水平，AlphaGo Lee在2015年与世界冠军李世石的5局对弈中赢得其中4局；第21天，AlphaGo Zero已达到此前AlphaGo Master的水平，而此前这个版本的AlphaGo在网络上打败了全球范围内的60名高手，并且在2017年以3：0全胜世界冠军柯洁；第40天，AlphaGo Zero已超过此前所有AlphaGo的版本，无可争议地成为了目前全世界最强围棋玩家。而这一成果的取得全部源于其自学，没有任何人类介入，没有使用任何历史数据。图片来源：DeepMind

红星新闻记者将是否自食其言的问题抛给Deepmind团队，哈萨比斯对此解释道，“新版阿法狗‘零’的得名正是解释了新狗与老狗的区别所在——零（Zero），即完全不依靠人类数据和任何历史经验，完全依靠人工智能自身的独立思考和学习能力。”

这也解释了，乌镇人机大战以后，谷歌就宣布阿法狗退役，实际是在研究完全不同的新狗。

对于阿法狗名字的由来，团队表示颇有深意。在今年年初接受红星新闻记者专访时，阿法狗团队就曾解释过，alpha是希腊字母表的第一个字母。第一个，即开端，最初的含意。而后来横扫世界网络的Master（大师）的本名Magister，是德国作家赫尔曼·黑塞晚年作品《The Glass Bead Game（玻璃球游戏）》里的一个词。

而这一次的“零”，无疑是一个颠覆性的成果。

重大突破

没有人类知识输入

靠自我博弈而自学成才

“此前的阿法狗是通过大量吸收传统围棋对战路数、学习人类的围棋招式、数据实现的，而人类知识具有昂贵、不可靠、难以获取的特点。因此，对于AI长远发展而言，必须跳过这一步，在没有人类知识输入的前提下，创造出超人类（superhuman）的计算程式。”哈萨比斯解释道。

如果说此前版本的阿法狗需要被成千上万的人类棋手训练的话，新一代的阿法狗则跳跃了这一步、完全自学成才，“它自己就是自己的老师”。

阿尔法狗能学数学吗（地球最聪明的人说）(4)

▲图a展示了程序的自我对弈过程。程序在从S1到ST的棋局中进行自我对弈。在任意位置ST，程序会用最新的神经网络程序执行计算，然后，根据计算出的搜索概率at～ πt选择落子位置，根据游戏规则来决定最终位置ST，并计算出胜者z。图b展示了AlphaGo Zero中的神经网络训练过程。神经网络以棋盘位置St输入，将它和参数θ通过多层传递，输出向量Pt和张量值 Vt（Pt表示几步之后可能的局面，Vt 表示 St 位置上当前玩家的胜率）。为了将Pt和搜索概率πt的相似度最大化，并最小化Vt和游戏实际胜者z之间的误差，神经网络的参数θ会不断更新，更新后的参数会用到如图 a 所示的下一次自我对弈迭代中。

哈萨比斯向记者表示，“零”是目前最强版本的阿法狗，“阿法狗在短短两年时间就达到如此成就，我们也相当惊喜”。

它是从一张白纸开始，零基础学习，没有使用任何人类数据，而是直接与目前世界围棋最高水平的阿法狗自身学习，“每一次的自我博弈都取得了一定程度的提升”，就这样，在短短3天内，“零”成为顶级高手。

因此，这一次，新版阿法狗并没有和任何人类高手进行人机大战，而是直接通过“自我博弈”而“自学成才”。在对阵曾赢下李世石那版阿法狗时，“零”取得了100:0的压倒性战绩。

哈萨比斯评价道，人工智能极少地使用电脑的力量并完全抛弃了人类的数据经验，这是一个里程碑式的事件。

探索未知

若服务于医疗行业研究

阿法狗的算法将带去新的曙光

“这两年频繁地进行人机大战和线上对垒，最终目标是什么？”上次专访阿法狗团队时，红星新闻记者就曾向他们提出过这样的问题。

当时团队解释，“最终希望能将技术应用于解决现实世界的难题。在这些测试赛之外，我们更想人类的专业棋手和阿法狗一起，共同探索更多围棋的未知领域。”

而这次的阿法狗新版“零”干脆“抛弃”人类，通过自己输入，而摘得世界围棋最顶级的那个皇冠。

那么他们如此做的目的又是什么呢？这次哈萨比斯给出了更精确的答案和目标产业，“使用这种历史性的突破，来解决现实生活中目前无法解决的问题，比如在医疗行业的蛋白质折叠问题，还有就是新材料的发明。”

这一点与哈萨比斯自身的生活息息相关。生物学研究的一个重要课题就是蛋白质如何折叠成3D结构，因为3D结构将决定蛋白质在体内如何工作和反应，患阿尔海默氏（老年痴呆）症的病人或许就是因为蛋白质的折叠方式错误。而哈萨比斯的妻子是一名意大利的分子生物学家，多年一直专注于阿兹海默症的研究。

夫妻二人会一起工作、研究，他们经常讨论怎样加速科学发现的过程，AI在其中扮演怎样的角色。妻子一直希望能取出一个氨基酸序列，然后根据其中的基因序列判断3D结构会是什么样子，这样就可以令药物研发加速5到10年，而实验室通常都要几年的时间才能搞清楚这些结构。

而阿法狗的算法恰恰给了模拟这些蛋白质的折叠一丝曙光。

哈萨比斯最喜欢的音乐是电影《星际穿越》的插曲，而导演克里斯托弗·诺兰是正是他的好朋友，他常和《机械姬》导演埃里克斯·加兰德一起讨论宇宙、人类和人工智能的话题。哈萨比斯曾表示，《星际穿越》和他的最终目标关联紧密，“我想理解我们周围的整个宇宙：理解时间、黑洞、我们在整个宇宙中的真正地位。”

也正是如此，哈萨比斯不停地推动着对阿法狗的研究，“如果在这些实用性领域也能带入阿法狗的成就，将会极大地造福人类的生活。”哈萨比斯对红星新闻记者表示。

END

红星新闻记者丨胡敏娟

编辑丨王睿

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。

猜您喜欢

游戏王各星级怪兽卡（游戏王大怪兽卡）

水卡——海晶少女·青高海牛（连接怪兽）这张卡最早登场于动画游戏王VRAINS，其使用者为Blue Maiden。这...

别扒愣我 2023-06-07 07:03:55
学校捕杀流浪狗合法吗（网传山西运城学院保安捕杀校内流浪狗）

极目新闻记者丁鹏 3月29日，有网友反映，山西运城学院的保安将校内多只流浪狗打死掩埋，还通过投毒的方式杀狗。...

漂漂小姐 2023-06-07 07:37:02
外国博主拍摄重庆盘龙立交桥（重庆一立交桥神似）

来源：IC photo 2021年4月13日，重庆。一双炯炯有神的大眼睛，一对竖立的大耳朵，还有一只红色的三角形嘴...

布知道 2023-06-07 07:26:38
给狗吃的狗粮怎么做（在家给狗子做营养丰富的狗粮）

这个配方是一位狗妈的经验之作，她家狗狗除了吃狗粮外，也很爱吃自制窝窝头！这些配料是研究了许多狗粮配方后，进行的合理搭配才...

卜要离开我 2023-06-07 07:13:32
拍出了今年最好的悬疑惊悚电影（4开启年度奇幻惊悚巨制）

不到最后一刻，永远不知道真相是什么……我发现自己逐渐陷入了一个无底的深渊里…… ——《狗眼看阴阳》由时...

只是故事里 2023-06-07 07:45:54
养热带观赏鱼要注意什么（不想养的水族观赏鱼宠物们到底何去何从）

昨天和群里鱼友聊，有鱼友提出不想养的观赏鱼之类宠物最终去往哪里？如果有一个专门从事收留被“遗弃”的水族宠物二手店可以...

分你一半甜 2023-06-07 07:45:13
方大厨第二季20集（反套路豆瓣高分网剧方大厨）

在豆瓣上看都这样一个故事——作为一个直男，很少关注言情。直到前些日子女票问我：“你有没有听说过《花间提壶方大厨》?刚出的...

情真喜欢 2023-06-07 07:40:47

秒懂生活

阿尔法狗能学数学吗（地球最聪明的人说）

猜您喜欢

游戏王各星级怪兽卡（游戏王大怪兽卡）

学校捕杀流浪狗合法吗（网传山西运城学院保安捕杀校内流浪狗）

外国博主拍摄重庆盘龙立交桥（重庆一立交桥神似）

给狗吃的狗粮怎么做（在家给狗子做营养丰富的狗粮）

拍出了今年最好的悬疑惊悚电影（4开启年度奇幻惊悚巨制）

养热带观赏鱼要注意什么（不想养的水族观赏鱼宠物们到底何去何从）

方大厨第二季20集（反套路豆瓣高分网剧方大厨）

热门推荐

排行榜