当前位置:游戏巴士 > 游戏资讯 > AlphaGo击败柯洁,在这场人机大战中我们重新认识了知识的边界

AlphaGo击败柯洁,在这场人机大战中我们重新认识了知识的边界

时间:2018-02-27 21:51:02

 
 

这一次,乌镇举办的对弈似乎是为了彻底让人类死心。但对大多数人来说,可能早就已经有对比赛结果的预期。毕竟,AlphaGo 在年初 60 场大战的不败战绩,已充分说明。

最终结果果然不意外,在昨天 AlphaGo 和柯洁的第一战中, AlphaGo 以多 1/4 子的成绩击败柯洁。

去年 AlphaGo 的崛起,被视为是人工智能发展史上的一个重要里程碑,因此有许多科技界、围棋界人士都十分关注此次人机第二次围棋对决的结果。

学术权威杂志《自然》(《Nature》) 曾报导称,由于一场围棋棋局总排列组合数高达 10 的 171 次方,因此很难以传统的计算解法,慢慢地试探出最佳策略。但是随着数学算法的进步,AlphaGo 团队建立了“蒙地卡罗树搜寻”与两个深度神经网络相结合的运算系统,令 AlphaGo 成为世界上最精湛的深度学习人工智能系统,大大提高了人工智能在围棋上的表现。

此次人机大战柯洁与 AlphaGo 的胜负,无疑是最大的看点。去年李世乭与 AlphaGo 的比赛,虽然李世乭最终以 1:4 落败,但那唯一的一胜意义重大。围棋毕竟还是太复杂,太漫长,人工智能虽然综合实力强于人类高手,但在某些瞬间,人类智慧的闪光还是令人惊艳。也许对于人类阵营来说,这象征着一场光荣的小胜利,但对于 AlphaGo 的 DeepMind 团队来说,AlphaGo 只要输了任何一盘,都代表它还有进步空间,这对于科学家们研究人工智能的未来道路上,未尝不是件好事。

AlphaGo 再进化

也因为和李世乭这一场败局,令 DeepMind 团队将 AlphaGo 的程式再进化,如果说李世乭当时对上的是 AlphaGo 1.0,那么这一次柯洁将面对的是 AlphaGo 2.0。

柯洁在赛后表示,“AlphaGo 和之前已经判若两人,几乎成为我理解中的‘围棋上帝’。我之前一直在寻找 AlphaGo 的缺陷,然而现在我只能尝试寻找其 bug。”

外界评论,本次 AlphaGo 和柯洁对奕中,AlphaGo 的棋风已完全脱离人类经验。AlphaGo 1.0 是巧妙地混合了三种算法:“蒙特卡洛树搜索”+“监督学习”+“增强学习”。

根据公开资料推测,此次 AlphaGo2.0 的技术原理与之前有着巨大不同:

  • 放弃了监督学习:没有再用人的 3,000 万局棋谱进行训练这本是 AlphaGo 最亮眼的算法,也是今天主流机器学习不可避免的核心条件,依赖于优质的数据,在这个特定问题下就这么被再次突破了。
  • 放弃了蒙特卡洛树搜索,不再进行暴力计算:理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从 AlphaGo 2.0 的走棋非常迅速来看,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。
  • 极大化增强学习的作用,之前敲边鼓的算法,正式成为主力。两台机器遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。

在这样的算法下,AlphaGo 2.0 对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。

输定了,那比赛还有什么好看?

2017 人机大战的意义在于重演一部进化史,重新认识智慧的边界。

在以往的围棋比赛过程中,总有一些“套路”是不会被打破,这些套路曾被奉为人类经验知识的圣殿,是不可变更的,但 AlphaGo 正是透过突破这些规矩,达到新的高峰,这对人类本身来说也是一种启发。

AlphaGo 在围棋方面已经做得很好,是 DeepMind 的人工智能科学家和世界各国的围棋顶尖选手共同探索的结果。在这个过程中,其实并不是人类与人工智能对战,而是科学家和围棋选手共同探索。

科学家探索的是人工智能,围棋选手探索的是围棋艺术。AlphaGo 每一次升级,都意味着 DeepMind 的人工智能团队对“如何在有限资讯下做出更好选择”这问题有更深刻的认识,这问题正是让人工智能理解人类、产生思维的关键。

▲AlphaGo 的幕后研究团队。

除此之外,DeepMind 团队在 AlphaGo 今年年初以“Master”代号在网络上大杀四方后曾表示,开发 AlphaGo 的目的一直都不是为了和人类下围棋,而是希望将其研发成果用于其他有助于人类的领域。未来将在开源部分程式后终止围棋项目的开发。因此,本次比赛或许将成为 AlphaGo 与职业围棋高手的最后一次正式比赛。

但这场比赛以及去年和李世乭这两场世纪对战,再加上年初“Master 60 连胜纪录”或许已经足够让 AlphaGo 的制作团队可以进一步的加强人工智能的设计,毕竟围棋这种东西,本来就是人类智慧的结晶,选手下的每一手棋都将会影响后续的布局,因此,选手通常会需要预判对手可能的心理,并且提早想好接下来的路数,才能不让自己走进死胡同,或是掉进对方的陷阱被敌人牵着走。

也就正因为 AlphaGo 是和世界顶尖的围棋好手对决,它才能够快速地累积经验,尽管昨天这场比赛人类终究输了 (大家都知道的结果),但柯洁虽败犹荣,因为此役还是帮助 AlphaGo 变成更棒的人工智能,未来能够帮助人类进行其他有意义的工程。

人工智能成为地球的主人

科学家史蒂芬·霍金则公开警告说,人工智能的发展可能意味着人类的灭亡:“我们已经拥有原始形式的人工智能,而且已经证明非常有用。但我认为人工智能的完全发展会导致人类的终结”,因为“一旦经过人类的开发,人工智能将会自行发展,以加速度重新设计自己”,同时,“由于受到缓慢的演化的限制,人类不能与之竞争,最终将会被代替。”


这其实也就是为什么科技界、商业界的领军人物频频发出人工智能威胁论的原因,原因很简单,人类是有限的。人类不仅信息、资源、理性与智力均有限,人类的道德更是有限。人类的进步有限,人类控制人工智能的能力也将有限,而人工智能的发展却没有极限。所以,有一天人工智能或许会比我们“智人”更疯狂!

▲柯洁和 Google CEO Sunder Pichai 解释 AlphaGo 的棋风。

除此之外,跟人类比起来,人工智能的能量几乎是无穷的。所以,若比体力与智力,人工智能完胜人类。由此不难预测,凡是拼力气的活,以及需要拼力气的智力活 (如大数据分析),人类以后就不要去和机器人拼了,因为完全不具备经济上的比较优势。


可以想像,被人工智能取代的工作甚至职业一定会越来越多。根据一项报告称,到了 2025 年,约有 25% 的工作将由人工智能或是机器人所取代。然而,人类独有的创造性,互动性和谈判性能力,在职业竞争中仍然占有绝对优势。相比人类,人工智能目前欠缺的是原创能力、互动能力和谈判能力。

未来一定是黑暗的?

未必。“人类 + 人工智能”的决策模式将成为主流。作出一个商业决策需要四个要素:知识、经验、决策以及应变能力。一个优秀的商业决策者,必须要有强大的知识背景、经验累积、数据分析能力、全局判断能力以及灵活应变的能力。

然而,这一切人工智能也都可以做到。

AlphaGo 当时之所以能打败李世乭,是因为它学习了 3,000 万步人类围棋大师的走法,累积了 3,000 万局胜负经验,在自我对弈的训练中形成了能对局面评估的大局观。这些能力不仅能让AlphaGo作出决策,还能不断修正决策。

人工智能擅长精确运算和逻辑推理,而人类则擅长情感和创造、领导和组织,可以说各有所长。那么“人类+人工智能”,借助于大数据、模仿以及深度学习等手段,完全可以在管理思维和商业决策上迈上新台阶。

未来,普通管理者的角色势必将会渐渐由人工智能来完成,但卓越的创造性分析,决策工作,也就是领导者的工作,仍将由人类来主导。而未来的竞争,肯定不仅是人和人之间的竞争,也将是人和人工智能之间的竞争,背后则是资本与技术的较量。

推荐新闻

更多»

新游动态

更多»

游戏视频

更多»

辅助插件