2016年3月16日 星期三

(aphago vs 李世石)赛后感言【人工智能】

赛后感言
AlphaGo的比赛以4:1的比分结束了,说几句吧。
大家可能一直有误解, 计算机解决问题靠暴力,而人则靠智能。其实在面对指数级别的解题空间时,机器的暴力搜索所能覆盖的范围,不过是沧海一粟。我现在越来越觉得,连接主义和符号主义的合并,强直觉加上适当搜索才是解决问题较好的方案。人工智能迄今为止的历程,就是人类认识到这个宏大空间并且往这个方向靠拢的过程。从一开始的规则驱动的暴力搜索,到特征驱动的线性模型,再到数据驱动的深度学习,越来越强的模式识别能力让“直觉”两字从神秘莫测,变成了通过大量样本能学到的模型。机器因为有了更强的直觉,才能在图像识别和围棋上打败人类,毕竟围棋太难了,每一步都需要高效的剪枝才行。我在赛前说DCNN+MCTS这样的框架大局观非常强,正是这个原因,不知不觉棋筋就连着了,不知不觉棋就非常厚了,怎么也断不了。因为MCTS是全盘估计分数的,DCNN又长于大局观。

与大家通常的理解相反,要让机器像人一样作理性推理,目前还比较困难。有效的逻辑和理性思维能力同样是依赖大量的直觉去找到正确的逻辑链条和理性判断,然后再回头验证。直觉的错误率是很高的,就像围棋的DCNN经常给出不靠谱的着法一样,需要MCTS的价值判断来纠正。逻辑思维的强弱,不是说想得有多深,脑袋转得有多快,而是在过去的经验中能找到解决方案,并且能有意识地用理性去判断解决方案的正确性,这样的框架一但在脑里建立起来,就有了自我学习自我纠错的能力。人类在这方面,仍然比计算机要强得多。我在赛前说局部死活对杀劫争会有问题,看完了五盘棋,大家也都惊叹计算机其实不会计算,因为AlphaGo里并没有显式建模局部死活对杀,而人可以依据当前盘面的状况,积极地改变搜索的指向,而机器会因为全局搜索所累,不知道在合适时候集中火力到某个重要的局部上。如何将DCNN和MCTS深度结合起来,仍然是很大的研究课题。
我以前写过《给人工智能泼点冷水》,现在看来这点冷水肯定浇不灭大家的热情。但我还是要说人工智能还有很长的路要走。围棋是固定规则下的完全信息博弈,再加上大量的人类对局样本,及两位一作长年对计算机围棋的坚持,还有谷歌大量的资源时间和人力,才造就了AlphaGo现在的辉煌。相比之下,人类每天在非对称信息中过活,在未知的世界中摸索,在充满噪音、模糊甚至错误的指导信息中学习,在稀缺样本中寻找规律,在极窄的通讯带宽下相互交流,依然有远超纸面数据的判断与推理,远胜大量机器的直觉和洞察力。另一方面,对于神经网络模型的解读,我们仍然处于初级阶段,多少人问为什么计算机能下出妙手?职业棋手有自己的判断和逻辑,并且能在一定程度上阐述清楚;可遗憾的是,人工智能研究者这边,只能在堆完大量的数据之后,两手一摊露出无奈的笑容。如何让机器学会人类的各项能力,依旧是一座需要攀登很多年的大山。
我记得在比赛期间有张图让人印象深刻,一边是需要千台机器的AlphaGo,另一边是李世石和一杯咖啡。大自然的鬼斧神工,一直让人肃然起敬;而最杰出的造物,莫过于我们人类自己。

沒有留言:

張貼留言

卒業

業卒