- 柴静女士,请脱下女皇的新衣 [2015/03]
- 孙立军的人头能换来什么? [2020/04]
- 董卿女士这么说。。。 [2017/09]
- 俄国启封六千枚核弹、杀鸡儆猴? [2019/08]
- 国民党需要的不是争功而是反省 [2015/09]
- 成也红颜,败也红颜 [2020/01]
- 别了,共和国的舞娘们 [2017/05]
- 香港是香港人民的香港、不是资本家的香港 [2019/08]
- 将计就计,置于死地而后生 [2020/02]
- 大陆可能对台湾进行定点打击 [2018/08]
- 论中国统一台湾的现实性 [2020/05]
- 打仗不是打电玩 [2017/01]
- 川普退出伊核协议的算盘 [2018/05]
- 习无视邓的底气来自哪里? [2018/10]
- 南海之争一箭六雕,吓死诸葛亮 [2015/05]
- 寻求围歼中国海军的机会 ? [2020/08]
- 说说“定于一尊” [2018/07]
- 因功赎罪还是罪上加罪 [2019/06]
- 需要重视台湾一国三制的设想 [2023/02]
- 欲救今之寰球,舍我其谁也 [2017/06]
- 2020美国大选一览 [2020/11]
- 善意的设想与恶意的理解 [2023/05]
- 请忘了我,心上人 [2021/07]
- 给中共领导人的一个思考题 [2020/01]
- 苏联同时撤离阿富汗与金兰湾 [2023/06]
什么才叫机器战胜人?
马力
最近机器人在棋盘上大战生物人闹得沸沸扬扬。不少人把人机博弈说成是机器人智慧与人类智慧的决赛,这实际上是对人类智慧的不了解造成的。机器与人博弈只是思维的一种形式—形式逻辑—的较量,因为机器人是按照人类输入的形式逻辑来下棋的。在形式逻辑上利用高速计算超越人类不足为奇,就像老式机械是人力的延长一样。就是在形式逻辑上,机器是否不可战胜仍是未知数。这里刚好有篇文章“陈经:感谢李世石生命般的抗争 现在我敢说AlphaGo的命门其实很简单”讨论了机器人AlphaGo在形式逻辑上的局限。
首先来回答一个问题:就形式逻辑而言,什么才叫机器战胜人?所谓的机器战胜人不应指机器人通过人工输入的程序打败人,因为这还是人战胜人,是人用机器战胜了没有用机器的人。就像人用棍子打败徒手的对手一样,不能说是棍子打败了人。不管多么拗口,也只能说是人用棍子打败了另一个人。机器战胜人应该是机器人与生物人一样从零开始学习棋术,靠自身积累的经验打败人类,而不是靠人事先输入的程序来下棋。
这还只是在形式逻辑方面,即人类思维的一个最基本的方面。有人喜欢把形式逻辑的演绎说成是弱智的最后功能,因为是最简单的思维功能。许多缺乏生活能力的人却可以是“数学家”。当然这包括了对脑筋死板的某种歧视。事实上形式逻辑中的归纳、证明和逻辑联想,包括形象逻辑的联想还是很有挑战性的。
大家都说AlphaGo很厉害,为什么?因为它是按取胜的概率来计算投子,而不是按最优化来计算的。实际上由于围棋格点太多,不像国际象棋那样有许多行动上的限制,目前的计算机速度难以做到围棋博弈中的最优化选择,只能计算胜负的概率或可能性。这在外行看来是很了不起的手段恰恰是机器人AlphaGo的问题所在。
机器是怎样计算概率的?这就首先需要假定对方的应对。所谓的穷举法只能用于很小的范围。对整盘棋局来说,机器速度无法在限定的时间内逐个地对所有空格穷举之后各步的每一种可能直到最后的胜负,而只能从所知棋谱中选择对方所有的可能应对来计算概率。一旦选择就有选择遗漏。更多不被看好的应对就会被忽略。一旦人不按常规棋谱出牌,机器就无法事先预测并因此可能作出错误的决策。这就是机器人bugs的一个来源。就像谷歌无人驾驶汽车的软件假定别人在自己接近时会让路一样,因此忽略了规避措施造成车祸。
我在这里对机器人的工作原理说得很简单,一目了然。但AlphaGo的算法很复杂,非理工专业的很难读懂。为什么有这些区别?因为我说的是最基本的计算,也是最可靠的。但实际上由于比赛时间有限,机器人在比赛时不可能按这种最基本可靠的方法来运算,只能设法简化运算步骤和数量,用统计代替逐个格点的穷举。这样一来就需要各种条件下的统计模拟公式。所有简化公式都带有多种假定条件下的参数。AlphaGo用反复对垒和自弈来确定这些参数,即所谓的深度学习。叙述起来就变得很复杂。用统计代替真实的穷举后,虽节省了大量时间,但失去了可靠性,也更容易产生bugs。也由于参数来自大量实验,修改起来也很困难。
如果再说形式逻辑之外的辨识思维或辨证思维,机器人更无从谈起。首先要有全部的感觉系统,还要有判断是否值得学习的能力。然后对感觉加以判断是否具有新的信息。如果是新的,如何用新的概念定义命名,如何建立与已知系统的联系,最后如何产生新的公理体系等等等等。目前谈论这些还为时太早。机器的储存远远不够,因为要包括人类的所有知识和经验。举个例子,让一个有感官的机器人寻找新物种,人事先把所有已知物种的各个部分输入机器人。机器人会在一天中带回无数样本,包括被虫咬破,被泥土污染,被人兽踩坏和不同程度腐烂的等等。结果一无所获。这还是有明确目标的行为。要机器人独立建立价值目标就更难了。它会把所有时间用来数一头死老鼠身上的毛数和蚂蚁数。