图灵的神谕 | 有关人工智能的专家级深度思考！

图灵的神谕 | 有关人工智能的专家级深度思考！
2016/3/11 哲学园

     万物皆是图灵机？[美]Charles Petzold选自《图灵的秘密》

     不管你对图灵的概念或原理有多深的了解，都不会对你构建一台真正的计算机有所帮助。数字计算机是由半导体管和其他一些如继电器和真空电子管等开关机制部件构建的。这些半导体管组装成逻辑门，从而实现简单的逻辑功能。寄存器和累加器等高层次的组件都是由这些逻辑门构成的。[1]

     图灵机是由什么构成的呢？图灵从来没有告诉过我们。图灵并没打算让他的机器成为实际计算机的蓝图。图灵机是对计算的一种简单抽象的模型，这种计算既可以由人完成，也可以由机器完成。图灵创造图灵机的初衷是为了一个特定的目的：证明对于一阶逻辑并不存在通用判定过程。只是后来，我们发现这种想象中的机器对理解计算理论也有重大的辅助作用。这个转变花了20年的时间，也就是在图灵机成为了我们目前称之为“计算机科学”这一学科的研究对象之后。

     将图灵机应用于其他目的(而不是单纯为了证明判定性问题)，需要在某种程度上重新改造图灵机。大多数图灵机会永不停息地计算0到1之间某个实数的数位。数学里的常见任务，也是计算机编程里的常见任务，就是函数的计算。一个函数需要一个或者几个数作为输入——称作函数的参数。基于输入，函数会输出计算的结果——称作函数的值。

     一类重要的函数就是数论函数，之所以这么称呼是因为它的输入和输出仅限于自然数。图灵在其论文的第10节(本书第219页)中发明了一种技巧来计算数论函数，即打印由单个0间隔的连续1的串。第一个0前的连续1的个数表示参数为0的函数值，第二个0前(第一个0后)的连续1的个数表示参数为1的函数值，等等。

     对图灵的数论函数持怀疑态度的一位数学家是斯蒂芬·科尔·克莱尼。克莱尼是邱奇在普林斯顿的学生，他在1934年取得博士学位，之后开始在威斯康辛麦迪逊大学教书。

     克莱尼后来写道：“虽然我很向往图灵所构想的机器的非凡能力，但我依然对他用如此简单的方法将此应用到数论函数的计算中表示怀疑。在任何情况下，只有完全函数?(x)才能用这种方法计算。”[2]图灵的方法对部分函数不适用，这些函数只对自然数的部分子集成立。

     1941年开春，克莱尼在威斯康辛麦迪逊大学教授的一个数学基础研讨班上开始寻求一种不同的解决方法。克莱尼重新改进的图灵机在他1952年出版的经典图书《元数学引论》的第8节中占据了重要的位置。

     克莱尼版本的图灵机仍然是读符号，写符号，沿纸带左右移动。不过，它只限于一种符号，即一个简单的竖线，称为tick或tally符号。机器只有这种符号和空格。自然数以由空格分割的一系列连续格上的tick符号表示。克莱尼的自然数以0开始，一个tick符号表示0，2个tick符号表示1，以此类推。克莱尼好像是第一个在文章中将图灵机纸带的例子作为插图的人。[3]

     图灵机通常以一个空白纸带开始。而克莱尼改进后的机器则从一个已经编码了一个或几个隔着空格的连续tick串符号(作为函数输入)的纸带开始。克莱尼的机器稍后计算函数的值，并将数字编码到纸带上。克莱尼给出的第一个例子是计算后继函数(即计算被编码的数的下一个数)的值。它只是简单地将另外的tick符号打印在现有tick符号串的后面，因此很方便。

     克莱尼的函数计算机器只需要在一段有限的时间内进行计算，当机器完成计算的时候就停止了。这种机器并没有特殊的“停止”或“停机”格局，但是有克莱尼所谓的“被动状态”，即已经不存在机器可以到达的位置。当机器被指令转移到不存在的格局时，“这个机器被称为停止了，我们称它停止时候的状态为终止状态或者输出”。[4]

     在图灵的概念里，一台好的机器——图灵称之为非循环机，即符合要求的机器，是永不停止的。经过克莱尼改造后，一台好的机器将在计算完函数后停止运行。一台陷入了无限循环而无法停止的克莱尼机是“不好”的机器。显然，克莱尼的机器更接近传统的数学观念，即函数接受输入并经过有限步骤输出结果。

     就如第15章讨论的，到了1936年，已经存在3种形式的计算有效性直观表示，它们是：

     〉图灵机；

     〉 1934年，哥德尔基于雅克·赫尔布兰德的建议而定义的递归函数，克莱尼做了进一步的发展；

     〉邱奇及其学生(主要是克莱尼)发展的λ可定义函数。

     这三种不同形式表示方法的等价性，一部分是由图灵在1936年关于可计算数的论文的附录中建立起来的，更严格的说明是在其1937年的论文“可计算性和λ可定义性”中。另外，斯蒂芬·克莱尼在1936年的论文“λ可定义性与递归性”中也有所说明。现在“递归函数“与”可计算函数”几乎表达同一意思。

     斯蒂芬·克莱尼是第一个提出这些形式化表示方法如何直观表达可计算性的人。他在《元数学导论》一书中，第一次明确提出邱奇论题：“每一个有效可计算函数(或者有效可判定谓词)都是一般递归的。”克莱尼又在其后的两章中说：“图灵论题，即每一个被自然认为可计算的函数在他的定义下(即通过一台图灵机)也是可计算的，它实际上与邱奇论题等价……”[5]

     在其1967年出版的书中，克莱尼将两个论题结合在了一起：

     图灵论题和邱奇论题是等价的。我们应该将它们统一称为“邱奇论题”，或者“邱奇邱图灵论题”，以表明它和三种形式化表示方法之一的“图灵机”有关。[6]

     自那以后，”邱奇邱图灵论题”成为了最适当的术语。

     《元数学导论》显然是一本面向数学家们的书。6年以后，另一本经典著作帮助我们跳出纯数学的视野，从计算机科学的角度阐述问题。

     马丁·戴维斯于1928年生于纽约市。他在1950年获得了普林斯顿大学的博士，其博士论文是《递归的不可解性理论》。戴维斯的论文导师是邱奇，也是克莱尼(1934年)和图灵(1938年)的导师。

     在伊利诺伊大学教书时，戴维斯开始称判定图灵机能否完成计算的问题为“停机问题”，也许最早是在1952年。[7]这个术语在1958年戴维斯出版了《可计算性和不可解性》一书后而广为人知。在这本书的前言里，戴维斯诡秘地写道：“虽然这一卷里真正新的东西很少，但是我对相应主题的安排和论述可能会让专家感到新颖，”随后他做了说明，“特别是，图灵机的概念是这本书行文论述的关键。”[8]

     在克莱尼的《元数学导论》中，图灵机直到第321页才出现，在第13章之前也没有更深的提及；而在戴维斯的《可计算性和不可解性》中，图灵机在第1章的第一页就出现了。

     和克莱尼一样，戴维斯把自然数表示为连续的tick符号，并用图灵机来计算函数。用图灵机计算加法、减法、乘法的例子出现在书的第12页。

     虽然《可计算性和不可解性》表面上是数学图书，但是戴维斯意识到这本书“由于和某些哲学问题以及数字计算机理论相关，一些非数学家也可能有兴趣一读”。[9]

     为进一步强调不同，《可计算性和不可解性》作为McGraw-Hill出版公司”信息处理和计算机系列丛书“中的一部作品出版。即使在这套丛书中，这本书也是独一无二的。其他书都关注于计算机硬件和程序设计的“实用”主题。在1958年和1959年，该丛书出版了《模拟仿真：场问题的求解》、《高速率数据处理》、《数字计算机入门》、《数字计算机系统》和《数字计算机编程入门》。

     马丁·戴维斯的《可计算性和不可解性》真正开创了将可计算性作为一门学科主题的研究，它后来成为计算机科学专业学生必修的一门课程。

     在《可计算性和不可解性》的第70页，马丁·戴维斯引入了一个和图灵机密切相关的术语：

     现在，令Z表示一个简单图灵机。关于Z，我们有如下判定问题：

     对于一个给定的瞬间描述α，判定是否存在一个以α开始的对Z的计算。

     也就是说，我们希望确定如果给定初始状态，那么Z会不会最终停止？我们将这个问题称为Z的停机问题[10]。

     在第70页的最后，戴维斯构想了一个定理：“存在一种图灵机，其停机问题是递归无解的。”

     戴维斯的书影响深远，一谈到停机问题就会联系到图灵机，尽管图灵原来设想的图灵机是永不停止的。

     除了速度、存储能力、人机交互设备不尽相同外，现代计算机大体上类似。每台能模拟图灵机的计算机(这是最简单的需求)都是一台通用计算机。此外，一台通用计算机能够模拟任何其他通用计算机。

     最初的一些很简单的计算机甚至还达不到图灵机的能力。显然，第一台至少能称为潜在通用计算机的是Z3，由康拉德·楚泽在1938年至1941年建造。[11]如果说是建造成功，第一台通用计算机应该算是查尔斯·巴贝奇在19世纪30年代建造的分析引擎，虽然它是由一堆齿轮而不是转换开关构成的。实际上，所有1944年以后生产的计算机都是通用计算机。

     通用计算机的一个关键特性是可编程性。必须存在某个将指令集引入计算机的方法，使计算机能响应这个指令集。现代计算机将这样的指令集作为字节存储在内存里，称为机器码。在楚泽的机器里，指令集的编码用35mm的电影胶带上的打孔来表示。巴贝奇的机器则使用打孔的卡片，与控制纺织机的卡片有点像。

     一些早期的计算机只能用很不灵活的指令序列进行编程。一个通用计算机必须能够根据上几步的计算结果跳过一些指令序列。这个特性我们现在称为条件分支，这对于实现条件循环是必要的。

     如果一门计算机编程语言能够模拟图灵机，它就经常被称为是图灵完备的。

     最初在互联网上广泛使用的超文本标记语言(HTML)并不是用来为计算服务的，因此它显然不是图灵完备的。经常在HTML中使用的JavaScript就是图灵完备的。几乎所有现今使用的编程语言都是图灵完备的。任何图灵完备的编程语言都可以模拟任何其他图灵完备的编程语言。

     图灵机不仅说明了进行有效计算的最基本需求，也说明了它的限制：没有任何一台现代计算机或一门编程语言能够比图灵机更强大，没有任何计算机或编程语言能够解决停机问题，没有任何计算机或编程语言能够判定其他计算机程序的未来运行状态。你不能使用更“先进”的编程语言或者不一样的机器来应付这种限制。你能做的，只能是加快计算机的工作速度。你可以拿出上千个处理器组成并行计算机集群，以进行大规模的并行计算，但是你不可能将无限带往我们生活的这个无助的有限世界里，哪怕一点点。

     一些数学家不顾图灵机的限制，毅然钻入超计算领域，以试图让机器摆脱图灵的限制。图灵自己也部分推动了这项工作。他在自己1939年发表的晦涩的博士论文《基于序数的逻辑系统》(Systems of Logic Based on Ordinals)中称之为“神谕”，并写道：

     假设我们拥有一种可以解决(不可判定)数论问题的不确定方法，那么可以称这种方法为神谕。对于这个神谕，我们除了知道它肯定不是一台机器外无法知道更多。在这个神谕的帮助下，我们可以构造一种全新的机器(称为o-机器)，这个机器的某一个基本进程可以用来解决给定的数论问题。[12]

     也许我们每个人都希望生活中有这样的神谕，来帮助我们解决棘手的问题。探索超计算的研究学者基于神谕的概念，将其他特性引入图灵机以使其不再受到先前的限制。虽然出现了一些很有趣的数学构造，但是这样的超计算机并不切合实际，因为它违反了一些基本的物理定律，比如加速时间使得每步计算都是前一步计算的1/2时长。马丁·戴维斯形容超计算是谜一样的问题，并将它与三等分给定角和发明永动机这样的问题作比较。[13]

     在我看来，超计算的研究对于解答计算的普遍性是很有价值的。图灵设计出假想的机器，以刻画人类计算者在执行特定算法时进行的基本操作。他发现，图灵机具有一些固有的限制。那以后的几十年，我们建造了和图灵机等价的计算机，因此同样面临这些限制。我们还没有找到有效的方法来摆脱这些限制。

     基于上述原因，计算的普遍性(在能力和限制上)对于任何数据处理活动而言似乎都是基本存在的。这些限制就像是热力学定律一样是自然界内在的规则。

     如果图灵机的内在限制不能在遵守物理定律的前提下被超越，那么对于那些执行计算或逻辑运算的内在机制而言，这又暗示着什么呢？当我们从探索人的思维和宇宙自身的角度来考虑这两个最重要的(也许甚至有些令人烦恼的)“内在机制”时，这个问题变得最为深刻。

     严格地说，图灵定理只涉及图灵机和机械算法的等价问题，并不一定意味着不存在超越图灵机计算能力的计算机器，这样的机器也未必一定违反某个物理定律。[14]

     也许我们漏掉了什么，也许存在某种神奇的物理机制能够执行非常强大的计算操作，而这种机制无法在图灵机上模拟出来。图灵机真的有助于我们对人类思维和宇宙的理解吗？或者我们只是愚蠢地把一个非常复杂的问题简单化到图灵机的层次上？

     图灵机在数学和计算领域外的遗留问题出现在图灵1936年论文发表之后的几年，源于沃伦·麦卡洛克(1898—1969)和沃特·匹茨(1923—1969)的一次偶遇。

     在底特律，青年沃特·匹茨聪明好学，自学了拉丁语和希腊语、哲学和数学，家里人都认为他是一个怪才。15岁的时候，他跑到了芝加哥。因为无家可归，沃特·匹茨大多数时间游荡在公园里，在那里，他遇见了一位名叫伯特的老人，他们在哲学和数学上有着相同的兴趣。伯特建议他读一读由芝加哥大学教授鲁道夫·卡尔纳普(1891—1970)写的一本出版于1937年的书，可能是《语言的逻辑句法》。沃特·匹茨读了这本书后，就径直前往卡尔纳普的办公室，与他讨论自己在书中发现的几个问题。这个叫伯特的老人就是鼎鼎大名的伯特兰·罗素。[15]

     【关于皮兹的相关阅读，直接点击以下标题：

     扒1扒神经网络的神经大神们

     逻辑与人生：一颗数学巨星的陨落】

     如果你不相信这个故事，那么下面的故事似乎更可信。伯特兰·罗素在芝加哥大学教书的时候，有一次散步从杰克逊花园经过，发现有个年轻人正在看卡尔纳普的书。于是，罗素和年轻人开始交谈起来，并把匹茨带到了卡尔纳普的办公室。[16]

     还有一则故事。当匹茨12岁、还生活在底特律的时候，有一次被几个流氓追赶，躲进了图书馆。图书馆关门后，匹茨被困在了里面。他决定读怀特海和罗素的《数学原理》作消遣。这么一读就是3天，然后他给罗素写了一封信，指出了书里的一些错误。当罗素写信邀请他去剑桥时，匹茨决定成为一个数学家。[17]

     有一点是可以确定的，匹茨在1938年上过罗素在芝加哥大学教的课，同年他也到过卡尔纳普的办公室。卡尔纳普对这个年轻人印象深刻，想给他一份学生助教的工作，但是他并不知道匹茨的名字，所以无从找到他。[18]

     匹茨是个“害羞、内向的孩子，他戴着眼镜，牙齿不齐，有拨弄头发的习惯，有轻微的神经颤抖症，走路时还经常会碰到东西”。[19](在这以后的第二次世界大战期间，匹茨被征兵局划入4F级别[20]，并被认为处于“精神病发作前期”。但是匹茨后来参加了曼哈顿计划，并获得接触最高机密的许可。)[21]在匹茨访问了卡尔纳普的办公室几乎一年后，卡尔纳普终于找到了匹茨。匹茨开始跟着他学习逻辑学，同时在芝加哥大学上课，其中包括了红胡子的乌克兰人尼古拉斯·拉谢甫斯基(1899—1972)主持的研讨班。

     拉谢甫斯基在基辅大学获得了理论物理的博士学位，1924年移民到美国。他对应用数学模型解决生物生长发育过程中的问题很有兴趣。在这个领域中，之前其他科学家都仅仅依赖于经验性的研究，并没有相关的科学实验方法。到了1934年，拉谢甫斯基提出了一个名字来形容他所研究的工作：“数学生物物理学”。1935年，他成为芝加哥大学第一名数学生物物理助教。1938年，一本名为《数学生物物理学》的书出版了，随后在1939年，诞生了名为《数学生物物理学报》的期刊，主要发表拉谢甫斯基及其理论追随者的一系列论文。[22]

     1942年和1943年期间，匹茨接连在《数学生物物理学报》上发表了3篇论文。沃伦·麦卡洛克就是在这时听说了匹茨的这些研究工作。

     沃伦·麦卡洛克在新泽西长大，一开始在哈弗福德学院，这是宾夕法尼亚州的一座“教友派”学校。当麦卡洛克1917年进入大学不久，哲学家鲁弗·琼斯(1863—1948)(他在这期间帮助创建了美国朋友服务委员会)就问了麦卡洛克一个问题：“你将会成为什么样的人？……你将会做什么事?”麦卡洛克说不知道，但是他说：“我想回答的是另一个问题：人可以认知的数是什么？可以认知数的人又是什么？”鲁弗·琼斯对此只能回应道：“朋友，看来你的人生要在忙碌中度过了。”[23]

     后来，麦卡洛克去了耶鲁大学学习哲学和心理学，于1927年在纽约的内外科医学院获得硕士学位，并在贝尔维尤医院从事治疗严重脑损伤病人的工作。后来，他又去了洛克兰德州立医院从事治疗精神病患者的工作。[24]1934年，麦卡洛克回到了耶鲁。他的同事里有杜赛尔·德·巴瑞内(1885—1940)，巴瑞内是使用化学成分马钱子碱作用在猫的大脑并观察猫的反应，从而探明大脑各部分对应功能这一实验方法的先驱。1941年，麦卡洛克搬到了伊利诺伊州，在伊利诺伊神经精神病学院工作。

     麦卡洛克是个传奇人物。“有点像摩西：有一撮长长的胡子，浓密的眉毛，眼睛发出奇异的光芒。很多时候，他看上去就像个疯子。他的眼睛是灰色的，当它们变得明亮而闪烁的时候，就像是一副眼镜。”[25]麦卡洛克很喜欢社交，“每天晚上都要喝一瓶苏格兰威士忌作为他和别人闲聊时的情绪催化剂”，[26]他也是个很会讲故事的人。(有关沃特·匹茨和伯特兰·罗素在杰克逊公园相遇的故事最早来源于麦卡洛克。)麦卡洛克会写诗，还经常论述他的哲学观点，到处炫耀自己的博学多才。

     沃伦·麦卡洛克和沃特·匹茨事最初是怎么相识的，至今也不清楚。但是他们很快就情投意合，匹茨甚至搬来和麦卡洛克一起住。麦卡洛克一直想尝试建立一套大脑工作机理的形式化理论，而匹茨对于数学逻辑的通晓正是麦卡洛克所需要的。他们在麦卡洛克厨房的桌子上写出了名为《神经活动中内在意识的逻辑演算》的论文，1943年发表在拉谢甫斯基的《数学生物物理学报》上。麦卡洛克的女儿塔菲为他们第一次合作的这篇论文画了图解。 [27]

     得益于19世纪下半叶的研究，科学家们已经知道神经系统是由叫做神经元的细胞构成的，这些神经元似乎像网络一样连接在一起。20世纪的进一步研究指出，这些神经元就像开关一样，当刺激达到一定阈值时开关就被触发。[28]

     对于麦卡洛克和匹茨来说，这些神经元就像逻辑开关，于是他们用卡尔纳普的标注方法对神经元进行命题逻辑意义上的建模。一个重要的、传统逻辑中并不存在的要素是，神经元逻辑存在输入与输出的延时特性。基于这样的延时，神经元就被组成为环状结构，从而信号可以在网络内保持一定时间的有效期。麦卡洛克和匹茨的论文为这个模型定义了几个公理，并进而证明了几个定理。

     《神经活动中内在意识的逻辑演算》并没有参考前人太多的成果。这篇论文注明的参考文献只有卡尔纳普的《语言的逻辑句法》、希尔伯特和阿克曼的《数理逻辑原理》，以及怀特海和罗素的《数学原理》。在这篇19页论文的第15页，麦卡洛克和匹茨在做总结的时候透露了一些他们所参考的更广泛文献来源：

     首先，如果每个网络接有纸带，它的扫描头与传入神经连接，并且有适合的传出神经进行必须的操作，那么它就只能计算图灵机能够计算的那些数；其次，图灵机能够计算的数也能够被这样的网络所计算……这就从心理学的角度，论证了图灵关于可计算性的定义，以及与其等价的邱奇的λ可定义、克莱尼的一般递归：如果任何一个数能够被有机体计算出来，那么它也可以被这些等价定义计算出来，反之亦然。[29]

     几年后的1948年，麦卡洛克将大脑与图灵机的联系表述得更加清楚。他解释说，他正努力寻找一种方法来发展神经生理学理论。

     直到我看了图灵的论文，才发现找到了正确的途径，也感谢匹茨那些必要的逻辑演算的帮助。我们认为，我们正在做的(我想我们获得了相当的成功)是将大脑视为一台图灵机；除非大脑出错，机能失常，否则大脑所进行的就是这台图灵机进行的功能……令人高兴的是，一些非常简单的假设就足以说明神经系统可以计算任何可计算的数。大脑就是一种仪器，一台图灵机(如果你喜欢这个词)。[30]

     一直到后来(1955年)，麦卡洛克依然坚持他的这个观点：“匹茨和我已经说明大脑就是图灵机。任何图灵机都可以由神经元构成。”[31]虽然现在的科学技术还不足以将这种等价性转换为实际用途。

     一个理论上的问题是，你能设计出一台机器做大脑所能做的事情吗？答案是：如果你能用有限的而且不含糊的方法说明大脑能够做的事情，我们就可以设计出这样一台图灵机。匹茨和我证明了如何完成这样的构造。但是你能说出大脑能够做的事情吗？[32]

     要不是引起了两位20世纪计算领域的巨匠诺伯特·维纳和冯·诺依曼的注意，麦卡洛克和匹茨的论文可能会因无人知晓数学生物物理学而失去光彩。

     继约翰·斯图亚特·穆勒后，诺伯特·维纳是又一个被那种臭名昭著的天才家庭教育模式培养长大的例子。这两个人后来都曾在回忆录中写过小时候被满脸胡须的父亲塑造为天才儿童的体验。而对于维纳，小时候留下的伤疤终其一生都难以愈合。多年来，他要和未经诊断的抑郁症抗争，与其天才般的研究热情相伴的是难以名状的暴躁情绪和产生自杀倾向的绝望状态。

     11岁时，维纳就进入了塔夫斯大学，14岁时拿到了数学学士学位，18岁成为哈佛大学历史上最年轻的博士毕业生。维纳的父亲一直对新闻界说，他的儿子“并不是神童”，事实上“很懒惰”[33]。他的父母还对外界隐瞒了一个事实：维纳在15岁之前一直不知道自己是犹太人。

     离开哈佛后，维纳在剑桥随罗素学习数理逻辑，随哈代学习数论。第一次世界大战前夕，他又来到了哥廷根，随希尔伯特学习微分方程。后来，他又去了哥伦比亚大学，随约翰·杜威学习哲学。1919年，他成为麻省理工学院的教员。

     在战争期间，维纳是当时新兴的通信工程和模拟计算研究领域的先锋。他参加了范内瓦·布什在MIT组织的模拟信号计算的研究项目，而且似乎这对克劳德·香农发展通信理论产生了影响。在二次世界大战期间，维纳的工作项目是研究防空火力系统。这些系统加入了比原有技术更复杂的预测部分，目标是预测飞行器为躲避导弹可能采取的路线。维纳对反馈的概念异常有兴趣，反馈就是从一个正在进行的进程中不断得到运行信息而反过来修正这个进程。

     维纳并没有参加1942年5月13日在贝克曼酒店召开的第一次物理学、生物学和人类学大会，这次会议由小约西亚·梅西基金会赞助，旨在拓展各学科间的交流。麦卡洛克参加了那次会议。参加那次会议的还有人类学家格列高里·贝特森和玛格丽特·米德夫妇。维纳参加了战后的第一次梅西基金会的会议，那次会议的主题是“生物和社会科学中的反馈机制和循环因果系统”。[34]参加这次会议的还有匹茨和冯·诺依曼。这样的会议让每个人都有机会吸收他人的研究成果，并探索各自研究领域是否存在一些契合的研究目标。

     1947年，维纳写了一本书，总结了这些会议上讨论的一些研究工作。他想用一个新词来描述包含了机器、生物和社会结构领域中的各种通信和反馈的研究工作。他选择了一个希腊词cybernetics，原意是“舵手”，因为舵手的本质也是利用反馈来修正航线的偏移。维纳的书出版于1948年，书名最后定为《控制论：关于在动物和机器中控制和通信的科学》(Cybernetics: Control and Communication in the Animal and the Machine)。

     美国《时代》杂志评价道：“很少有一本书能够在很多不同的科学领域激起强烈的反响。而《控制论》就是这样的一本。”[35]今天再读起来，《控制论》是一本古怪而小巧的书，里面有很多篇幅的数学公式和令人目眩的、不太切合实际的议论。在引言里，维纳对那些启发过他的人们表示了感谢，包括麦卡洛克，“一个对研究脑皮层细胞的组织结构充满兴趣的人”；阿兰·图灵，“也许是第一个研究智能机器的逻辑可能性的人”；沃特·匹茨，“卡尔纳普在芝加哥的学生，和拉谢甫斯基及其生物物理研究团队一直保持着联系”。维纳也对计算机的先驱“哈佛的艾肯教授、高等研究院的冯·诺依曼教授、宾夕法尼亚大学负责ENIAC和EDVAC巨型机的戈登斯坦教授”表示了感谢。[36]

     《控制论》的第5章是“计算机器和神经系统”。维纳对比了数字计算机的转换机制与麦卡洛克和匹茨的大脑模型：

     众所周知，人和动物神经系统能够完成计算系统的工作。神经系统的一个显著特点是包含了适合做继电器的元素，这些元素称为神经元或神经细胞。虽然它们在电流的刺激下会呈现复杂的特性，但是其普遍的生物特性都遵循“全或无”的原则，即要么处于休息的状态，要么当“工作”的时候经历一系列变化，而这些变化与刺激的外部环境和强度无关。[37]

     两章之后，维纳写道：“认识到大脑和计算机器实现之间的共同点，可能为精神病理学甚至是精神病学的发展提供新的有效方法。”[38]然而，维纳并不是一个狂热的纯技术狂。他也很关心这个新的科学技术对人类的影响。他写了《人有人的用处：控制论与社会》(The Human Use of Human Beings: Cybernetics and Society)，作为1948年《控制论》的补充。

     控制论成为很多领域的研究焦点，这种情况一直到了1951年，维纳突然不加解释地中断了与麦卡洛克和控制论研究团队的联系。这个研究团队的人员很大程度上是因为麦卡洛克的个人魅力而聚在一起的，其中包括匹茨，他的博士论文是在维纳的指导下完成的。关于他们关系分裂有几种解释。一种观点是麦卡洛克性格较为细腻，而精神有缺陷的维纳已经无法捕捉麦卡洛克言语表达中的细微差别。有些时候，维纳分辨不出麦卡洛克是在陈述一件事实还是在说一个猜想。[39]另一种观点是维纳的妻子出于嫉妒心，为了维护丈夫的声名，谎称麦卡洛克带领的团队中有人勾引他们的女儿。[40]

     作为一门统一的学科，失去了维纳和麦卡洛克联手的控制论遭受了很大的损失。在因这次决裂受到影响的人当中，匹茨可能受到的打击最大。他的精神完全垮掉了，他亲手毁掉了自己的研究成果和博士论文，开始了一段漫长的自我堕落的生活。“他不是简单地酗酒，这种人人都会的行为与他这样的高智商不匹配。他在实验室里自己合成了一种类似巴比妥类药物和鸦片的化学物质，伴着酒吞下去。”[41]匹茨于1969年死于慢性饮酒过多造成的食道静脉破裂，年仅46岁。

     即便维纳和麦卡洛克之间没有分裂，也不能保证控制论会一直发展下去。在美国学术界，跨学科的概念并没有市场，专业性的研究才是取得成功的钥匙。虽然有很多复兴控制论的尝试，但是大多数只是在当今流行的词语中加入cyber前缀的文字游戏而已，就像cyborg(cybernetic organism的缩写，机械人)，还有无处不在的cyberspace、cybercafe、cyberpunk和cybersex。即使是这些以cyber为前缀的词，近年来也逐渐被e开头的词取代了。

     麦卡洛克和匹茨关于神经网络数学模型的论文给了冯·诺依曼很多启迪。冯·诺依曼参与了几个重大计算机项目的设计工作，包括计算机的雏形EDVAC(Electronic Discrete Variable Automatic Computer，电子离散变量自动计算机)。在EDVAC的第一份报告(1945年6月30日)中，冯·诺依曼这样描述计算机的开关机制：“每一台电子计算机都包含了起着中继作用的’元素’，这些元素有着若干个离散平衡状态，并能保持在某个状态不变。”[42]通过引用麦卡洛克和匹茨的论文，冯·诺依曼写道：“值得一提的是，高级动物的神经元毫无疑问就是上述意义下的元素。”[43]

     次年，冯·诺依曼开始着手研究生物和机器之间的关系。他用了一个希腊单词来表现生物体的这种特性：自动机(automaton)。[44]在一封写给维纳的信中，冯·诺依曼惊叹于他们直接研究大脑这个自然界最复杂的人工自动机是多么具有雄心壮志的一项研究工作：

     我们的思维，我指的是你、我和匹茨的思维，目前为止都主要关注在神经系统上，更确切地说，是人类的中枢神经系统。为了搞清楚自动机及其普遍的机制，我们选择了研究大脑这个普天之下最难的问题。事实上，如果没有这些大胆而艰苦的研究工作，现阶段的研究人员，至少是我，对自动机这个课题的认识就会比现在混乱得多。这里，我也要指出，图灵在非神经领域的研究也是如此的大胆卓越。[45]

     对冯·诺依曼来说，自动机就是一台有着输入、输出和中间处理过程的设备。1948年9月，他在加州理工学院的“行为的大脑机制”研讨会上做了报告。他的演讲题为“自动机的一般逻辑理论”，包含了很多关于大脑与1948年时计算机在尺寸、速度、转换机制和能源消耗上的对比。他强调了开发一种新型逻辑的必要性，并开始思考后来成为他主要课题兴趣的问题：自复制自动机。[46]

     维纳对冯·诺依曼的这个想法开玩笑说：“我觉得你所说的(自动机)未来能够自我复制的能力很有意思……看来有机会可以写一个新的《金西报告》[47](Kinsey report)了。”[48] 但对于冯·诺依曼来说，自复制自动机可不是一个玩笑。他一直在想是否有某种未知的规律可以阻止一台机器制造一台它的复制品。即使生物不是这样繁殖的(虽然DNA本身是自复制的)，这样的问题也折射出了有趣的本体论的味道。

     对自动机和图灵机的不断研究诞生了几部经典的开山之作，如通信理论的创始人香农和人工智能的先驱之一、也是Lisp语言的创造者约翰·麦卡锡合著的《自动机研究》(Automata Studies)，由普林斯顿大学出版社在1956年出版。这本书包含了冯·诺依曼、克莱尼和人工智能先驱之一的马文·明斯基的几篇关于自动机的论文，也包含了香农和马丁·戴维斯关于图灵机的第一篇论文。

     当20世纪50年代早期冷战逐渐升温的时候，维纳和冯·诺依曼发现他们各自站在了不同的政治立场上。维纳被美国在日本广岛和长崎投下的两颗原子弹的破坏力所震惊，他从此拒绝了从政府那里接受研究经费，他的文章也逐渐聚焦于现代科技的使用带来的战争和和平等社会问题。相反，冷战让冯·诺依曼产生了反共产主义的倾向，他成为核武器的坚定支持者。1955年，冯·诺依曼被诊断出骨癌，1956年开始住院治疗，次年与世长辞，终年53岁。冯·诺依曼的癌症很可能是他亲临原子弹试验场时受核辐射所致。[49]

     冯·诺依曼死后留下了一系列未完成的讲义，这些讲义汇集成《计算机和人脑》(The Computer and the Brain)一书，于1958年出版。这本书虽然不尽人意，但它还是给了我们很多冯·诺依曼可能想表达什么内容的一些诱人的暗示。基于冯·诺依曼那些关于自动机的未完成手稿，阿瑟·W. 巴克斯编辑并完成了一本名为《自复制自动机的理论》(Theory of Self-Reproducing Automata)的书，于1966年出版。

     在早期对自复制自动机的研究中，冯·诺依曼想象机器处在一个拥有很多备用零件的环境中，然后探讨这部机器是如何组装产生它们的复制品的。这样的自动机就是运动自动机(kinematic automata)，基本上和我们平常所说的机器人是一个意思。

     在与他的好友斯塔尼斯拉夫·乌拉姆(一位研究晶体增长的科学家)共同讨论后，冯·诺依曼决定先研究一个较为简单的模型——元胞自动机(cellular automata)。

     元胞自动机是对于细胞结构的一个数学构造。元胞自动机可以以多种维度存在，但是实际的研究中基本上只考虑二维网格。每个网格中的细胞都会受隔壁网格中的细胞所影响，仿佛这些细胞连在了一个简单的网络中。经过持续的“移动”和“生成”，细胞根据特定规则变化不同的状态。元胞自动机的简单规则经常会产生复杂的行为。冯·诺依曼研究了拥有29个状态的元胞自动机，并且证明了这些自动机可以通过组装构成一个通用图灵机。[50]

     元胞自动机在20世纪70年代突然超脱了自己的学术圈。英国数学家约翰·霍顿·康威(1937—)设计了一个他称为“生命游戏”(Game of Life)的简单元胞自动机。该自动机有一个简单规则：在一个类似方格纸的二维网格上，一个细胞要么是活的(方格被填充)要么是死的(方格未被填充)。在每一次后继的繁衍中，一个细胞根据它周围临近的8个细胞改变其自身的状态：如果一个活细胞被2个或者3个活细胞包围，它依然存活；如果被0个或1个活细胞包围，它会因孤独而死掉；被4个或4个以上活细胞包围，它也会因过度拥挤而死掉。一个被3个活细胞包围的死细胞则会因为一种“神奇”的繁衍形式而成活。

     在《科学美国人》中，马丁·加德纳“数学游戏”专栏中的几个填充谜题让康威的游戏变得流行起来，[51]1974年，《时代》杂志抱怨“价值几百万美元的计算机都把时间浪费在对这种游戏持续增长的狂热中了”。[52]当然，1974年并没有个人计算机，只有大型机。现在，这个游戏大多是在个人计算机中运行了，我想《时代》杂志此时不会再说这很狂热了吧。

     虽然只有简单的规则，但这台自动机却能呈现出一些非常复杂的模式，例如它可以呈现出不断繁殖后代的模式。虽然看上去不可能，但是图灵机确实可以通过这样的元胞自动机构造出来，这台自动机是图灵完备的。[53]

     另一位对元胞自动机的研究感兴趣的人是德国工程师康拉德·楚泽。楚泽比图灵早两年零一天出生。当图灵在写他关于可计算数的论文时，楚泽正在他父母柏林的公寓里制造计算机。

     1969年，楚泽出版了一本74页的书，名为《计算空间》(Rechnender Raum)，是“数字物理”领域最早的一部著作。数字物理是研究如何在可计算的框架内解释宇宙运动法则的学科。

     传统上，物理定律是假定为连续的。距离、速度、质量和能量的度量似乎最适合用实数表示，用微分方程运算。但是一些量子理论的观点指出，宇宙内在的自然结构可能是离散的、数字的。现实世界里自然界的连续性可能只是一个假象。“宇宙到底是数字的，还是模拟的，抑或两者皆有呢？”楚泽问道，“而提出这个问题本身是不是合理呢？”[54]为了从数字角度探索物理定律，楚泽创造了可以被元胞自动机运算的“数字粒子”的概念。《计算空间》是用数字物理描述宇宙的一个实验性的尝试，但毫无疑问，它是一个大胆的创新。

     初看之下，很难把宇宙认为是一部巨型计算机。如果我们忽略相对而言非常渺小的、蜗居在宇宙中至少一个星体上的生命形式，似乎宇宙并没有涉及很多可计算的运动。那么，宇宙真的只是有一堆石头飞来飞去的时空吗？

     我们从更宽阔的视角来看这个问题。现今的宇宙模型指出，宇宙开创于137亿年前的大爆炸，地球形成于45亿年前，地球上的生命始于37亿年前，最早的灵长类动物大概出现在1千万年前，而现代人类大概只能追溯到2百万年前。显然，有一些东西一直在促使着这个世界趋向于复杂。大爆炸后的最初期，宇宙是完全均匀的——一种简单的象征，然后出现较为复杂的粒子，最终原子、分子开始形成发展。这是一个由简单到复杂的过程，大概是基于相对简单的宇宙法则，这与元胞自动机有几分神似。

     宇宙的计算模型一般归功于通信理论的奠基人香农和维纳对图灵机的贡献。使用熵度量信息构建了通信学和热力学之间的桥梁，这也是过去几年一些畅销书的主题。[55]例如，麦克斯韦妖(Maxwell’s Demon)，这是詹姆斯·克拉克·麦克斯韦(1831—1879)发明的一个假想精灵。用一个隔板将容器分成两格，这个精灵可以操作隔板上的一扇小门，使运动快的分子流入容器的一边，而让运动慢的分子呆在另一边，这样熵就减少了。这种想法被证明是不可行的，因为这个精灵自身也从系统中带走了部分熵。

     美国物理学家约翰·阿奇博尔德·惠勒(1911—2008)把宇宙的存在形式和人类的感知联系在了一起。我们在观察的基础上问是或否的问题，并接收信息予以回答。对这个过程，用惠勒著名的三个词讲就是“万物源于比特”(it from bit)：【未完，后续更精彩：(选读)一旦二元论被抛弃，思维就必然被看作是大脑物理活动(协同身体的其他部分)的一种自然表现，而不是什么超自然的东西。虽然我们在情感上有一丝排斥，但是结论是昭然的：首先，思维在能力和局限上等同于图灵机；其次，理论上完全可能制造人工的思维。】

     后续阅读请按以下二维码关注拾柒年蝉，回复图灵查看



    http://www.duyihua.cn
返回哲学园返回首页返回百拇医药