本书把所构想的语言机器作为语言媒介系统工具的最新发展,语言机器也可以放在计算机器的历史中来进行分析与比较。
图灵在构想图灵机时,是从观察人用笔在纸上进行计算的过程开始的,所构想的图灵机装置就是用来模拟人类计算过程中的行为。图灵机通过建立符号,内部状态,以及输入与状态如何决定输出的规则来对计算问题建模。简单地说,给出输入,图灵机就能有规则地输出。图灵机的思想更多是从机器出发的,这体现于图灵机的原子操作都是基于一个字符进行的:读入一个字符,进行判断处理,输出也只是一个字符或无输出。这从人的视角来理解并不自然。人工计算操作时关注对象是各种表达式,只在特定的情形下,才可能是单个的符号。在本书中,我们把计算看作是表达式上的等价-替换作为计算操作。在抽象的意义上,图灵机从输入到规则的输出也可看作是一种替换操作。只是单个符号上的替换并不是人类计算行为模式。带来的效果是同样的问题通常图灵机需要建立更多的规则。
前面讲过,图灵机与乔姆斯基的2型文法等价。乔姆斯基文法理论的基础,如产生式规则,性质上也是一种替换操作。乔姆斯基的文法理论构成了现代程序设计语言的语法基础。在图灵提交其论文几个月前,美国数学家阿隆佐·邱奇(Alonzo Church:1903.6–1995.8)提交了论文“关于判定性问题的解释”,同样证明了判定性问题无解。邱奇的论证基于Lambda演算。邱奇的Lambda演算与图灵机的计算能力等价。考察Lambda演算理论,可以发现演算所进行的操作,明显地体现为递归的符号替换。对计算机器历史进行更多考察,可发现其它基于类似替换操作设计的计算机器模型。图灵机思想里没有说明从输入到输出的规则从那里来,这看作是开放的。邱奇Lambda演算理论、乔姆斯基文法理论及其他的理论与模型,也都是从特定技术角度来考虑替换的。本书里并不把计算作为一个独立的主题来研究,而是把计算放在符号使用的背景下来研究,计算所依据的替换规则可归为知识或事实里的等价关系,包括现有的等价关系,以及潜在可推导出的等价关系。本书所基于的背景,使得机器可以作为语言媒介系统的工具。
现代计算机是图灵机的一种工程实现,图灵机并不是只能以现代计算机这样的方式实现。现代计算机的处理最终都分解回算术、逻辑的计算,图灵机理论本身没有这样的要求,这只是技术路线决定的。二进制及其计算在符号与物理上的一致性带来了现代的计算机。在语言机器构想中,从计算执行的效率来说,基于替换-转换的过程可以具有特别的优势。因为这可以在任何层次的表达式上直接进行操作,减少了分解回到原子操作的过程。表达式上的一次替换-转换操作对应的是多次现代计算机的原子级的算术、逻辑计算操作及相应的内部通信,理论上空间与时间的消耗都会更小。
利用现在的计算机,虚拟出在表达式层次进行替换-转换操作的能力是可能的,或者封装出基于替换-转换操作的程序设计语言也是可能的。对语言机器的目标来说,这些方案只具有有限的验证意义。首先这带来了某种循环:基于逻辑、算术的计算去虚拟替换-转换操作,基于替换-转换操作又去构造逻辑、数学上的计算。概念上,本书认为替换-转换是比逻辑、算术计算更为基础的操作。其次,这牺牲了语言机器可能具有的效率优势。语言机器的构想,其设计与实现可能借鉴当前计算机的一些技术,整体的使用模式上很难去与冯·诺依曼型机器的使用类比。可以预计语言机器得以实现,它的能力也不会超过一台通用图灵机,这也不构成对语言机器的关键评价,语言机器所追求的是新的人机协同所能带来的效果,这些效果首先对人而言的。
如果语言机器最终是可实现的,这种机器是专用的,还是可以作为新的通用机器?现在去考虑这样的问题显得太早。可以看到,到目前本书的讨论基本是限定在理论性知识的范围,相比较,现在计算机的应用主要是在技术、工程性的领域。在这些领域的问题处理中,很多的问题并不是典型的计算问题;各类的问题的求解,经验性规则同样重要,它们不都是从理论可推导出的。本书是将语言机器放在语言工具的视角下来理解,支撑人对符号的使用始终是第一位。另一方面,机器一旦表现出某些潜力,人们就会去让机器的潜力得到最大的发挥,这种努力更容易进行,并可能对机器面向人的符号使用的目标产生反作用。
应用上,语言机器在语言机制与内容上的深入,与当前人工智能所考虑的问题相关,从而二者也可以去比较。根本上,它们思想上的出发点是不一样的。语言机器的首要目标是替换纸张、笔、墨水、计算机之类的工具来支撑人类的语言构建与使用,实现工具辅助下更有效的人类语言使用。当代的人工智能总的来说是用机器来模拟人脑的智力行为,从而更多原来由人完成的工作可以由机器替代。本书把人类的智力看作随符号使用而发挥或扩展的,而不是一个大致固定的模式可以用机器去模仿并替代。
在更好地配合人类使用符号的同时,人所具备的知识,机器可以以越来越相近的方式具备,且机器所具备的知识可以超出任何人类个体的容量;以前由人进行的符号规则性操作,越来越多可由机器执行,并且更具效率;此时,说机器表现出的行为具有智能的性质也没什么问题。我们来看一个具体的例子,类别与实例的关系。A是一个类别,x为类别下的一个实例,我们说x归属A,“归属”这个词可以通过解释为人理解。这种解释形成的理解是否真正有效是存疑的,我们也不可能对机器进行这样的解释。现在,可以实现这样的机制:x是类别A下的一个实例,包含A的任何命题,可以用x来替换其中的A,命题仍然成立。这种可替代的关系在特定语境中可由机器实际执行,从操作的意义上,语言机器表现出已理解了“x是类别A下的一个实例”。机器不会象人一样去理解符号单位有没有意义,具体有什么意义;另一方面,理解的一个重要标志是知道如何去操作符号。
一种流行的观点认为现代计算机较擅长处理结构化规则性知识,而对非结构化开放性的知识,如常识一类的知识,机器处理能力一般;机器在后一方向上进展,可以更多理解与模仿出人类的智能。首先,本书不认为已建立了对结构化规则性知识的完善理解,并将这一理解体现在机器应用上。现代计算机是从将计算作为一个独立的主题开始的。为此,本书建立了自己的理论,核心的观点是:知识基于等价关系表示,计算依据等价关系进行。在此基础上,我们论述了知识如何在机器里建立,从而也使机器具备推演能力。重要的是那些结构化规则性的知识,对应着符号对人类智能与认知的扩展,从机器与人类分工的角度,改善或创新工具来增强这种扩展是一种合理的做法。
对常识的重视使自然语言也成为当前人工智能的一个核心主题。通过建立复杂的语言模型,在大量语料上进行统计计算,机器也表现出一定的语言处理能力。从经济角度,这些进展可以具有巨大的价值,绝大多数的白领工作都是一些固定模式的工作,并不需要真正的创造性。这些处理接近了人类智力的某些部分,这是有可能的,但这不会是核心的部分。语言机器所具有的推演能力,理想的情况下是从当前已知的理论与事实,可以计算出所有可能的结论,这种能力是人类借助符号扩展的那一部分智力,本书只是重新理解并去将这一部分的智力实现为更通用的方式。
当我们建立的系统表现出可以命名、可以定义、可以去形成新的认知并表达,以及能提出问题,大概才能说接近了人类智力的核心。这可能需要更系统的研究,建立从感知经验到符号系统,从自然语言到抽象符号系统的连续理解,才可能发现背后是否存在一些始终依赖的智力形式。本书更关心的是:能否发展新的符号形式与使用方式,使人类对符号的使用更高效。