您当前的位置:首页 >> 众测
学界之声|徐英瑾:黑格尔“逻辑学”对人工智能的启示
发布时间:2019-07-12
 

   


黑格尔“逻辑学”对人工智能的启示


徐英瑾


摘要:将黑格尔哲学与人工智能研究联系在一起的纽带, 乃是所谓的“框架问题”:编程者该如何设计智能体,  才能够使其在进行趋利避害的考量中, 自动避免过多地涉及不相关獉獉獉的事项, 并以此提高其整体行为效率呢?从语言哲学与逻辑哲学的角度看,  该问题的真正的矛头指向乃是基于真值函项语义学的传统编程方式,  因为这种编程方式的确无法完美地刻画出语义层面上的“相关性”与“不相关性”。而黑格尔的《逻辑学》在此被引入的必要性也正体现于如下考量:从人工智能或认知科学的角度看,  《逻辑学》所讨论的诸种范畴,  其实就是智能体用以在不同层面上进行“相关性”指派时所必须依赖的工具箱。若进一步以《逻辑学》的“‘是’论”为主要分析对象,  那黑格尔带给人工智能研究的启发就体现在:将作为系词的“是”联接与综合各种表象的统一功能拆分为不同的谓词,  否则我们就难以避免陷入“如何周延地列举基本谓词”这一技术困境;黑格尔对于“变”这一范畴基本地位的强调,  既批判了公理化进路的符号人工智能对于语境性变化的迟钝,  也批判了人工神经元网络技术或深度学习技术用单纯的“映射法”回避跨语境推理的做法;黑格尔在“是—否—变”之间展开的辩证推理过程,  并不能落实为某种充满神秘主义色彩的“辩证逻辑”, 而必须被理解为对于认知主体探索真理的基本步骤的一种概括。因此,  与之能够相提并论的人工智能对应物, 也并不是一阶谓词逻辑、贝叶斯网络或人工神经元网络, 而是可以被图示化为“流程图”的某种宏观问题解决策略,  譬如司马贺与纽埃尔的“通用问题求解器”所涉及的“目标—手段”进路。最后, 从总体上看,  将黑格尔的《逻辑学》在现代哲学语境中加以祛魅化的基本思路, 便是卸载《逻辑学》研究的形而上学负担, 将其视为某种纯粹的认知逻辑研究。而反过来说,  在变更这种基本解释策略的前提下对于人工智能要素的引入, 也为黑格尔式逻辑自身的工程学化实现提供了契机。


关键词:黑格尔;人工智能;范畴; 逻辑学;框架逻辑;语义相关性;


一、导论

                        

按照一般人的理解, 作为一门与逻辑学、统计学等学科有着密切关系的综合学科,  “人工智能” (Artificial Intelligence, 简称AI) 应当在精神气质上更接近于同样重视逻辑分析的分析哲学,  而不是欧陆哲学。但多少具有一点讽刺意味的是, 使得“人工智能哲学” (Philosophy of Artificial  Intelligence) 这个学术分支得以在英语世界确立的两位重磅级思想家———德瑞福斯 (Hubert Dreyfus) 与郝格兰  (John Haugeland) ———其实都主要是欧陆哲学背景的, 尽管两者对于分析传统也并不陌生。特别是德瑞福斯,  他从海德格尔的角度重新梳理AI的研究路数, 已在西方学界催生出了一个叫“海德格尔式的人工智能/认知科学” (Heideggerian  AI/cognitive science) 的研究路向, 并衍生出大量相关研究成果。 (1) 这样的研究方式自然也促进了整个现象学与认知科学之间的互动, 并使得“现象学的认知科学化”成为最近三十年来西方哲学界最让人激动的发展趋势之一。 (2)


然而, 相比海德格尔与其他现象学家而言,  同样作为欧陆哲学大师的黑格尔却几乎受到了人工智能哲学家的集体忽视。譬如, 在人工智能哲学方面的另一位领军人物玛格丽特·博登 (Margaret  Boden) 女士所撰写的厚达1631页的认知科学史巨著《作为机器的心灵》 (3) 的“人名索引”中,  “黑格尔”的名字仅仅被提到1次———与之相比较, 同样作为欧陆系哲学家的康德则被提到5次, 海德格尔被提到3次,  梅洛-庞蒂被提到8次。有人或许会说, 黑格尔之所以被忽视, 是因为他文风晦涩, 难以被后世的AI研究者理解;而他对于辩证逻辑的推崇,  也使得崇尚“知性思维”的AI专家们唯恐避之而不及。不过, 若再仔细一想, 其实这样的理由未必就非常站得住脚,  因为就文风的晦涩度与就对于“知性思维”的批判力度而言, 海德格尔哲学比黑格尔哲学其实是有过之而无不及。另外, 从某种意义上说,  黑格尔对于自然科学的友好程度, 其实比海德格尔还略胜一筹。 (4) 在这样的情况下, 在讨论传统欧陆哲学与AI关系时排除黑格尔的做法, 就显得多少有点怪异了。


而在笔者看来, 黑格尔之所以被主流的AI哲学专家所忽略,  仅仅是基于一个非常偶然的事实:即使在全球范围内, 同时了解黑格尔哲学与AI发展的文理复合型人才也是相对缺乏的。在这方面,  海德格尔之所以比黑格尔更容易得到大家的垂青, 也是基于如下这样一个同样非常偶然的事实:德瑞福斯与郝格兰在转向AI哲学研究之前,  就已经是海德格尔哲学研究方向上的优秀专家了。换言之, 倘若在另外一个可能世界中,  德瑞福斯与郝格兰在转向AI哲学研究之前首先研究的就是黑格尔哲学的话, 那么,  也许目下笔者就需要为“为何海德格尔在AI哲学研究中受到歧视”这一“现状”而鸣不平了。


读者或许还要问:既然我们已经有了“海德格尔式的AI”研究了, 我们为何还需要一种“黑格尔式的AI研究”来画蛇添足呢?难道后一种研究进路能够提供前者所不能够提供的某种新视角吗?


对于上述疑问的回答乃是肯定的。概而言之, 黑格尔哲学与海氏  (即指海德格尔, 下同) 哲学虽然在表述的晦涩性上彼此相近, 却在哲学内核上有所分别。大体而言,  黑格尔哲学是一种基于概念表征之间关系的“概念型哲学”, 而海氏哲学则是一种探讨概念关系之下的现象学根据的“前概念型哲学”。因此,  海氏哲学更容易与认知科学中对于“具身性” (embodiment) 问题的讨论发生亲缘关系,  而黑格尔哲学则与传统认知科学或AI中的“符号主义纲领”具有更多的可类比性。若从AI研究自身的学术分工角度看,  黑格尔哲学与“知识表征”、“日常推理”、“自然语言处理”等分支关系更为密切, 而海氏哲学则与“计算机知觉”、“非确定环境下的推理”等话题更为相关  (尽管这些研究议题之间的分界线有时候并不是那么清楚的) 。这也就是说,  如果我们认为“知识表征”、“日常推理”、“自然语言处理”等分支依然是AI研究的核心话题之一的话, 那么,  黑格尔哲学就具有某种海氏哲学所无法取代的价值。


读者或许还会问:既然我们需要黑格尔哲学为目下的人工智能发展“把脉”, 这就预设了当下的人工智能研究的确是出现了某些需要从哲学角度加以把握的重大问题。那么, 到底是什么问题需要我们请出黑格尔哲学呢?


这个问题就是“框架问题”。

                    

二、让人讨厌的“框架问题”

                        

众所周知, 美国哲学家塞尔 (John Searle) 在经典论文《心智、语言和机器》 (1) 中区分了“强AI”与“弱AI”这两个概念:前者指的是一个真正具有人类心智能力的计算机器,  而后者指涉的仅仅是能够模拟人类心智能力的计算机器。塞尔进一步认为“强AI”是不可能实现的, 因为任何一台计算机器都只能够在“句法层次”  (syntactic level) 上规定机器的运作, 而无法由此达到智能活动所必然会牵涉到的“语义层次” (semantic level)  (在塞尔的语境中, 形容词“句法的”几乎同义于“机械的”, 而不仅仅取其在语言学领域内的意义) 。


笔者认为塞尔的观点具有部分的真理, 也具有部分的谬误。具体而言,  诚如塞尔所言, “语义落地”问题的确是人工智能研究的一个核心问题, 而目下AI学界对于该问题的主流处理方案的确不算高明 (详后)  。但笔者却无法赞同塞尔所给出的如下终极审判———“未来的AI将永远无法具有一个能够理解语义内容的人类心智系统”,  因为塞尔赖以支持该终极审判意见的论据 (即所谓的“汉字屋思想实验”) 本身是站不住脚的。 (2) 而且, 塞尔对于AI的这种悲观态度, 在相当程度上也会使得人类智能在演化历程中的出现成为了一件难解之事。换言之, 如果“随附式物理主义”是对的话, 那么我们就难以按照塞尔的理路来解释, 为何人类神经元的机械运作能够在高层面催生语义智能呢? (3)


那么, 我们又该如何在回避塞尔的“汉字屋论证”的情况下, 更为恰当地表达出对于所谓“语义落地问题”的理论忧虑呢?


一种更为合适的表达路径是“框架问题” (frame problem) 。 (4) 对于该问题的一种非技术化的表达便是:一个AI系统在给出某个操作的时候,  它又该如何自动确定其中的某些操作 (如住在上海的张三按下传真机的按钮这一操作) 不会导致某些后果 (如住在墨尔本的琼斯的小狗的心律之波动)  的发生呢?这个问题在实践上之所以具有重要意义, 乃是因为如下张力的存在:一方面, 任何一个智能体都应当能够对其做出的任何行为的后果进行预估,  由此进行“趋利避害” (否则其表现就不足以体现真正的智能) ;另一方面, 它又必须能够将那些明显不相关于当下决策或行为的“非后果”  (non-effects) 明确排斥出当下的考虑行为, 以加强决策的效率 (否则其行为依然不足以表现出足够的智能)  。而依据此方式被理解的“框架问题”, 则可以被抽象为如下形式:编程者该如何设计智能体, 才能够使其在进行趋利避害的考量中,  尽量避免过多地考虑不相关的事项, 以此提高其整体行为效率呢?


而对于“框架问题”的上述抽象形式,  显然已经涉及了“语义相关性”这个奠基于“语义内容”之上的复合概念。这也就是说, 框架问题恰恰是以它自己的方式,  切中了塞尔所提出的那个原初的哲学问题:计算机在句法层面上的机械操作是如何规定出那种超越于机械运作的语义内容的呢?很显然,  如果塞尔对于整个“句法—语义”关系的消极判断是正确的, 那么从原则上说, 框架问题本身也应当是无解的, 而这一点本身似乎就足以宣判强AI的死刑。


不过, 正如笔者不相信“汉字屋思想实验”足以宣判强AI的死刑一样,  笔者也不相信“框架问题”足以宣判强AI的死刑———尽管从经验角度看, 该问题对于目下主流AI研究的挑战的确是足够强大的。非常粗略地说,  框架问题对于符号AI进路的挑战就在于:除非编程者事先以“框架公理”的方式, 手动输入关于“何事与何事不相关”的信息,  否则系统本身是无法自行判断“何事与何事不相关”的。而即使手动输入“框架公理”的做法勉强可行,  这一做法又会带来如下深层次困难:能够与“何事与何事不相关”的信息所对应的可能的框架公理数量乃是无穷多的 (譬如,  既然你能想到喝豆浆与读黑格尔不那么相关, 那么你就能再想到吃羊腰子与读海德格尔也不那么相关, 由此, 你也就能再联想到无数个“非相关项”)  。在这种情况下, 要么编程者自己会因罗列这些无穷无尽的框架公理而苦不堪言,  要么系统本身也会因为逐一检索这些框架公理而变得不堪重负。甚至对于貌似比符号AI更为“先进”的人工神经元网络技术  (以及作为其“进化版”的深度学习技术) 来说,  “框架问题”也是一个难解的问题。其背后的道理乃是:即使一个深度学习系统能够通过海量的语料学习建立起了一个所谓的“向量空间模型” (Vector  Space Model)  (1) , 并通过这个模型来使两个语词之间的“语义距离”的度量成为可能,  如下问题也会阻挠这样的模型成为一种对于“框架问题”的有效解决方案:由于我们人类具有从简单词项构造出无数个复合词项的能力  (比如从“糕”出发构造出“一块热腾腾的粢饭糕”的能力) , 一个针对所有的词项 (包含复合词项)  的“语义向量空间模型”在原则上便是无法被构建出来的。而一种被勉强构建出来的语义空间模型, 则也会因为忽略了复合词项的存在,  而无法计算出两个新出现的复合词项之间的语义距离。而出现这种情况的深层次原因则是:深度学习机制在骨子里就是一个统计学系统, 而所有的统计学系统  (无论是贝叶斯网络还是神经网络) 其实都只能“由旧揣新”而无法“推陈出新”———因此,  如果系统所面临的新的复合词项在学习语料库中未曾出现过的话, 系统肯定就会变得手足无措。反过来说,  如果这样的系统要学会人类“推陈出新”的语言构造能力,  它就必须理解语言中基本范畴的使用规则———而这种能力却又恰恰是基于统计学的整个运作机制所无法涵盖的  (因为规则自身的权威性并不能被还原为相关表达式出现的统计学频度) 。


但以上说的这些, 与黑格尔又有什么关系呢?


从表面上看来, “框架问题”的存在,  似乎并不能够证明在AI研究中引入黑格尔哲学思想资源的必要性, 反而能证明黑格尔哲学的无力性。相关理由如下:正如前文所指出的,  解决框架问题的要害, 乃在于如何使得系统在处理当下问题时不涉及知识库中过多的事项, 以便提高系统的运作效率。因此,  这种解决方案肯定包含着某种“做减法”的要求。然而, 黑格尔哲学给人的印象却是“整体主义”,  也就是那种从所谓的“感性确定性”中牵扯出整个“绝对知识”的宏大叙述风格。要向这样的哲学寻找“框架问题”的解决方案, 难道不是在缘木求鱼吗?


但这种批评意见其实并不能真正站得住脚。严格地说,  黑格尔本人说的“绝对知识”并不是像前面所说的“语义向量空间模型”那样的经验知识大全, 而是某种纯粹思维层面上的高阶知识。这也就是说,  黑格尔所真正看重的, 乃是使得经验知识得以被组织起来的某种“元知识”。不难想见, 如果AI也能够获取这种元知识的话,  那么这样的系统或许就能以更为灵活的方式组织经验知识, 以此规避框架问题。由此, 黑格尔哲学与AI之间的思想交流管道, 也能够被顺利疏通。


但到底是哪些黑格尔式的“元知识”内容才对AI有特别的借鉴意义呢?要回答这一问题,  我们需要以一种新的眼光来复习黑格尔的《逻辑学》体系。而在下面的讨论中, 笔者将具体采取这样的讨论策略:首先,  笔者将暂时搁置对于AI问题的讨论, 而着力将黑格尔《逻辑学》的核心理论命意加以“祛魅化”;然后, 笔者再将AI的视角重新切入现场,  以便构成黑格尔与AI之间的积极对话。

                    

三、黑格尔的“语义逻辑”及其与人工智能之间的关联

                        

在本文中,  笔者之所以选择目前有点受到学界冷落的《逻辑学》———而不是在二十世纪的西方哲学史中更受推崇的《精神现象学》———作为考察的重点,  乃是因为笔者认为《逻辑学》的关涉与本文的论题更为相关。换言之, 恰恰是因为现代意义上的人工智能与逻辑学及统计学的发展有着莫大的关系,  同样对逻辑学问题有着深入探讨的黑格尔版本的《逻辑学》才更可能为一种“黑格尔式的AI哲学”提供思想养料。 (1)


不过, 众所周知,  现代意义上的符号主义AI与弗雷格在形式逻辑领域开创的革命颇有关联, 而与之相比较, 按照一种通常哲学史意见,  黑格尔的《逻辑学》所研究的并不是形式逻辑意义上的“逻辑学”, 而是人类思维的基本形式———范畴。用黑格尔自己的话来说,  即使在像“这是一片绿叶”这样的包含有明显的经验内容的判断中, 诸如“单称性”、“是”这样的范畴依然会起到某种“骨架支撑”的作用。 (2) 不过,  要说清楚“范畴”与形式逻辑家所说的“逻辑常项” (如“或”、“非”等) 之间的关系,  的确不是那么容易。虽然很难说形式逻辑家完全不研究黑格尔所提到的这些范畴, 但在黑格尔范畴表中所覆盖的很多内容  (如在《逻辑学》之“是论”中所涉及的“定在”, “本质论”里面涉及的“现象”、“根据”, 以及“概念论”所涉及的“机械论”、“目的论”, 等等)  , 似乎都不是普通的形式逻辑教科书所应涉及的事项。也正由于黑格尔的“逻辑学”与传统逻辑之种种不同, 学界过去常用“辩证逻辑”一词来称谓之,  以此彰显辩证法思维与知性思维之间的分野。按照上述见解,  黑格尔对于整个德国古典哲学的“逻辑”观所作出的贡献也就体现在:他在先驱康德所开出的“普通逻辑”  (包含处理“先天分析判断”的演绎逻辑与处理“后天综合判断”的归纳逻辑) 与“先验逻辑” (专门用于“先天综合判断”) 之间的二分法之外,  再开出了“辩证逻辑”这一新分支 (见图1) 。



图1 通常学界所理解的黑格尔辩证逻辑与康德的逻辑观之间的关系


不过, 在笔者看来,  上述提法除了将本可以说得更清楚的问题弄得更为混乱之外, 并无任何裨益。从文本学角度看,  图1所不能解释的一个非常反常的现象是:亚里士多德的三段论推理所对应的那种逻辑显然属于“普通逻辑”而不是“辩证逻辑”, 因此,  黑格尔的《逻辑学》似乎就不应该讨论三段论———但我们恰恰在该书的第三部分“概念论”里找到了黑格尔对于三段论的大段讨论。由此看来,  “辩证逻辑”应当是涵摄了“普通逻辑”的, 而不是与之并列的。与之相类似的一个问题是:倘若“辩证逻辑”应当是与“先验逻辑”相互并列,  我们又该怎么解释《逻辑学》的第二部分“本质论”对于康德范畴表的全面覆盖呢?因此, 就像“辩证逻辑”应当是涵摄了“普通逻辑”一样,  它应当也是涵摄了“先验逻辑”的。换言之, “辩证逻辑”根本就不是与“普通逻辑”以及“先验逻辑”并列的一种新逻辑。毋宁说, 在黑格尔看来,  世界上只有一种逻辑, 也就是他自己的《逻辑学》所展现的那种逻辑, 而“普通逻辑”与“先验逻辑”只是它在不同阶段上的不同显现形式罢了。而且,  与康德的想法不同的是, 黑格尔还试图将那种被康德高度边缘化的“归纳逻辑”独立为一个新板块, 即《逻辑学》之“是论”。 (1) 这样一来, 图1所给出的逻辑分类表, 就极为戏剧性地被转化为了图2。有鉴于图1与图2之间的巨大差异, 我们甚至很难说黑格尔从康德那里积极地继承了任何体系性的思想———毋宁说, 他是摧毁了康德的整个思想构架, 并用由此得到的碎片构建出了他自己的思想大厦。

                    

图2 笔者所理解的黑格尔辩证逻辑与康德的逻辑观之间的关系


面对图1与图2之间的这种惊人反差,  我们切不可轻描淡写地认为黑格尔只是重组了康德思想元素的次序, 并在由此得到的新大厦上涂抹上一种叫“辩证法”的外墙用油漆。毋宁说,  正如意大利裔的黑格尔专家乔治·迪·乔凡尼 (George Di Giovanni) 在给《大逻辑》写英文版导言时所指出的,  在《逻辑学》的正式文本中, 黑格尔本人其实反倒不那么喜欢使用“辩证的”这一形容词———因此, 他自己的“逻辑”的本质恐怕不在于其“辩证性”,  而在于其“推演性” (discursiveness) , 也就是某种能够历经不同阶段而始终维持自身线索统一性的推演思路。 (2) 这也就是说,  黑格尔其实是提出了一个康德主义者很难回答的问题:如果“普通逻辑”与“先验逻辑”之间真是这么泾渭分明的话, 那么,  我们又该如何解释任何一个智能正常的人都能在任何一个典型的日常问题处理语境中自由调用这些逻辑工具呢?不同的逻辑工具之所以能够被引入同一个问题语境,  难道不正是因为其背后有某种统一的“调用平台”在起作用吗?———但除了将康德所提到的那些不同的“逻辑”都视为某种统一的“逻辑”的不同面相,  难道我们还有对于上述“调用平台”的更完美的说明方案吗?


那么, 这种更具“统一性”的“逻辑”本身究竟是什么呢?


为了避免继续使用“辩证逻辑”这个词所带来的思想混乱  (这种混乱往往是通俗哲学读物对于“辩证法”的种种庸俗解释所带来的) ,  笔者提出了对黑格尔的“逻辑”概念的如下祛魅化解释方案:黑格尔的“逻辑”在实质上是一种“语义逻辑”, 或者说,  是一种关于语义内容的推理逻辑。由于黑格尔式的“语义”概念本身就带有克服“语义—形式”二分法的意蕴,  所以这种逻辑才可能同时涵盖康德所说的“先验逻辑”与“普通逻辑”。


那么, 到底什么才叫“语义逻辑”呢?为了避免我们立即就陷入黑格尔自身的哲学文本所自带的晦涩性, 下面笔者将举一个来自于维特根斯坦哲学的例子来说明之。


维特根斯坦 (或称为“维氏”)  的早期哲学是建立在弗雷格所锻造的数理逻辑基础之上的, 而数理逻辑本身就是康德所说的“普通逻辑”在二十世纪最重要的演化形式。具体而言,  早年维氏根据这种“新普通逻辑”而在《逻辑哲学论》中提出了这样的形而上学观点:对于世界的描述可以被分解为那些自身不能够被分解的原子命题的真值函项———也就是说,  按照该理论, 我们若欲获知复合命题的真假, 仅仅需要先获知: (甲) 该命题所下属的所有原子命题的真假; (乙) 该复合命题自身的逻辑构造形式  (以及其所对应的真值函项的真值表) 。很显然, 无论是这里所提到的事项 (甲) , 还是事项 (乙) ,  都没有牵涉到原子命题的语义内容。不过, 让维特根斯坦感到头疼, 并促使他开始怀疑整个《逻辑哲学论》的真值函项理论的,  则恰恰是真值函项理论对于语义问题的上述全面回避。请试想下面这样一个推理:“视野中的这个色块是红色的, 因此它非绿的。” (1) 从直觉上看, 该推理显然是有效的, 但其有效性却明显依赖于“红”与“绿”在语义内容上的相互排斥, 而非任何一种真值表规定。在经过种种将上述语义排斥关系还原为真值函项关系的失败尝试之后 (2) , 维特根斯坦最终认定这些还原是不可能成功的, 并由此提出了“语法”概念, 以取代“逻辑”本来所占据的那个核心理论地位。 (3) 至于后期维氏在《哲学研究》中所提到的著名的“语言游戏规则”, 则只是对于前述“语法”概念的一种更具语用学色彩的表达罢了。


依据笔者浅见, 维氏的“语法—逻辑”对子,  为我们理解黑格尔式的“语义逻辑”的真正含义, 提供了一扇方便法门。具体而言, 就像维氏的“语法”概念不得不牵涉到具体经验词项之间的谱系关系一样,  黑格尔式的“语义逻辑”也将不得不牵涉到纯粹思维规定之间的语义关系, 而这些语义关系本身是无法被彻底外延化为真值函项的操作的。不过,  这也并非是说维氏所说的“语法”与黑格尔所说的“语义逻辑”就完全是一回事了。两者之间的差别体现在:第一, 经历过命题逻辑革命之洗礼的维氏,  即使在其后期思想中也依然表露出对于命题式思维的依赖,  并由此将“语法”与“规则”视为其思考的用力点。而依然处在词项逻辑阶段的黑格尔则更喜欢谈论“范畴”, 并将“判断”  (此即“命题”在德国古典哲学时代的对应物) 视为更为简单的范畴的语义衍生物 (黑格尔是在《逻辑学》的第三部分“概念论”才开始正面处理“判断”的)  。第二, 与作为日常语言学派代表人物的后期维特根斯坦不同, 黑格尔并不是一个非常痴迷于日常语用细节的哲学家。就其本人意图而言,  他还是试图让其“逻辑学”具有更为鲜明的“祛经验化”色彩, 即使其自身与颜色、形状、声音等感性内容拉开距离。依据这一思路,  黑格尔并未在其“逻辑学”中像晚年维氏那样纠结于“颜色语法”的种种细节。毋宁说, 在黑格尔看来,  讨论“颜色”这一话题的恰当场所乃是他自己的“自然哲学”, 而非“逻辑学”。有鉴于此, 黑格尔“逻辑学”的真正含义,  似乎应当被更为准确地界定为“纯粹语义逻辑学”, 而“语义逻辑”是这一表达的缩略形式而已。


那么, 在维特根斯坦的“语法研究”与黑格尔的“语义逻辑”之间, 究竟何者才对今日的AI研究更具启发价值呢?不得不承认, 尽管笔者曾经花费大量篇幅论证维氏哲学对于今日AI研究的启发意义 (4) , 但现在笔者却更倾向于将自己的同情票投给黑格尔。相关理由如下:


第一, 基本的语言学常识能够告诉我们,  任何一门经验语言的常用词项都是一个相对小的数字,  而由此能够被构造出来的语句或复合词项的总数却肯定是一个天文数字。这一分析也同样适用于维特根斯坦。虽然他所讨论的“语法命题”只是我们能够从基本词项中构造出来的所有语句中的一小部分,  但按照排列组合规则, 其总数已经非常惊人。 (5) 在这样的情况下,  如果一个AI专家将维氏“语法命题”视为编程工作的逻辑起点的话,  那么这就等于重复了前人在系统的知识库中将所有“框架公理”预先予以“锁死”的错误。与之相比较, 一种黑格尔式的从范畴出发的编程思路,  却可能会因为避免了对于大量命题知识的过早涉及而大大降低AI编程工作的负担。


第二, 避免过早涉及诸如“颜色”这样的感性内容的做法,  也同时会带给一个笃信黑格尔主义的AI研究者以这样的理论红利:他所设计的系统完全可以被自由地安插上各种各样的感官系统,  而不必处处与人类相同———譬如, 他完全可以去设计一个视力极为薄弱的、并仅仅依靠回声定位的AI系统。不过, 按照黑格尔主义者的观点,  即使是这样的系统, 也必须具备运用诸如“是”、“否”、“因果”等抽象范畴的能力, 否则它就无法进行自主思考, 因此也就不可能是智能的。因此,  黑格尔在“逻辑学”名目下对于“范畴”的研究成果, 也就具有了一种横跨人类与机器的普遍性。


有了上面的讨论做预备, 我们也就不难将《逻辑学》所列出的那些范畴对于AI语言表征的意义大致解释如下了:


第一部分“是论” (the doctrine of being)  讨论的主要范畴分“质的规定性”与“量的规定性”两大类, 前者的代表范畴有“是”、“否”、“变”,  后者的代表范畴是“纯粹量”、“定量”、“比例”等。从AI角度看, 这一部分要解决的任务是如何为系统编制最简单的主—谓判断,  以便为后续的语义建模提供基本的“建材”。由于这一部分对于“质”、“量”与“度”之间“正—反—合”关系的讨论实际上非常接近归纳逻辑的运作细节,  所以笔者将其视为黑格尔“逻辑学”中所处理的任务最接近所谓“统计学进路的AI” (如贝叶斯网络与人工神经元网络) 的部分  (尽管这些技术路径其实是无法完美地完成日常生活中的归纳任务的) 。


第二部分“本质论” (the doctrine of essence) ,  也就是对于判断自身的模态性质的再判断 (尽管对于“判断”这个概念自身的反思性运用, 要到“概念论”才会成为可能) 。所谓“模态性质”,  也就是一个主—谓判断自身在模态空间中的地位的判断———它究竟是可能为真的, 还是必然为真的, 还是偶然为真的呢?要回答这个问题,  系统就必须对该判断之所以被断定的“根据”进行追问, 由此必然又会牵涉到“假象”、“现实性”、“本质”、“因果性”等范畴。从AI的角度看,  “本质论”所涉及的这些概念工具如果能够被算法化的话, 自然能够帮助相关的AI系统自动地去伪存真,  以便提高其在外部环境中的适应性。这也是黑格尔的“逻辑学”体系中所处理的任务比较接近所谓“符号主义AI”的那部分  (尽管主流的符号AI其实是无法完美地完成被交付给它的相关任务的) 。


第三部分“概念论” (the doctrine of concept)  处理的是对于主体所处的整个环境的整体形势的高阶评估,  以及这些评估所需要使用到的概念工具。诸如“判断”、“三段论”、“机械论”、“生命”等高度抽象的概念,  都是在这个板块中被讨论的。就相对低级的AI产品而言, 对于这部分的概念工具的算法化并不显得那么必要,  因为对于一台按照机械论原理运作的计算机来说, 它未必需要在反思的层面上学会使用“机械论”这个概念。但对于比较高级的AI产品来说,  对于“概念论”所涉及的概念工具的算法化, 或许就会成为一件必要之事了。 (1) 譬如,  我们可以设想一台正在参与图灵测验的计算机, 正在被问及一些关于宇宙学、神学与形而上学的抽象问题,  而对这些问题的讨论显然需要动用“概念论”这个工具箱。再譬如,  我们也可以设想这么一种情况:一台本来仅仅按照“是论”与“本质论”提供的概念工具进行工作的机器, 突然发现现有的概念工具不够用,  因而不得不转而去追问使得这些工具得以被发明出来的那些“元工具”,  并试图在诸种“元工具”所提供的模态空间中寻找更合适的推理平台。而机器要实现这样的一个“思想飞跃”,  显然也需要编程者预先为上述“元工具”的算法化预留空间。


读到这里, 读者或许会问:我们引出黑格尔的哲学资源的原初目的, 本是为了解决“框架问题”, 而上述对于《逻辑学》三大板块内容的分析, 到底又在哪个方面与“框架问题”相关呢?


以下便是笔者对于该问题的简要回复:前文已指出,  “框架问题”的实质乃是使得智能体能够在有限的计算资源与时间资源中进行“相关性”判断, 以此提高系统的运作效率。而从黑格尔哲学的角度看,  “相关性”本身乃是一个很模糊的概念, 因为不同层面上的“相关性”将牵涉到不同的概念工具箱。具体而言, “是论”层面上的“相关性”相对简单与朴素,  它主要牵涉到主、谓之间的联系或此类联系的缺失 (其在语言学上的表达, 便是系词的出场, 或是否定词的出场)  。而“本质论”之上的“相关性”则相对复杂, 这主要牵涉到根据的出现或者缺失,  以及判断这种出现或缺失所需要的一整套推理运作。“概念论”层面上的“相关性”则最为复杂,  因为这将驱使智能体对使得前述的“相关性判断”得以可能的工具———如“判断”概念本身———进行反思,  由此磨砺用以处理“框架问题”的武器。这也就是说, 一种黑格尔式的针对“框架问题”的处理方案本身,  也将带有某种鲜明的反思性特征:这种处理方案将不会满足于通过某种工程学技巧,  来暂时满足对于“框架问题”的某一具体变种在某些限制性条件下的“解决”, 而会以一种更具野心的姿态,  来一一构建对于“相关性判断”得以被给出的全套概念工具。


以上便是笔者对于黑格尔式“逻辑学”与AI之间的关联性的最为粗疏的说明。而为了向这一说明提供更多的细节, 在下面的讨论中, 笔者将试图从AI的视角提炼出黑格尔在“是论”中给出的一些“思想亮点”。

                    

四、从人工智能角度重读“是论”

                        

众所周知, “是论”是《逻辑学》体系三大板块中的第一板块,  也是后两个板块得以逐步展开的理论基础。因此, 将本文有限的篇幅预算用在“是论” (而不是“本质论”或“概念论”) 之上,  也将起到某种“四两拨千斤”的作用。下面, 我们将主要从AI自身的兴趣点出发, 通过三个问题, 就“是论”自身的几点“反常之处”进行提点,  并通过对于这些“反常”的解释来逐一展现黑格尔思想的深刻之处。


问题一:如何从AI的角度理解“是论”的开场第一个范畴乃是“是”?


对于这个问题的一种常见的教科书式解答乃是这样的:黑格尔不满足于像亚里士多德与康德那样,  机械地、外在地将范畴予以展列, 而试图向读者展现诸范畴逐步发展自己的整个辩证过程。而“是”恰恰就意味着某种展开为各种种类的判断的可能性,  同时其表面形式亦是最简单的。在这样的情况下, 将“是”视为整个范畴表的出发点, 便是一件非常自然而然的事情了。


但这样的解答,  显然很难让一个深受数理逻辑思维影响的AI专家所信服。他或许会搬出早年维特根斯坦在《逻辑哲学论》) (参论题3.323) 中的说辞,  认定像黑格尔这样的传统哲学家对于像“是”这样的系词的依赖其实是将不同的含义———“同一性”、“属于”、“存在”———归属到了相同的语词下,  并因为这种混淆而导致了大量后续的哲学混乱。那么, 一个黑格尔主义者又当如何回应后人的这种批评呢?


回应之一:早期维氏提议将“是”的含义分置于不同的技术谓词的想法,  本身乃是预设了这么一种观点:存在着一种一劳永逸地将世间所有基本谓词加以确定的终极技术方案。很显然, 正是这种有点天真的想法,  促发了后世AI专家海耶斯 (Patrick Hayes) 去用一阶谓词逻辑来整编整个人类常识。 (1) 但正如另一位人工智能专家麦克德默特 (Drew McDermott) 所认识到的那样, 这样的思路必然会带来“基本谓词膨胀”的问题 (2) ———也就是说,  由于人类常识的驳杂性与开放性,  AI专家们将很难确定怎样的“基本谓词表”才是足够完整的。而一种黑格尔式的解决思路则是“化繁为简”的———也就是说,  与其一开始就将所有的基本谓词列出, 还不如先来观察一下所有这些基本谓词所具有的共相, 也就是将不同的经验表象综合在一起的“统一性”功能。很显然,  没有比用“是”来表达这种统一性功能显得更为自然的了。 (1) 说得更具体一点,  表示“属于”的“是”之所以体现了这种“综合经验表象”的功能, 乃是因为在像“这朵花是红色的”这样的判断中,  “是”所扮演的角色便是将“这朵花”这个表象与“红色的”这个表象结合在了一起;在“这朵花就是这朵花”这个判断中,  “是”至少是将“是”左边的语言记号 (token) 与“是”右边的语言记号在类型 (type) 层面上结合在了一起,  而在“这朵花存在”这个判断中, 变身为“存在”的“是”则至少将主词“这朵花”与一系列支持其存在、却未必被直接表述出来的谓词  (比如“被张三看到过”这样的谓词) 联系到了一起。 (2)


回应之二:被早期分析哲学家所看重的“是”的核心功用———表征“属于”———就未必能够涵盖我们在日常生活中使用“是”时的真正用意。说得更具体一点,  早期分析哲学家所说的“属于”是在纯粹外延主义立场上被使用的, 因此, 当他说“苏格拉底是人”的时候, 他想说的仅仅是:对于“人”这个集合而言,  “苏格拉底”乃是其成员。然而, 这个说法却根本没有涉及“人”这个集合本身的内部结构特征,  也没有涉及“苏格拉底”与“人”这个集合的其他成员之间的关系。与之相比较, 当我们一般人 (在某种意义上, 还包括后期维氏)  说“苏格拉底是人”这句话的时候, 我们其实是作出了这样的一个断言:对于“人”这个集合的外延的其他对象来说,  “苏格拉底”所具有的某种性质至少是具有足够的典型性的———而“具有足够的典型性”这个表达显然涉及了“人”这个集合的某种内部结构  (无论它是晚期维氏所说的“家族相似”结构或是别的什么结构) 。这也就是说, 数理逻辑与集合论所提供的源初谓词, 除非经过某种重大的改造,  其实是无法令人满意地刻画日常语言中的“是”的。因此, 我们必须从对于这些现代表述工具的迷信态度中抽离而出, 直接地表达出“是”本身。


对于上述回应,  不太同情黑格尔哲学立场的读者或许会反驳说:简单地给出“是”,  并不能够帮助我们理解被“是”所联接的谓项自身的内部各个成员之间的家族相似结构;而如果我们要对所谓“家族相似”理论进行技术层面上的刻画的话,  那么学界业已提供的成熟刻画方案则还是会将我们引向目下如火如荼的“语义向量空间模型” (3) , 而不是什么神秘兮兮的黑格尔哲学。


但这一反击本身还是有两个破绽。第一, 就其本质而言,  “语义向量空间模型”只是在深度学习的技术平台上复演了海耶斯在符号AI的平台上所做的那类春秋大梦,  即要以某种一劳永逸的方式穷尽某种语言的所有语义知识。故而, 与海耶斯的规划一样,  这样的技术路径依然无法完美地处理人类经验的开放性与驳杂性。与之相比, 黑格尔对于“是”进行预先呈报 (并在同时不立即给出完整的范畴表) 的方案,  的确是对从“是”中衍生出种种新谓词的可能性保持了足够的开放性———而且, 也恰恰是这种开放性,  才使得其思想更有可能与人类所面临的种种具体的问题处理语境发生有机的关联。第二, 对于“是”的原始地位进行肯定的做法,  本身并不一定就是与AI的技术刻画方案格格不入的。比如, 在颇有影响的一个AI技术路线———贝叶斯网络———中,  贝叶斯网的构建者在构建所谓的“有向无环图”之时, 几乎就仅仅使用了一类谓词, 即联接一个事件表征与另一个事件表征的有向箭头。同样的道理,  在“语义向量空间模型”中, 建模者对于不同词项之间语义距离的谈论, 也能够被视为对于某种统一的基本谓词的不同量化方式。这也就是说,  黑格尔的反击者们所试图驳倒的, 恰恰就是他们在自己的新方案中所预设的东西。而更糟糕的是,  由于这些建模者试图一开始就确定使得语义推理得以可能的所有充分知识, 他们所设定的这种基本谓词一开始就被剥夺了从中衍生出新谓词的可能性,  并因此使得自己的建模成果被锁定在比黑格尔所说的“是”更不具普遍性的那个层面上。


问题二:如何理解黑格尔所说的“变”?


我们知道,  在“是论”出场的前三个范畴分别是“是”、“否”与“变”。从“是”引出“否”, 似乎并不会引发后世的AI技术专家们足够的惊讶,  因为“否”既可以在一阶谓词逻辑中被勉强理解为“否定”, 也可以在贝叶斯网络中被勉强理解为两个事件节点之间连线的缺失。而相对难以理解的是“变”,  因为现有的AI技术缺乏刻画“变”的基本技术手段。那么, 关于“是”、“否”、“变”三者之间的关系, 以及引出“变”的必要性,  黑格尔本人是怎么说的呢?我们可以在《小逻辑》中找到这样的文字:


反过来说, “否”, 作为这种直接的自我等同的范畴, 就好似是与“是”等同者。“是”的真理, 以及“否”的真理, 因此也就是对于二者的联系:这一联系就是“变”。 (1)


这段话的字面意思的确有点晦涩。好在黑格尔还在《小逻辑》中给出了对于此段表述的大段说明。 (2) 根据这些说明, 笔者重构