摘译:认知体系研究综述(二)

前期回顾

作为人工智能的一个重要分支,认知体系的研究和应用经过了近40年的发展,已取得了可见的成果。上期内容对认知体系的概念进行了阐述,本期将继续就认知体系的分类和感知部分进一步展开。译者希望通过摘译的内容,引起大家对“认知体系”研究的更多关注。摘译:认知体系研究综述(一)

1 引言

2 什么是认知体系

3 认知体系的分类 (Taxonomies of Cognitive Architectures)

关于认知体系的分类,目前相对主流的三大范式是:符号(也称为认知)、涌现(也称为联结)和混合。到底哪一个正确地反映了人类的认知过程,仍然是一个悬而未决的问题,在过去的30年里一直在争论[12,13]。

符号范式通常使用预定义指令集等符号来表示概念。指令通常以if-then的规则形式执行,例如ACT-R, Soar等产生式体系。这是一种自然而直观的表示方式,因此符号操作仍然是一种公认的表示方式之一。虽然符号范式擅长计划(规划)和推理,但不具有处理环境变化和感知所需要的灵活性和鲁棒性。

涌现范式通常建立大规模并行模型来解决适应性和学习问题,例如神经网络模型,其数据来自输入节点。然而,由于信息或知识不再是一组可解释的符号实体,而往往分布在整个网络中,这导致模型不再透明。在涌现模式中,传统意义上的逻辑推理似乎成为不可能。

自然地,每种范式都有优缺点。一方面,任何符号体系结构创建初始知识库需要大量工作,可一旦完成,体系结构就完全功能性。另一方面,涌现体系结构更易于设计,但它们必须经过大量训练才能产生有用的行为;此外,他们的现有知识可能随着新行为的学习而恶化。

由于符号和涌现范式都不能解决认知的所有问题,混合范式试图结合符号和涌现的元素,这样的混合体系在我们选择的架构中是最常见的。一般来说,混合方式没有限制,而且已经探索了许多可能性。除了考虑表示,还考虑系统是单模块还是多模块、异构还是同质,或考虑混合的粒度(粗粒度还是细粒度)、符号和子符号组件之间的耦合性。此外,并不是所有的混合架构都明确地解决了所谓的符号和次符号元素以及将它们组合起来的问题。只有少数几个体系结构,例如ACTR、CLARION、DUAL、CogPrime、CAPS、SiMA、GMU-BICA和Sigma,认为这种集成是必要的。我们将重点放在表示和处理上。

图1显示了分类分组的组织结构。在顶层分成了:符号的、涌现的和混合的。关于这些术语的界定也是模糊的,即使对于最著名的架构(例如Soar和ACT-R)也不能达成一致。尽管两者都将符号和次符号元素结合起来,ACT-R的作者明确地表达为混合模式,而Soar没有。各位学者的观点也不一致,Soar和ACT-R在[14,15]中都被称为符号主义者,而[16]将它们列为混合体。

图1

为了避免分组的不一致性,我们假设显式符号是符号表示的原子,可以组合成有意义的表达式。这些符号用于推理或句法分析。子符号表示通常与神经元的隐喻联系在一起,这种表示的一个典型是神经网络。在神经网络中,知识被编码为分布在神经元之间的数值模式,与单元相关联的权重影响处理,并通过学习获得。

对于我们的分类,我们假设任何非显式符号和处理(句法操作除外)都是子符号(例如数值数据、像素、概率,传播激活、强化学习等)。结合了两种表示中的任意组合都被当作混合模式。给定这些定义,将标签分配给所有架构并将它们可视化为图1。

我们区分了两类涌现类别:实现类生物神经元的神经元模型和更接近人工神经网络的连接(逻辑)模式。在混合模式中,我们将符号子处理(其中符号模式与执行子符号计算模块相结合)作为混合模式的一个子类,符号子处理组中的架构至少包括一个用于感知处理的子符号模块,而其余的知识和处理是符号的,例如3T, ATLANTIS, RCS, DIARC, CARACaS and CoSy。虽然存在其他类型的功能组合(例如协同处理、元处理和链处理),但是难以归类。因此,其他的都归类为完全集成的混合模式。完全集成的体系结构使用多种方法来组合不同的表示。ACT-R、Soar、CAPS、Copycat/Metacat、CHREST、CHARISMA、CELTS、CoJACK、CLARION、REM、NARS和Xapagy将符号概念和具有次符号元素(如激活值、扩散激活、随机选择过程、强化学习等)的规则结合起来。

综上所述,混合架构是数量最多的一组,并显示出增长趋势。混合架构根据符号和次符号组件的比例和扮演的角色,在涌现范式和符号范式之间形成一个连续统。例如,CogPrime和Sigma在概念上更接近于涌现系统,因为它们与神经网络有许多共同的属性。而REM、CHREST和RALPH以及3T和ATLANTIS,在很大程度上属于符号范式;因为这些架构主要是符号化的,虽然可以利用概率推理和学习机制。

4 感知(perception)

虽然早期的认知结构主要侧重于高层次的推理,但同样重要的是感知和行为。

感知可以定义为将原始输入数据转换为系统内部表示以执行认知任务的过程。根据输入数据的来源和性质可以区分多种感知模式。例如,最常见的五种是视觉、听觉、嗅觉、触觉和味觉;其他的感觉包括本体感觉、热感、痛觉、时间感等。

当然,认知结构也实现了其中的一些与人类感官无关的符号输入(使用键盘或图形用户界面(GUI))和各种传感器(激光雷达、激光、红外等)。根据其认知功能,智能系统可以将各种数量和类型的数据作为感知输入。

因此,本节将研究使用各种数据输入,从这些数据源中提取信息以及如何应用这些信息的认知体系。图4中的将调研结果进行了可视化。

图2:视觉(V)、听觉(A)、触觉(T)、嗅觉(S)、本体感觉(P)、数据输入(D)、其他传感器(O)和多模态(M)

从图2的可视化中可以观察到如下情况。例如,视觉是最常用的实现方式,然而,超过一半的体系使用模拟进行视觉输入,而不是摄像机。触觉和本体感觉等方式主要用于物理体现的设计。有些感知未被充分探索,例如嗅觉只在三种体系中出现(GLAIR、DAC和PRS0)。总的来说,符号范式在设计上具有有限的感知能力,并且倾向于使用直接的输入数据作为唯一的信息来源(参见图的左侧)。另一方面,混合范式和涌现范式(主要位于右半部分图中的)使用模拟和物理传感器实现更广泛的感知模式。然而,不管其来源如何,传入的感知数据通常不能以原始形式使用(除了符号输入之外),往往需要进一步处理。下面将讨论在认体系中如何进行有效且充分的感知处理。

12下一页>

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商