结合深度神经网络和矢量符号模型的架构

导读 IBM苏黎世研究院和苏黎世联邦理工学院的研究人员最近创建了一种新架构,该架构结合了两种最著名的人工智能方法,即深度神经网络和矢量符号

IBM苏黎世研究院和苏黎世联邦理工学院的研究人员最近创建了一种新架构,该架构结合了两种最著名的人工智能方法,即深度神经网络和矢量符号模型。他们的架构在NatureMachineIntelligence中展示,可以克服这两种方法的局限性,更有效地解决渐进矩阵和其他推理任务。

“我们最近的论文基于我们早期的研究工作,旨在通过矢量符号架构(VSA)的强大机制来增强和增强神经网络,”进行这项研究的研究人员之一阿巴斯·拉希米(AbbasRahimi)告诉TechXplore。“这种组合以前被应用于少样本学习以及少样本连续学习任务,以较低的计算复杂度实现了最先进的准确性。在我们最近的论文中,我们通过关注解决视觉抽象推理任务,特别是广泛使用的IQ测试,称为Raven的渐进矩阵。”

Raven的渐进矩阵是非语言测试,通常用于测试人们的智商和抽象推理能力。它们由成套呈现的一系列项目组成,其中缺少一个或多个项目。

要解决Raven的渐进矩阵,受访者需要在几个可能的选择中正确识别给定集合中缺失的项目。这需要高级推理能力,例如能够检测对象之间的抽象关系,这可能与它们的形状、大小、颜色或其他特征相关。

Rahimi和他的同事开发的神经向量符号架构(NVSA)将深度神经网络与VSA机制相结合,深度神经网络已知在感知任务上表现良好。VSA是独特的计算模型,使用分布式高维向量执行符号计算。

“虽然我们的方法听起来有点像神经符号AI方法,但神经符号AI继承了各自深度学习和经典符号AI组件的局限性,”Rahimi解释说。“我们的主要目标是通过在神经和符号组件之间使用通用语言来解决NVSA中的这些限制,即神经绑定问题和详尽搜索。”

该团队结合深度神经网络和VSA得到了两个主要架构设计特性的支持。其中包括新的神经网络训练过程和执行VSA转换的方法。

“我们为我们的架构开发了两个关键推动因素,”Rahimi说。“第一个是使用新颖的神经网络训练方法作为VSA表示学习的灵活方法。第二个是获得适当VSA转换的方法,这样详尽的概率计算和搜索可以用VSA中更简单的代数运算代替向量空间。”

在初步评估中,Rahimi和他的同事开发的架构取得了非常有希望的结果,比过去开发的其他架构更快、更有效地解决了Raven的渐进矩阵。具体来说,它的表现优于最先进的深度神经网络和神经符号AI方法,在RAVEN数据集和I-RAVEN数据集上实现了87.7%和88.1%的新记录准确度。

“要解决Raven测试,需要一种称为概率溯因推理的方法,该过程涉及在由有关测试的先验背景知识定义的空间中搜索解决方案,”Rahimi说。“先验知识通过描述所有可能控制Raven测试的规则实现,以符号形式表示。纯符号推理方法需要遍历所有有效组合,计算规则概率,并将它们相加。这种搜索变成了计算大搜索空间的瓶颈,因为大量的组合会阻碍测试。”

与现有架构相比,NVSA可以在单个向量运算中执行大量概率计算。这反过来又使其能够解决抽象推理和类比相关的问题,例如Raven的渐进矩阵,比其他仅基于深度神经网络或VSA的人工智能方法更快、更准确。

“我们的方法还解决了神经绑定问题,使单个神经网络能够同时在场景中分别识别多个对象的不同属性,”Rahimi说。“总的来说,NVSA提供透明、快速和高效的推理;这是第一个展示概率推理(作为纯逻辑推理的升级)如何通过VSA的分布式表示和运算符有效执行的例子。与符号推理相比神经符号方法,NVSA的概率推理速度快两个数量级,分布式表示的操作成本更低。”

迄今为止,该团队创建的新架构已被证明在高效、快速地解决复杂推理任务方面非常有前途。在未来,它可以被测试并应用于其他各种问题,同时也可能激发其他类似方法的发展。

Rahimi补充说:“NVSA是将不同的AI范式封装在一个统一的框架中以解决涉及感知和更高层次推理的任务的重要一步。”“有趣的是,NVSA已经展示了对各种看不见的对象和对象属性组合的泛化程度。朝这个方向进一步泛化仍然是一个悬而未决的问题。”