来自中德的研究团队发布最新成果,给大模型外挂「逻辑脑」:用答案集编程当慢思考,LLM当快直觉,空间推理准确率一口气提高四成多。这套会自我修正的「神经-符号」双系统,让AI既能说清每一步逻辑,又能跨任务迁移,向更可靠的通用推理迈出关键一步。
大语言模型(LLMs)已在文本生成、代码编写乃至多模态任务中展现出惊人的能力,但在涉及严谨逻辑与物理的空间推理任务上,它们仍显得力不从心。
比如,当模型需要理解多个物体之间的相对位置关系,并在复杂语境下进行多步骤推理时,往往容易出现「逻辑断裂」:可能在中间步骤中虚构错误事实,或偏离目标,最终导致答案不可靠。
这一问题在空间推理任务中尤为突出。空间推理要求模型能像人一样,推演出「桌子在椅子左边,灯在桌子上方,因此灯也在椅子左边」这样的复杂链条。
然而,尽管「思维链(Chain-of-Thought)」等提示工程方法在一定程度上提升了模型的推理表现,但在多步骤、动态变化的场景中,它们依旧难以保证逻辑一致性。
为了弥合神经网络的模式识别能力与符号系统严谨逻辑之间的鸿沟,来自德国图宾根大学、斯图加特大学(王荣)和同济大学(孙坤)的科研人员合作研究发表在著名的人工智能和深度学期刊《神经网络》(Neural Networks)上,该研究提出了一种创新的神经-符号(neural-symbolic)框架。
