技术动态 | 从“黑盒”到“透明”：大模型如何学会人类的逻辑规则？天津大学张小旺教授团队长文综述规则学习30年演进

张

张建站

2026/6/13 23:36:49

10分钟阅读

技术动态 | 从“黑盒”到“透明”：大模型如何学会人类的逻辑规则？天津大学张小旺教授团队长文综述规则学习30年演进

Data Intelligence从神经网络到大型语言模型规则学习三十年演进与未来挑战规则学习是人工智能领域的核心任务之一旨在从数据中自动发现显式、可解释的逻辑规则从而实现预测、分类与推理。传统的规则学习方法依赖于符号逻辑而近年来随着神经网络特别是大语言模型LLMs的崛起规则学习正经历一场深刻的变革模型不仅能从文本中捕捉语义还能生成、执行甚至动态发现规则。然而如何有效融合神经网络的强大表示能力与符号规则的透明性仍面临诸多挑战。天津大学张小旺教授团队在Data Intelligence发表长篇综述系统梳理了基于语言模型的规则学习方法从早期神经网络到当前Transformer架构全面分析其技术演进、优势局限、评估体系及垂直领域应用为构建更可解释、更鲁棒的人工智能系统提供重要参考。引用Cheng T.Y., Wang H.S., Xiao J., et al.: Rule Learning Based on Language Models: A Survey. Data Intelligence, Vol. 8, Art. No.: 2026r01, pp. 1-37, 2026.DOI:https://doi.org/10.3724/2096-7004. di.2025.0161规则学习为何重要规则学习的目标是提取类似“如果…那么…”的显式逻辑结构这些结构可以是纯逻辑规则、规范规则、自然语言规则、程序性规则、启发式规则或概率规则。它们赋予模型可解释性使其在医疗、法律、建筑等高风险领域能够被信任和审计。同时规则也连接了符号推理与统计学习帮助模型在分布外场景中保持稳健。技术演进从RNN到LLM的三大阶段综述将基于语言模型的规则学习方法划分为两大类并细分子类。图1展示了这一演进路径。图1. 基于语言模型的规则学习方法发展历程原文图1一、神经网络语言模型方法早期逻辑增强神经网络通过知识蒸馏或将逻辑算子编码为网络层将一阶逻辑规则融入神经网络训练提升可解释性和小样本性能。图2. 使用一阶逻辑和深度神经网络进行规则学习通过迭代知识蒸馏将逻辑信息融入网络原文图3知识图谱嵌入与规则学习结合将规则挖掘视为可微分的张量补全或潜在变量学习在知识图谱补全任务中同时学习嵌入与逻辑规则。图3 将知识图谱路径嵌入循环神经网络以生成可解释的逻辑规则原文图5领域特定规则学习针对建筑、法律、医疗等领域使用BiLSTM-CRF、CNN等模型从规范文本中提取规则实现自动合规检查、法律条款分类、临床决策支持等。二、大语言模型方法Transformer时代上下文规则生成通过提示工程如Chain-of-Thought和指令微调让LLM直接生成或遵循规则。研究显示GPT-4在简单规则链上表现良好但随着规则数量增加性能急剧下降。为此学者提出分解提示与子任务微调来增强长链规则执行能力。图4. 通过指令微调和思维链提示实现基于大语言模型的规则学习原文图4交互式环境中的规则学习新近研究关注LLM在动态环境中通过试错发现规则。结合归纳、演绎、溯因推理的框架在交互式基准中显著优于基线测试集揭示当前LLM在复杂多步规则任务上准确率常低于10%远逊于人类。规则增强的知识图谱补全LLM被用作规则生成器或规则评分器将外部常识注入图谱提升推理覆盖率和准确性。结合规则过滤可大幅提高生成规则的精度。规则感知的数据选择与训练优化利用LLM对训练样本进行质量评分或根据规则多样性筛选数据可构建更优质的训练集。原则驱动自对齐则通过少量人类原则引导模型生成符合规范的数据实现内在合规。如何评估规则学习综述总结了一套多维评估体系预测性能准确率、F1等验证规则对下游任务的贡献。支持度与置信度规则在数据中出现的频率和可靠性。逻辑正确性与完备性规则是否推导出错误结论能否覆盖所有真事实。自然语言 fidelity用BLEU、BERTScore等比较生成规则与参考规则的文本相似度需辅以人工验证。鲁棒性与泛化在分布偏移或对抗样本下的表现。关键数据集一览综述分类整理了规则学习常用数据集神经网络方法SST-2、CoNLL-2003、i2b2肥胖挑战、WN18RR、YAGO3-10、建筑规范语料、税法律师语料等。LLM方法SIFo顺序指令遵循、RuleBench推理规则遵循、LogicGame交互式谜题、RULEARN动态环境、QuRatedPajama质量标注语料等。垂直领域应用从建筑到医疗建筑建筑设计合规审查依赖人工逐条核对规范耗时且易疏漏。研究者利用BiLSTM-CRF从建筑规范中自动提取逻辑规则实现对设计图纸的全覆盖校验在实际测试中成功发现多例被人类审查员遗漏的违规设计——这类隐患一旦在施工后整改成本将指数级上升。法律税法等法规文本动辄数千页条款间的交叉引用和例外情形难以人工覆盖。CNN分类器在少量标注数据上学习识别条款的规范类型义务、禁止、授权将律师从“大海捞针”的机械筛查中解放出来直接定位需要专业判断的关键条款。医疗医疗AI落地难核心是医生“不敢用”——模型给出高风险建议却无法解释。贝叶斯逻辑神经网络在提供诊断建议的同时主动标记“低置信度”情况让AI在证据不足时“知道自己不知道”从黑箱建议者转变为可信任的临床辅助角色。挑战与未来方向尽管进展显著但该领域仍面临五大挑战规则复杂性与表达能力当前方法多限于一阶Horn规则难以处理层级、多跳或图结构复杂逻辑。泛化与迁移能力规则往往领域特异跨域应用需元学习或领域自适应。评估体系不统一缺乏涵盖语义正确性、鲁棒性、可解释性的综合基准。符号-神经深度融合现有集成多为浅层结合真正的端到端可微分逻辑与神经架构仍待突破。人机交互与反馈专家需能介入修正规则但多数模型未充分利用交互潜力。未来研究可围绕上述挑战探索更强大的神经符号模型、交互式规则学习范式以及面向高风险领域的人机协同机制。扫描下方二维码可直达论文全文作者简介张小旺天津大学软件学院教授、博士生导师。北京大学博士导师林作铨教授比利时哈瑟尔特大学博士后导师Jan Van den Bussche教授。他于2015年加入天津大学2015至2021年任副教授2021年晋升教授至今。研究方向涵盖知识工程、自然语言处理、软件工程具体包括知识图谱表示、构建与推理近年来研究兴趣拓展至逻辑规则学习及推理。承担或参加国家重点研发计划专项、国家自然科学基金重点、面上、青年及校企合作横向课题十余项在知识计算领域发表论文百余篇包括AAAIIJCAIACLASEWWWCVPRICDTISWCEMNLPCOLINGTOSEMTSEJAIRSci. China Inf. Sci.TNNLS《计算机学报》《软件学报》《计算机研究与发展》等。荣获天津市科学技术进步一等奖、中国好技术(A类)、ACM天津新星奖等荣誉。讲授《知识工程》《数据库系统》《知识表示与推理》等本科生及研究生核心课程。OpenKGOpenKG中文开放知识图谱旨在推动以中文为核心的知识图谱数据的开放、互联及众包并促进知识图谱算法、工具及平台的开源开放。点击阅读原文进入 OpenKG 网站。

Stable Yogi Leather-Dress-Collection行业落地：轻小说封面皮衣角色批量生成流程

Stable Yogi Leather-Dress-Collection行业落地：轻小说封面皮衣角色批量生成流程 1. 引言：当轻小说封面创作遇上AI 想象一下，你是一位轻小说编辑或插画师，手头有十本新书等待封面设计。每本书的主角设定都不同，但都有…...

2026/6/2 15:50:36 阅读更多 →

基于Docker部署OnlyOffice与宝塔面板SSL证书集成指南

1. 为什么选择Docker部署OnlyOffice？ 如果你正在寻找一个开源的在线文档协作解决方案，OnlyOffice绝对是一个绕不开的名字。它提供了媲美微软Office的文档、表格、幻灯片编辑体验，并且支持多人实时协作。我之前在团队内部搭建知识库和文档中心…...

2026/6/2 21:04:47 阅读更多 →

【技术全景解析】多示例学习：从核心特性到算法选型的实战指南

1. 从“包”开始：理解多示例学习的核心思想想象一下，你是一位医生，面前摆着成千上万张肺部CT扫描影像。你的任务是判断某位患者是否患有早期肺癌。传统的人工智能方法会要求你，或者你的标注团队，在每一张影像上&#…...

2026/6/2 20:31:41 阅读更多 →

CSDN AI分发撤回黄金15分钟法则：超时即不可逆！3类高危场景+2套应急回滚SOP（含工单提报话术模板）

更多请点击： https://kaifayun.com 第一章：CSDN AI 数字营销分发后的文章可以单独撤回某一个平台吗？ CSDN AI 数字营销平台在执行“一键多平台分发”时，会将同一份内容同步发布至 CSDN 博客、知乎、微信公众号（需授权…...

2026/6/13 9:49:02 阅读更多 →

OpenRocket：零基础掌握专业火箭设计与飞行仿真

OpenRocket：零基础掌握专业火箭设计与飞行仿真【免费下载链接】openrocket Model-rocketry aerodynamics and trajectory simulation software 项目地址: https://gitcode.com/GitHub_Trending/op/openrocket OpenRocket是一款功能强大的开源火箭设计与仿真…...

2026/6/12 18:01:01 阅读更多 →

请做coser的主人9下载2026官方正版

下载链接浅析全动态真人互动影像作品的工业化管线与设计逻辑：以《请做coser的主人9》为例近年来，随着硬件渲染能力的提升和流媒体解码技术的普及，全动态真人互动影像（Full Motion Video, 简称FMV）迎来了一波高频更…...

2026/6/12 20:48:59 阅读更多 →

深度解析移动端免Root系统提取工具：Payload-Dumper-Android技术架构与实现原理

深度解析移动端免Root系统提取工具：Payload-Dumper-Android技术架构与实现原理【免费下载链接】Payload-Dumper-Android Payload Dumper App for Android. Extract boot.img or any other partitions (images) from OTA.zip or payload.bin without PC 项目地址:…...

2026/6/13 23:06:14 阅读更多 →