美国马里兰大学Jay Lee教授和Hanqi Su博士最新前瞻性文章:工业人工智能的革新:统一基础框架 | IJAMD封面文章
英文原题:Rethinking industrial artificial intelligence: A unified foundation framework
通讯作者:Hanqi Su, University of Maryland
作者:Jay Lee, Hanqi Su*
引用信息:
Lee J, Su H. Rethinking industrial artificial intelligence: A unified foundation framework. Int J AI Mater Design. 2025;2(2):56-68. doi: 10.36922/IJAMD025080006
文章背景
工业人工智能(AI)的快速发展正在重塑全球各行各业。深度学习、工业物联网(IIoT)、大语言模型(LLM)、预测与健康管理系统、大数据分析以及信息物理系统(CPS)等技术的最新突破,加速了工业AI的落地应用,使工业系统能够从海量工业数据中提取可操作的洞见,并支持智能决策。然而,现有方法往往过度强调算法与模型,却缺乏一套能够系统整合领域知识、数据与模型的统一框架。要真正释放工业AI的全部潜能,就需要一个结构化框架——将领域知识、高质量数据与智能AI模型有机融合,从而解决真实工业场景中的复杂挑战。针对这一空白,本文提出一个由“知识-数据-模型”三大模块构成的统一工业AI基础框架,以升级工业AI方法论平台。
文章亮点
(1)提出系统化、模块化的工业人工智能统一基础框架,由知识、数据、模型三大核心模块共 12 个关键要素组成,可即插即用式扩展现有工业 AI 方法论平台。
(2)将大语言模型(LLM)深度嵌入工业 AI 全生命周期:知识抽取、数据集自动文档化、代码生成与问答式维护支持。
(3)通过齿轮箱故障诊断公开数据集案例,仅用 2016 条样本即把分类准确率提升到 99.47%,超越现有最佳结果,验证了框架在数据受限场景下的高效性。
(4)从“两层视角”(物理层 vs. 数字层)重新定义工业 AI 的桥梁作用,为 Industry 4.0/5.0 提供可落地的顶层视角。
内容介绍
屏幕截图 2025-07-18 131720.jpg
表1 工业人工智能应用现有框架总结
回顾了将人工智能(AI)融入各种工业应用的现有研究与框架。若干研究工作已提出旨在通过 AI 提升工业生产力、决策能力与运营效率的框架。表 1 对这些既有工业 AI 框架进行了简明梳理,并突出其主要贡献。例如,Lee 等人 提出了一种工业 AI 生态系统框架,在既有 CPS(5C)架构内整合数据技术、分析技术、平台技术和运营技术等使能技术,并以 ABCDE 关键要素为指导。在此基础上,Peres 等人进一步扩展为一个更全面的概念框架,强调挑战、设计原则、关键技术、能力、属性及工业应用领域。另一方面,Zhang 等人构建了一个涵盖七大维度(对象、领域、阶段、需求、技术、功能、解决方案)的综合参考框架。此外,Yang 等人针对流程工业提出了结合人机协作与自主智能控制系统的智能制造框架。Ahmed 等人则聚焦 AI 与可解释 AI(XAI)方法,对各类 XAI 方法及其在工业 4.0 场景的适用性进行了分类。Jan 等人构建了四阶段 AI 数据管道,涵盖数据获取/验证、数据处理/融合、模型训练/测试及模型解释。Leng 等人进一步提出了从硬件到工业应用的四层技术参考框架。最近,Lee 和 Su提出了统一的工业大知识模型(ILKM)框架,强调通过大语言模型(LLM)与机器学习(ML)方法整合领域特定知识。
尽管这些框架在不同工业应用中成功识别了 AI 集成的关键要素,但仍存在若干局限:缺乏系统的领域知识整合、倾向理论概念化而缺乏清晰客观的指导原则,以及过度关注数据与模型而忽视连接知识、数据与模型的系统思维。针对这些不足,本文接下来两节将重新审视工业 AI 的角色,并提出一个统一的工业 AI 基础框架,以弥补上述关键缺陷。
1.jpg
图1. 工业人工智能在连接物理层与数字层中的作用。
工业 AI 的角色最好从“两层视角”来理解,如图 1 所示:物理层包含人、物与系统,数字层则由知识、数据与模型组成。得益于 IIoT、 数字孪生、 CPS、工业大数据分析、深度学习和 LLM等新兴技术,工业 AI 在两层之间充当动态桥梁,不断提炼并应用 AI 驱动的洞见,以优化和改进现实工业系统。
具体而言: 人类专家经验构成领域知识的基础,其中汇集了 AI 驱动方法所积累的实践经验、研究洞见与最佳实践。随着物联网技术兴起,机器、传感器等设备(“物”)生成海量数据,这成为现代工业中开展 AI 分析、建模与决策的必要前提。CPS、IIoT 系统等“系统”则利用 AI 模型实现自动化运营、智能决策和实时控制改进。
尽管两层视角为工业 AI 如何连接物理与数字域提供了概念框架,现实工业环境仍存在多重挑战: 数据质量不一致、缺乏标准化预处理管道、元数据管理碎片化,导致 IIoT 异构数据难以转化为可靠的 AI 可用格式。 CPS 虽被广泛讨论,但落地困难:保持现实世界运行与虚拟模型的一致性,需要持续的数据同步与健壮的模型更新机制。数字孪生的开发受限于多源数据流、实时分析与仿真建模需求的高度复杂性。LLM 的日益普及带来新机遇,却也带来领域知识理解、抽取与可解释性的实际难题。
基于我们与产业的合作与实际项目观察,上述复杂性往往导致临时拼凑的解决方案、孤立的开发努力,以及 AI 应用规模化时的低效率。因此,这些观察与挑战促使我们提出下一节所阐述的结构化基础框架,以系统化地连接知识、数据与模型。
2.jpg
图2. 统一的工业人工智能(AI)基础框架。缩写:LLM: 大语言模型; ML: 机器学习。
提出了一套统一的工业 AI 基础框架,用于系统化地指导工业 AI 解决方案的开发与部署,其整体结构如图 2 所示。该框架由三大核心模块构成: (i) 知识模块; (ii) 数据模块; (iii) 模型模块。 每个模块内部再细分为四个关键组件,共计 12 个重要方面,为工业 AI 的开发者与实践者提供结构化指引。通过模块化、结构化的设计,这些模块能够增强并扩展现有及新兴的工业 AI 方法论平台。 图 2 展示了框架的整体结构,突出了知识、数据、模型三大模块之间的互联关系与动态反馈。每两个模块之间均用双向箭头相连,表明它们并非线性顺序,而是持续相互告知、相互优化。此外,三大模块均向前指向“工业 AI 方法论平台”,意味着平台的能力由这三大模块共同强化。
- 知识模块
知识模块的核心任务是在整个工业 AI 开发生命周期中“捕获—组织—运用”领域知识。在复杂的工业场景里,专家经验通常以报告、手册、论文、检修日志等非结构化形式存在。知识模块并非传统意义上“以人为中心”的设计,而是要把这些分散资源转化为结构化、可检索、可复用的格式,从而指导数据分析与模型设计,成为支撑可扩展、自动化、情境感知 AI 系统开发的基石。该模块聚焦以下四个方面。
(1)知识抽取
知识抽取指将非结构化信息系统性地转换为结构化、可检索的知识表示,以便实现自动推理并指导数据预处理与模型设计。常用技术包括知识图谱构建与大语言模型辅助的信息抽取。例如,OpenKE、TransOMCS、gBuilder可用于知识图谱构建;GPT-3/4、Llama-1/2、PaLM、DeepSeek等大语言模型则可自动从技术报告和论文中总结与抽取关键技术信息。
(2)数据集文档化——作为工业知识
数据集文档化是构建结构化工业知识的关键环节,需要系统记录数据集的元数据、采集条件、传感器配置、标注方案,并将其与领域知识关联。这样,数据集才能从孤立资产演变为可长期复用的知识资源。GitHub 与 Hugging Face 展示了最佳实践:提供清晰的描述、结构化元数据字段及版本历史。大语言模型还可进一步丰富数据集文档。
(3)AI/ML 开发知识库
AI/ML 开发知识库集中存放可复用的代码模板、实现指南、超参数调优记录与实验日志,使工程师能够复用成熟方法与实现,加速开发。常见做法包括:在 GitHub 维护共享代码仓库、结合实验文档平台,以及使用 MLflow、Weights & Biases 等工具进行实验追踪、代码打包、模型管理与结果共享。大语言模型还能在代码生成、信息检索、交互式 AI 辅助探索等方面提供增强。
(4)新知识生成与集成
随着模型的开发与验证,会不断产生新的洞见和解释。这些新知应持续回流到现有知识库,包括捕获经验教训、模型可解释输出、模型结果及部署反馈,并更新结构化文档与知识图谱。该迭代机制确保知识模块随技术进步与部署经验动态演进。
- 数据模块
数据模块的目标是在知识模块提供的领域知识加持下,将原始工业数据转化为“AI 就绪”的数据集,提升数据可用性与可靠性。该模块聚焦四个关键环节:数据预处理、数据质量、特征工程和数据可视化。
(1)数据预处理
这是工业 AI 成功应用的前提,因为原始数据通常存在噪声、缺失值、异常、类别不平衡、标注不一致等问题。一条结构良好的预处理流水线通常包括:
• 异常检测(孤立森林、局部离群因子、统计阈值等)
• 缺失值填补(均值、中位数、多重插补、k 近邻、回归方法等)
• 信号去噪(小波变换、滤波器等)
• 重采样(SMOTE、随机过采样/欠采样等)
建议研究者采用并记录基于 Pandas、scikit-learn、PyTorch、TensorFlow 等标准化工具的可复用预处理流程,以保证可重复性与可扩展性。
(2)数据质量
数据质量直接影响模型可靠性;劣质数据会降低模型性能并导致错误决策。数据质量的关键维度包括表示一致性、完整性、唯一性、特征准确性、目标准确性及类别平衡。因此,开发者应在流水线中引入系统化质量检查。CleanML 展示了不同数据质量问题对常见 ML 模型性能的显著影响;Foroni 等人 则扩展了传统数据质量定义,不仅评估数据与理想干净数据集的偏离,还评估这些偏离对任务结果的影响。
(3) 特征工程
特征工程旨在从原始数据中提取有意义的表征,提升模型性能、可解释性与效率。在工业场景中,精心设计的特征能显著提高模型准确度。常用技术包括:
• 领域特定特征提取:时域统计量、傅里叶变换得到的频域特征、时频域特征等
• 降维:PCA、t-SNE、LDA 等,可在保留关键信息的同时降低复杂度
• 特征重要性排序:识别对预测影响最大的变量,指导特征选择
• 深度学习表征:自动发现复杂模式
工具如 tsfresh、PyCaret、SHAP 可提供特征提取、重要性评估与选择的自动化流水线。有效的特征工程确保模型聚焦于最具信息量的输入,同时最大程度减少冗余与噪声。
(4) 数据可视化
数据可视化在让人类与 AI 系统理解复杂数据集方面扮演着关键角色。它支持探索性数据分析、特征空间可视化、异常检测、实时监控等任务。例如,利用 t-SNE 或 PCA 投影进行特征空间可视化,可帮助发现高维传感器数据中的异常点或聚类;实时仪表盘可视化机器与产线的数据流,使运维团队及早发现问题、提升系统可靠性。此外,鼓励工业从业者使用 Plotly、Tableau、D3 等交互式可视化工具,实现数据的动态探索。
3.模型模块
当领域知识已结构化、数据已准备就绪,模型模块负责开发“智能、可适应、可解释、高效”的 AI 模型,以驱动工业 4.0 场景中的工业 AI 应用。该模块从四个方面帮助开发者系统性地设计、适配并精化模型,满足复杂工业需求。
(1)算法设计
算法设计是开发人工智能模型的基石。开发者应依据数据特征、领域约束与应用需求,选择或设计适配的模型。典型选项涵盖传统机器学习与统计方法——如决策树、随机森林、支持向量机、梯度提升、k近邻、高斯混合模型及多种聚类算法——以及深度学习架构,包括卷积神经网络(CNN)、循环神经网络、图神经网络、Transformer及其变体。这些算法适用于同时包含连续变量(如振动信号、温度、压力)与离散变量(如运行状态、故障模式、控制事件)的问题。除传统机器学习与深度学习架构外,物理信息神经网络(PINN)已成为工业人工智能中的宝贵工具。PINN将物理定律与方程纳入学习过程,在数据稀疏但先验知识丰富的场景中提升模型可靠性。此外,多模态学习方法融合图像、文本、音频、表格数据与传感器测量等多种模态信息,可构建适用于复杂工业场景的综合模型。再者,基于大规模多样化数据集预训练的基础模型,为跨工业领域可迁移、可适配的人工智能提供了前景广阔的路径。此类模型可针对特定任务微调,实现训练时间缩短与泛化性能提升的高效部署。在算法设计过程中,开发者可运用先验知识与经验,通过系统化实验与测试,创建全新模型架构或迭代优化现有模型。若开源实现可用,则可复现并基于既有方法进一步扩展。
(2)模型可解释性
模型可解释性对于确保人工智能模型的透明性和可解释性至关重要。一个重要的方向是可解释机器学习,它专注于开发设计上就具备透明性的模型,例如回归模型、决策树和广义加性模型。这些模型,连同基于规则的学习和稀疏线性模型等技术,能够提供清晰且一致的解释,使其适用于工业应用。然而,随着深度学习模型的广泛使用,这些模型通常被视为黑箱,理解和解释它们如何做出预测变得具有挑战性。为此,鼓励开发者使用事后解释方法,例如SHAP值、局部可解释模型无关解释(LIME)和积分梯度。这些方法能够进行特征重要性分析,并在全局和局部情境下解释模型预测。此外,因果推断技术通过识别输入变量与模型结果之间的因果关系,可以增强模型的可解释性。结构因果模型、反事实分析和不变因果预测等方法可用于提供更加稳健和稳定的解释,特别是在动态工业环境中。
(3)模型自适应与泛化
• 模型自适应:当面对新数据分布、新领域或新工况时,模型可在不完全重训的情况下调整参数或结构。
• 模型泛化:指模型在未见数据或任务上保持准确预测的能力。关键技术包括:
– 迁移学习与领域适配:把已有模型微调后用于新域,减少新标注数据需求;
– 联邦学习:在多工厂分布式训练,协作提升模型且保护数据隐私;
– 少样本/零样本学习:在极少或没有特定任务数据时仍能做准确预测,适用于采集成本高的工业场景;
– 在线学习:随数据流持续更新模型,保持实时应用的准确性与相关性;
– 持续学习:在不遗忘旧知识的前提下逐步吸收新知识,支持长期演进。
(4)模型优化与部署就绪
模型优化对于提升工业 AI 的性能、效率与可靠性至关重要。它既包括调参,也涵盖架构设计与计算效率改进。常用技术有:
• 超参数优化:网格搜索、随机搜索、贝叶斯优化等系统化搜索最佳配置;
• 神经架构搜索(NAS):可微 NAS、进化算法等自动发现兼顾精度、延迟、内存的最优架构;
• 模型压缩:剪枝(量级/结构化)、权重量化、低秩分解等,在几乎不损失精度的前提下降低推理时延与部署成本;
• 知识蒸馏:将大教师模型的知识迁移到小模型,进一步提升部署便利性;
• 多工况测试:验证模型在不同运行场景下的鲁棒性。
- 工业 AI 方法论平台
工业 AI 方法论平台提供结构化方法、体系架构与指导原则,确保 AI 被系统化地融入工业系统。典型方法论包括:
(i) ILKM:将大语言模型与领域工业知识桥接,支撑推理、解释与情境决策;
(ii) 5C-CPS:通过“连接-转换-赛博-认知-配置”五级架构,结合 OT、AT、DT、PT 技术实现 AI 与工业系统融合;
(iii) 质量流与 X 流:为多阶段制造过程的持续监控、优化与决策提供结构化范式;
(iv) 数字孪生:整合数据、仿真与服务,创建物理实体的虚拟映射,以 AI、IoT、ML 实现工业智能。
现有方法论虽已推动工业 AI 发展,但其落地仍可借助本文提出的基础框架进一步放大价值。框架并不重定义核心方法论,而是以知识、数据、模型三大模块提供系统视角,支撑现有及新兴方法,确保工业 AI 的设计、实施、部署更有效、可靠、可扩展。
具体示例:使用 ILKM 为维护人员构建智能问答系统。知识模块先从维护手册、技术文档中结构化抽取关键步骤、故障描述与参数设置,形成知识图谱与索引库;数据模块确保维护日志、标注问答对等数据集被规范记录、版本化并与知识库关联;模型模块则指导在领域问答数据上微调 LLM,并定义评估与优化最佳实践。最终,维护工程师可提问“某机型振动超限应检查哪些项?”,系统基于结构化知识与历史数据给出情境化答案。
3.jpg
图3. 将工业人工智能(AI)基础框架应用于旋转机械故障智能诊断的案例研究。缩写:CNN:卷积神经网络;LLM:大语言模型;LSTM:长短期记忆网络;ML:机器学习;RQ:研究问题。
以旋转机械智能故障诊断为例,演示所提框架的应用。使用 PHM Society 公开的齿轮箱振动数据集,共 2 016 条样本、78 种工况、7 类故障(含健康状态)。每条样本为 3–12秒、20.48 kHz 的时域振动信号。任务为多类分类,评估模型在不同工况下的表现。图 3 展示了应用框架的工作流:知识抽取 → 数据准备 → 模型开发 → 评估。
• 知识模块:借助 GPT-4o 通过 API 交互,提出针对性研究问题(“数据集背景?作者如何做预处理?如何构建 1D-CNN/LSTM/Transformer?”),LLM 提供结构化回答、摘要与代码示例,快速掌握信号特征、预处理及建模经验。
• 数据模块:在领域知识指导下构建流水线:清洗 → 分段增样 → FFT 频域特征 → 3:1:1 划分训练/验证/测试集;过程中持续用 LLM 验证策略并获取代码。
• 模型模块:复现并比较 8 种模型:(i) 树模型(决策树、随机森林);(ii) CNN(朴素 1D-CNN、Res-1D-CNN);(iii) LSTM(朴素、双向、混合);(iv) Transformer(基础版)。深度模型因其自动提取复杂模式的能力及对工况变化的鲁棒性而被选中。超参数调优与评估遵循前人经验及开发者实践。
图 3 给出分类准确率与混淆矩阵:Transformer 模型最高 99.47%。与同类研究相比,Su & Lee 的 Res-CNN 96.99%,Vaerenberg 等人 3 层 CNN + PSD/log-norm 96.9%,Gauriat 等人神经可加模型 92.03%。本研究性能提升不仅源于模型设计,更归因于框架的系统指导:统一的数据预处理、模型选择与调参策略,显著提升了可靠性、可扩展性与工业落地性。
未来方向
为进一步强化工业 AI 基础框架,需关注以下方向:
• 人才培养:引入 4P 学习(原理-实践-问题-专业)及跨学科(AI/ML+工程+工业应用)训练,培养下一代工业 AI 从业者。
• 数据铸造(Data Foundry):建立标准化工业数据集采集、标注、基准测试与管理框架,促进合作研究、可重复性与跨行业共享,并举办“工业 AI 数据挑战赛”。
• 扩展至离散事件动态系统与混合控制系统:使知识、数据、模型模块更好地支持事件驱动转换、符号表达与层级系统逻辑。
• LLM 驱动的智能知识管理系统:自动获取、结构化与检索历史案例、领域经验与最佳实践,为研究人员和工程师提供情境化、可操作的洞见,持续提升工业 AI 建模与决策能力。
总结/展望
本文提出了一套统一的工业人工智能基础框架,由三大核心模块——知识模块、数据模块与模型模块——构成,三者协同支撑并强化了工业 AI 方法论平台。文中深入探讨了工业 AI 的作用,并以旋转机械智能诊断为例,展示了该框架的应用潜力。此外,还讨论了若干未来发展方向。
总体而言,本框架为面向未来产业的工业 AI 解决方案的开发、验证与部署提供了系统化途径。尽管如此,工业数据的获取与标注仍是重大挑战;框架虽然借助大语言模型(LLM)实现知识抽取,但仍需人工引导,且计算资源需求可能限制其在部分工业场景中的落地。展望未来,我们呼吁学界、产业界及 AI 实践者加强合作,持续完善并拓展该框架,共同推动下一代“知识-数据驱动”的智能工业 AI 生态。