大数据

大数据技术在智能制造运营管理中的应用

2025China.cn   2021年11月16日

  1 引言

  MES/MOM 系统中,采集和存储大量的来自不同生产运营过程的多源异构数据,被定义为“制造大数据”。制造大数据不同于互联网下的社交网络大数据,具有如下鲜明的特点:1)强时序性;2)强关联性;3)高预警性;4)数据增量性巨大。主要是因为生产制造过程本身是一个连续的整体的系统。因此,需要开发新的数据分析工具或算法来发现生产运营过程中潜在的特定的问题和知识。

  本文针对于离散制造业常见的按订单生产制造(MTO)模式,提出了基于可视化模型的大数据分析算法。基于以往的行为模式中,采用大数据算法(如深度学习)预测未来生产中可能存在的威胁和瓶颈。

  按订单生产(MTO 制造)是离散制造业最常见的生产制造模式之一,通常是面向项目/订单的制造类型,如机械装置或能源设备等复杂产品的生产制造都采用该制造模式。

  如今,MTO 制造业面临着动态多变的商业环境,全球化的强大影响,竞争日益剧烈、不正确的需求预测、开发过程中的频繁变更、高度依靠单一供应链体系以及交货时间短等挑战。另一方面,他们还面临着信息不完整、工业知识图谱不完善以及资源的随机性等问题。因此,对车间操作和物料流的有效管理是控制这种高度动态的制造环境的操作复杂性的关键因素之一。

  很多制造业也意识到可靠、准确的数据是生产运营管理的必要条件,也是企业保持市场竞争力的关键因素,因此很多制造业已实施部署了各种制造信息系统(如 MES、MOM 和 ERP)并集成了企业中各种相关业务,目的是确保信息的完整、改善车间的可视性和物料流的可追溯性等,以便更好地生产决策。这些信息系统都生成并存储相关项目、工单、操作、资源、生产计划和事件等的多源异构数据。在智能制造模式和工业 4.0 范式的推动下,人们越来越意识到制造业数据的价值和潜力。

  但是,由于缺乏相关知识和如何有益地使用可用数据的想法,大数据分析技术提供的可能性与制造业从制造大数据中提取价值的能力之间存在很大差距。因此,本文尝试采用大数据分析技术,挖掘制造大数据自身的价值,以支持制造运营管理。

  2 案例分析

  在本节中,将对 MTO 制造业中基于实际制造业数据的运营管理进行数据分析的初步研究。

  大量的研究和实践表明,MTO 制造业最容易出现,且不容易控制的来源于生产计划。计划不充分导致交货时间长、订单延误率高、资源利用效率低、工作超负荷和关键资源瓶颈等,这些都是 MTO 公司的典型问题。其主要是因为产品种类繁多,批次数量少,缺乏冗余资源,生产负荷不平衡,物料流不足等导致。

图 1 实验用例流程图

  如图 1 所示,以活动模型(IDEF0)图的形式展示试验研究的工作流程。第一步,MES 数据的预处理;第二步,部署生产方案可视化模拟工具;第三步,测试用于计划排产任务的不同启发式算法;最后,应用开发的模拟工具演示并测试了预测工具的开发和使用,该工具可用于预测工作系统上的工作量累积。

  2.1 数据准备和预处理

  实验研究中考虑的数据与在被研究的 MTO制造业公司的车间中执行制造操作有关。实验中,采用 MES 数据库的备份。数据从 2016 年 1 月开始,为期 18 个月。该实验数据集包括 58865 个制造工序,14422 个工单和 352个工作系统的数字、分类和文本描述。

  预处理原始数据并创建三个没有丢失、无意义和极值的关系表。这些关系表的结构见下表。

  将工作订单的实际开始时间戳确定为第一个相应操作的实际开始时间戳。单个工作订单的工序由操作实际开始时间戳的顺序确定。将实际加工时间计算为结束加工时间减去开始加工时间。

  尽管表中包含有关 352 个工作站的信息,但是在观察到的 18 个月时间段内(即用于表操作中的处理)仅使用了 160 个。数据预处理系统以 Python 编程语言实现,数据库管理系统采用 MySQL。

  表 处理数据关系表结构

  2.2 生产计划模拟假定

  基于预处理的 MES 数据,开发生产方案可视化模拟工具。仿真工具以 Python 编程语言实现,并使用面向文档的 NoSQL 数据库 MongoDB 来存储和管理生成的仿真方案,以进行进一步地分析和可视化。

  为了简化进行实验研究,同时考虑到信息的不完整性,因此做出了如下假设和简化:

  1)24/7 全天候生产,无休假;2)在单个工作站上一次只能执行一项操作;3)在处理单个工序的过程中没有中断,这意味着工序的工作不能在中间停下来,然后再继续进行;4)所有工作站都被视为独自位于自己的位置,并且物料从一个工作站传输到另一个工作站,然后执行后续操作。由于缺少有关物流运输的信息,因此将材料从一个工作站运输到另一个工作站所需的时间随机设置为 30~90 min;5)每次操作后,需要进行运输,然后才能开始相应工作单的后续操作;6)在操作处理时间中已经考虑到工作中断、故障和故障排除等;7)不考虑维护工作。

  2.3 可视化仿真用例:测试用于计划排产任务的启发式算法

  为了显示如何使用生产场景模拟工具,给出了测试启发式算法以计划任务的示例。测试了两种用于计划排产任务的简单启发式算法:

  1)先进先出策略(FIFO)。在该策略下,工作站上等待时间最长的工序将首先进行处理。

  2)最早计划时间策略(EPT)。在该策略下,工作站上首先要处理的是计划的作业开始日期最早的工序。用来比较两种不同调度启发式方法的仿真结果的指标是延迟订单的分布情况。工单延迟是通过工单的和来计算(实际完成时间/计划完成时间)。

  模拟开始时间为 2016 年 1 月 4 日,模拟结束时间为2017 年 5 月 1 日。

图 2 用于计划排产的不同启发式策略算法对比

  工单延迟时间的结果分布如图 2 所示。为了指示生产方案模拟工具的准确性和可靠性,在图 2 中添加了基于原本 MES 数据计算的实际工单延迟时间的分布。通常,目标是工单的结束时间不会太晚也不会太早。结果显示EPT 策略启发式算法效果较优。

  2.4 大数据预测算法分析

  与车间中的运营管理相关的另一问题是工作站的工作负荷,即需要在工作系统上完成的工作的累积。工作系统工作过载 WSO 定义为在给定时刻(式 1)等待在工作系统上处理的操作处理时间的总和。

  式中,ti 是等待操作;Oi 是处理时间;Nw 是工作系统上等待操作的次数;Ow 是工作系统上所有等待操作的集合。

  为了预测工作站的工作负荷值,可以预测工作的处理时间、工作位置和工作订单的状态(在等待,运输或处理中)。

  在实验中开发并使用了基于历史数据的预测操作处理时间的功能和学习调度启发式方法的功能,并在实验中使用了机器学习技术来预测操作处理时间并学习了操作选择的启发式方法。实现的机器学习算法是基于 Python机器学习库 Scikit-learn。由于易于调整,与其他方法(例如神经网络)可比的预测能力以及方法的可伸缩性,因此使用了随机森林算法。

  预测哪个操作将首先在工作系统上进行处理的算法包括两个连续的步骤:

  步骤一:对于要在工作系统上处理的一组等待操作中的每个操作,请使用 OPSEL 预测器(如下所述)进行预测,该预测器返回 0 或 1。

  步骤二:从 OPSEL 预测变量预测为 1 的操作集中随机选择操作。如果没有预测为 1 的操作,则从观察到的工作站的所有等待操作集中随机选择操作。

  OPSEL 预测是基于机器学习技术进行分类。它以一种既可以学习 FIFO 也可以学习 EPT 启发式的方式进行设计。用于学习的个体实例对应于在某个工作站中选择操作的个体过去情况,并且对应于在该工作站中等待处理的个体操作。特征向量由三个特征组成:1)在观察到的工作站中要处理的所有等待操作的数量;2)等待时间更长的操作的数量;3)待等待的操作的数量和具有较早的计划操作开始时间。相关目标类别 yopsel 表示是否选择了观察情况下的操作(yopsel = 1)或未选择(yopsel = 0)。

  使用单独的训练和测试集方法估计已实施的预测选择模型的性能。训练和测试集都包含一个月时间段的实例(一个月用于训练,下一个用于测试)。使用开发的生产方案模拟工具。结果是:1)在使用 FIFO 启发式的情况下,该模型正确地预测了 100%的示例中的所选操作。2)在使用 EPT 启发式算法的情况下,模型正确预测了 75%的示例中的选定操作,这可能是由于以下情况经常发生的结果:多个等待操作的计划开始时间与计划中选定的操作的计划开始时间完全相同。

  生产场景可视化模拟工具用于演示工作站工作负荷预测工具的使用并评估其性能。选择 EPT 策略下的启发式算法。模拟的开始时间为 2016 年 1 月 4 日。开始预测时间设置为 2017 年 2 月 15 日。预测时间提前了一个月,直到 2017 年 3 月 15 日。开始收集示例以学习 OPSEL 预测器的时间设置为开始预测时间之前的 30 天。工作系统工作过载可视化的一般原理,用于显示预测结果,如图 3 所示。

图 3 工作站可视化模型

  2.4.1 结果与讨论

图 4 实际和预测工作站负荷对比

  如图 4 所示,给出了实际和预测的工作系统工作超负荷的比较。

  预测的操作开始数为 2371,而在预测期间实际开始的操作数为 2946。97.6%的预测操作在 2017 年 5 月 1 日之前的实际场景中启动。这些预测操作的平均误差(预测和实际开始时间戳相减的平均值)和 MAE 的开始时间分别为-3.86 和 9.13 天。预测的操作处理时间的平均误差,MAE 和 RMSE 分别为 56.25 min,19.38 h 和 32.03 h。

  通常,除了预测操作选择和操作处理时间之外,机器学习技术还可以用于其他功能,例如,预测运输时间、预测工单延迟和预测工单的操作顺序改变等。

  可视化有助于决策。如果可以尽早预测某些工作站的关键工作负荷,可以提前采取行动,例如,可以重新安排相关的工作订单,可以将操作重定向到类似的工作站,甚至可以外购等。

  3 结束语

  本文研究了如何采用大数据分析技术对制造执行/运营管理系统(MES/MOM)采集的多源异构数据进行分析预测,以便支持制造业制造运营管理决策。文中以离散制造业常见的按订单生产(MTO)制造模式进行说明。

  根据实际的制造大数据,提出了生产情景可视化模拟和算法验证相结合的研究思路,开发了生产情景模拟工具,并将其用于实验研究。实验包括测试用于计划排产任务的启发式算法,以及生成数据分析工具以预测工作系统中的工作量。基于大数据的可视化模型,以方便进行操作管理的决策并有效地呈现汇总信息。结果表明,这种分析方法有助于更好地管理操作,从而更有效地执行操作,更好地利用资源,缩短交货时间并提高到期日可靠性,良好地支持制造运营管理决策。通过实验,确定了在实际制造环境中开发和实施大数据分析工具时需要考虑的问题和挑战。

  原文刊载于《智能制造》2021 年第 2 期 作者:陈晨 秦双双 常芹

(转载)

标签:大数据技术 智能制造 我要反馈 
参与ABB电机与发电机拼图挑战赛赢取探厂等好礼,快来挑战!
西克
2023世界人工智能大会专题
专题报道
安全走向数字化
安全走向数字化

如果说安全是过程工业的基本盘,数字化是过程工业的新锚点,那么作为2023 NAMUR中国年会唯一的赞助商,HIMA与这次

第三届EESA储能展
第三届EESA储能展

EESA储能展是由储能领跑者联盟主办的品牌展会,创办至今已经连续举办了两届。为加快适应储能规模化发展的步伐,促进储能行业

2023全景工博会 | 直播探馆 · 全景解读
2023全景工博会 | 直播探馆 · 全景解读

2023年9月19日-23日,第二十三届中国国际工业博览会将于国家会展中心(上海)隆重举行。本届工博会将以“碳循新工业、