工业是国民经济不可或缺的一环,也是一个国家强大竞争力背后的力量支撑。我国工业位居世界第一,却大而不强。企业创新能力不足,高端和高价值产品欠缺,在国际产业分工中处于中低端状态,中国工业企业急需转型和升级。
我们正处于大数据和数字化转型的时代,数据无处不在,运用数据驱动的思想和策略在实践中逐渐成为共识。制造企业在利用大数据技术后,其生产成本能够降低10%15%,大数据对于工业企业的重要性不言而喻。不同层面的制造企业在发展过程中,应该采取相应的大数据策略,才能离“工业4.0”、“工业互联网”和“中国制造2025”更近一步。
工业大数据从哪里来?来源于产品生命周期的各个环节,包括市场、设计、制造、服务、再利用各个环节,每个环节都会有大数据。“全”生命周期汇合起来的数据更大。当然,企业外、产业链外的“跨界”数据也是工业大数据“不可忽视”的重要来源。
第一类是生产经营相关业务数据。主要来自传统企业信息化范围,被收集存储在企业信息系统内部,包括传统工业设计和制造类软件、企业资源计划(ERP)、产品生命周期管理(PLM)、供应链管理(SCM)、客户关系管理(CRM)和环境管理系统(EMS)等。通过这些企业信息系统已累计大量的产品研发数据、生产性数据、经营性数据、客户信息数据、物流供应数据及环境数据。
第二类是设备物联数据。主要指工业生产设备和目标产品在物联网运行模式下,实时产生收集的涵盖操作和运行情况、工况状态、环境参数等体现设备和产品运行状态的数据。此类数据是工业大数据新的、增长最快的来源。狭义的工业大数据即指该类数据,即工业设备和产品快速产生的并且存在时间序列差异的大量数据。
第三类是外部数据。指与工业企业生产活动和产品相关的企业外部互联网来源数据,例如,评价企业环境绩效的环境法规、预测产品市场的宏观社会经济数据等。
工业大数据具有一般大数据的特征(海量性、多样性等),此基础上具有价值性、实时性、准确性、闭环性四个典型的特征。工业大数据与互联网大数据最大的区别在于工业大数据有非常强的目的性,而互联网大数据更多的是一种关联的挖掘,是更加发散的一种分析。除此之外,两者在数据的特征和面临的问题方面也有不同。有别于互联网大数据,工业大数据的分析技术核心要解决 3B 问题:
工业环境中的大数据与互联网大数据相比,最重要的不同在于对数据特征的提取上面,工业大数据注重特征背后的物理意义以及特征之间关联性的机理逻辑,而互联网大数据则倾向于仅仅依赖统计学工具挖掘属性之间的相关性。
相对于互联网大数据的量,工业大数据更注重数据的全,即面向应用要求具有尽可能全面的使用样本,以覆盖工业过程中的各类变化条件、保障从数据中能够提取以反映对象真实状态的信息全面性。因此,工业大数据一方面需要在后端的分析方法上克服数据碎片化带来的困难,利用特征提取等手段将这些数据转化为有用的信息,另一方面,更是需要从数据获取的前端设计中以价值需求为导向制定数据标准,进而在数据与信息流通的平台中构建统一的数据环境。
数据碎片化缺陷来源的另一方面也显示出对于数据质量的担忧,即数据的数量并无法保障数据的质量,这就可能导致数据的低可用率,因为低质量的数据可能直接影响到分析过程而导致结果无法利用,但互联网大数据则不同,其可以只针对数据本身做挖掘、关联而不考虑数据本身的意义,即挖掘到什么结果就是什么结果,最典型的就是经过超市购物