数字化运维体系建设方案研究

(整期优先)网络出版时间:2020-09-27
/ 2

数字化运维体系建设方案研究

赵建慧

大庆油田有限责任公司第五采油厂信息中心

摘要随着数字化技术的飞速发展,很多企业开展了数字化转型,打造信息化条件下的精益生产能力。数字化转型需要以思想转型为前提,企业文化转型、组织机构转型为支持,具体实施是以IT转型为依托,数字化运维为保障。本文以采油厂为例,在假设IT转型完成基础上,对数字化运维体系建议方案进行了研究探索。

关键词:数字化;运维体系;

0引言

为保证企业数字化正常运行,应构建完整的数字化运维管理体系,覆盖设施监控、日常运行、队伍管理、监管考核等核心业务,形成企业级一体化的运维协同与交流共享环境,全面提升用户体验和业务系统健康,确保数字化系统的持久效用与高效运行。

本文围绕“安全、稳定、高效、集约”构建数字化运维管理体系,使现状可视、问题可查、风险可辨、未来可测,支撑数字化资源高效运行。具体从对网络、硬件、资源、设备的实时监控,日常运维工单流程电子化,运维队伍、产品厂商的服务质量评价及运维情况进行考核,运维技能与经验分享的运维知识库等方面进行构建。

1运维组织机构设计

为保证数字化运维体系的完整性,拟建立6个运维专业组,明确岗位职责,并根据数字化建设进度逐步完善,打造优质、高效、稳定的运维队伍。

运行监测组,负责各类系统的运行监测与管理;网络管理组,负责各类网络设备运行、网络安全管理;线路维护组,负责光纤线路维护管理;应用系统维护组,负责各类专业软件、服务器管理;数据维护组,负责各类数据库系统及数据管理;设备维护组,负责网络、视频、雷达、安防等设备维护管理。

2运维方法与流程设计

按照涉及的技术种类进行专业化分工,建立运维制度,规范运维管理流程,逐步开展网络、数据库、服务器、应用软件、监控系统、工业网安全等各方面的维护工作。

运维内容包括网络管理、线路维护、运行监测、数据维护、应用系统维护、设备维护。

1)网络管理:开展交换机、无线设备、光传输设备的硬件管理、配置管理、故障诊断等工作;开展工控安全设备管理、安全检查、日志监测、等级保护、安全配置管理、故障诊断。

2)线路维护:开展光纤线路到尾纤间的故障处理,视频线路、供电线路等日常检查、故障维修等工作。

3)运行监测:开展交换机、无线设备、光传输设备的硬件管理、配置管理、故障诊断等工作;开展工控安全设备管理、安全检查、日志监测、等级保护、安全配置管理、故障诊断。

4)数据维护:开展数据库设备、实时数据库管理、关系数据库管理、生产数据监测、数据库配置管理、数据备份、日常检查、故障判断及排除等工作。

5)应用系统维护:开展各类专业软件、服务器系统的硬件管理、配置管理、系统备份、存储管理、故障判断及排除,各类专业系统及应用系统维护的日常检查、故障维修等工作。

6)设备维护:开展网络设备故障维护,开展视频录像设备,监控摄像设备,雷达探测设备、UPS、安防设备的日常检查、硬件管理、配置管理、故障维修等工作。

3运维平台设计

针对设备运维数量大、种类多、分布广及部分区域地理环境和自然气候恶劣的现状,单纯依靠人工发现、突发故障应急处理的运维模式不能完全满足生产需求,必须利用智能化运维监测技术解决人工发现不够及时的问题。

系统采用实时监测技术,实现从数字化管控中心到采集系统的每个设备、传感器的状态监测,使运维人员可以实时掌握信息化系统中每台服务器、交换机、无线基站、RTU 、现场传感器的工作状态,准确的获得故障点的位置及原因。

运维平台内置的故障判断模型,可以精确定位生产信息化系统中每个故障设备的位置,通过预警、报警的方式实时推送给运维人员,使运维人员能够有的放矢的及时处理解决系统中存在的问题。运维监测技术可以帮助运维人员及时消除信息化系统中存在的故障隐患,从根本上改变运维人员被突发故障牵着走的运维模式,变被动运维为主动运维,提升运维质量,降低运维人员的工作强度。

1)网络视频监控模块,包括网络状态监控、视频状态监控及相关日志诊断报警三部分内容。

2)软件系统监控模块,通过检测软件对管控中心的实时数据采集服务器、应用服务器运行情况和存储使用情况进行实时检测,实现报警信息接收,运行状况异常时进行实时推送。实时监测IPMS运行情况、WEB服务状态、数据库状态。

根据服务器配置情况、业务系统情况设定相应的报警阈值,系统自动判断并推送报警信息,协助管理员及时发现和修复问题,确保生产系统 7x 24 小时稳定运行。

3)自动化设备运维模块,通过自动采集和采集规范标准,实现在装仪表的在线情况,运行时间、电池情况等综合监控。

用户可实时跟踪当前在线设备的通讯状态,包括自控设备所属的井号或站名(如果是非井站,显示安装地点)、无线仪表最新的采集更新时间、剩余电量、电池时间、安装时间、运行时间、调校量程等信息。监控内容包括 RTU 通讯 状态 CDMA 通讯状态,电量采集控制器工作状态,无线数字化功图仪工作状态,无线压力传感器工作状态,无线温度工作状态,环境温度变送器工作状态,及以上各仪表的关键工程值是否在合理范围内,每 20 分钟完成一次设备的状态监测。

4)设备台账管理模块,通过上述设备运维功能统计分析设备信息档案,分类记录完整的设备资产信息,实时掌握设备动态,为设备运维提供可靠的基础数据。统计分析设备故障,为后续产品及集成商评价提供参考数据。

设备档案管理,信息化建设档案记录生产信息化建设竣工后上线使用的第一手设备信息,主要记录集成商施工完成后所有生产对象上安装设备的状态、名称、型号、厂家、设备编号、生产日期 、安装位置、物码等基础数据,以此作为“应在线”设备的统计基础,该资产数据根据后期设备运维工单进行设备使用状态的实时更新,包括在用、缺失、拆除三种状态。

设备维修统计记录,统计所有设备的维修次数、查询设备的历次维修记录。

设备检验统计记录,统计所有设备的检验次数,查询设备的历次检验记录。

报废设备统计记录,统计报废设备的个数,查询报废的原因记录。

5)系统管理平台,对单机电脑的管理与安全方面,能够及时做到系统备份还原、驱动诊断修复、安全体检与修复、数据安全保护。

6)人员管理平台,对作业区各职能部门人员管理,包括职工姓名、岗位、在岗状态等,为作业区管控平台调度运行人员分派提供数据支持。数据来源可以ERP数据导入,岗位变更、在岗状态本系统自行管理,在岗状态可通过移动端签到形式获取。

对虚拟化环境进行可行性分析后,具体应检查计算资源、存储资源、网络资源以及数据库资源等,建立迁移所需的环境准备。

4运维保障

1)硬件设备,配备光纤熔接机、OTDR、无线信号测量仪、电工仪表、GPS定位仪等专业的维修、测量工具;在管控中心建立存放常用设备、维修耗材的备用设备库。

2)软件技术,建设数字化设备运行检测平台、运维管理平台,实现生产网络内的设备监测和运维管理,为值班人员提供故障告警,辅助分析故障原因并提供处理方案。

3)人员能力,加强在网络管理、安全管理、视频监控、服务器管理、实时数据库管理、电工操作等各方面的技术培训工作,提高运维人员的技术水平,增强保障能力。

5结论

本文以数字化转型成功的采油厂为例,从数字化运维保障业务出发,从网络、软件、设备、人员四方面研究内容进行研究论证,建立完整的数字化体系建设方案。

参考文献

1. 数字化转型背景下的IT运维建设,DIST上海数慧

2. 数字化转型之道,IT运维网

3