国产化ATS系统在日常维护中的故障处置流程分析

(整期优先)网络出版时间:2023-12-12
/ 2

国产化ATS系统在日常维护中的故障处置流程分析

陈捷

昆明地铁运营有限公司云南 昆明 650000

摘 要:随着城市轨道交通建设的迅猛发展,ATS系统作为信号系统中实现列车自动监控和行车管理的主要系统,逐步被提高到关键行车系统的等级。随着国内研发水平的提高,近年来,国产自主化ATS系统逐步进入轨道交通行业,并且占有一定份额。但由于国产化系统开发、验证时间段,技术力量有限等因素,系统在使用过程中故障率较高。

通过文献研究和国产化系统运用后的故障案例分析,本文对目前适用于日常的故障处理进行了分析,研讨出能快速判断的方法和处置流程,并提出处置建议。

关键词:  ATS  iTS   故障处理  故障分析


本文通过对卡斯柯信号公司完全自主开发的ATS系统简单案例分析,主要讨论该系统部分故障分析和处理的方向。

一、 iTS系统的发展及在国内外应用情况

2 0 世 纪 9 0 年 代 卡 斯 柯 和ALSTOM一起建设上海地铁1号信号系统,参与全自动驾驶信号系统设计和调试。本着先易后难、最大限度结合用户需求的原则,同时考虑A T S是一个非严格安全且直接被调度人员操作的一线系统,卡斯柯选择A T S作为城轨信号系统自主化开发的入口,从1996年开始A T S的自主研发工作,并在2000年应用自主开发的A T S顺利开通伊朗德黑兰地铁1号、2号线。北京和上海的用户从2001年开始选择卡斯柯的自主化A T S。从德黑兰地铁1号、2号线的i T S100型ATS开始,目前卡斯柯自主化ATS已经发展到第5代i T S500型,该型ATS支持CBTC下的无人驾驶功能。卡斯柯目前正在开发的最新一代A T S,将应用于香港南岛线的无人驾驶信号系统,卡斯柯的自主化A T S已经得到素以管理严格著称的香港地铁(MTR)认可。

二、卡斯柯iTS系统特点

通过解构卡斯柯信号有限公司的ATS系统可总结出其系统的以下几点特性对于地铁线路的运营效率起到了至关重要的作用:

1、软件兼容性强,通过一套标准软件兼容所有项目以及来自不同项目的各种客户需求,各种不同的外部接口可完全通过数据配置实现。

2、软件可满足高密度行车功能,对于上海、北京、广州等人口密集城市,iTS-500系统可实现最低2分钟运行间隔,大大提高了运行效率。

3、ATS系统所有硬件设备均按照双机热备的配置,满足了故障-安全的需求,保障了地铁线路的正常运营。


三、故障处理通用原则

1、ATS系统中心发生故障时(中心没有表示信息或所有中心工作站无法操作),首先提醒调度员通知车站值班员转为站控。

2、ATS系统中心发生故障时(中心没有表示信息或所有中心工作站无法操作),并且车站2台LATS服务器故障时,此时车站值班员因转紧急站控。

3、ATS 发生单点故障时,不要轻易切换应用服务器、通信服务器和网关服务器,不要轻易重启交换机等网络设备,否则容易扩大故障影响范围

4、日常巡视时发现备用机器或者备用通道故障时,虽然暂时不影响使用,但必须立即处理

四、故障处理主流程

故障处理主流程

4.1 关键设备故障处理分支流程

4.1.1  中心服务器故障

应用服务器故障处理流程

4.1.2  中心工作站故障

中心工作站故障处理流程

4.1.3 车站服务器故障

车站服务器故障处理流程

4.1.4  网络故障

网络故障处理流程

4.1.5  时钟同步故障
 

时钟同步故障处理流程

五、 ATS设备主要故障的分析和处理

5.1  应用服务器故障分析

故障点

故障或异常描述

故障对运营的影响

问题处理方式

应用服务器

服务器单机故障:主机故障程序未退出,备机无法升主机,调度界面显示卡机

影响整个中央设备的显示以及ATS相关功能使用,中央大屏和调度台全部灰显

1.单机故障(主机或备机),先检查网络。

2.网络没问题时,主机故障如果应用程序没有退出,那么备机是无法升级为主机的,需要及时手动关闭主机的应用程序。

3.如果是备机故障,此时不影响使用,但也需立即进行处理。

服务器单机故障:主机故障程序退出,备机升为主机,在中心ATS界面上显示应用服务器离线报警。

不影响

1.单机故障(主机或备机),先检查网络。

2.网络没问题时,主机故障如果应用程序没有退出,那么备机是无法升级为主机的,需要及时手动关闭主机的应用程序。

3.如果是备机故障,此时不影响使用,但也需立即进行处理。

服务器单机故障:主机工作正常,备机故障,在中心ATS界面上显示应用服务器离线报警。

不影响

1.单机故障(主机或备机),先检查网络。

2.网络没问题时,主机故障如果应用程序没有退出,那么备机是无法升级为主机的,需要及时手动关闭主机的应用程序。

3.如果是备机故障,此时不影响使用,但也需立即进行处理。

应用服务器故障分析表

5.2  车站服务器(LATS)故障分析

故障点

故障或异常描述

故障对运营的影响

问题处理方式

车站服务器(LATS)

单机故障现地工作站HMI界面上设备状态信息栏灰色显示,车站HMI和中心调度台弹出LATSA/LATSB失去连接,车站站场图及中心站场图界面显示正常

单机故障不影响功能使用。

1.在ATS车站分机上查看,如果状态栏左方的信息窗口中无任何信息刷新,则车站分机故障,此时需要重启ATS车站分机。

2.如重启ATS车站分机后,故障仍未恢复,且ATS车站分机与任何其他设备连接状态均未建立,则可能是网路故障,需要及时处理网路。

3.单个LATS故障:不会影响使用,但需要立即恢复,首先检查网络连接,网络正常再检查LATS的运行程序是否有退出或者是假死的现象,如果有需要重启LATS应用程序。

双机故障或者网络连接故障时现地工作站HMI和中心调度台MMI都灰显,同时会有与LATS失去通信报警。

ATS功能不可用,建议切换到紧急站控模式

1.在ATS车站分机上查看,如果状态栏左方的信息窗口中无任何信息刷新,则车站分机故障,此时需要重启ATS车站分机。

2.如重启ATS车站分机后,故障仍未恢复,且ATS车站分机与任何其他设备连接状态均未建立,则可能是网路故障,需要及时处理网络。

3.双机故障:双机故障HMI灰显,需要调度指挥车站值班员转紧急站控,然后再排查故障,首先检查LATS机柜运行状况,检查硬件连接和电源的运行情况。4.如硬件没问题,那么检查网络的连接,网络正常再检查LATS的运行程序是否正常,若故障需要进行倒机或者重启。                                                              

车站服务器(LATS)故障分析表

5.3 外部接口故障分析

故障点

故障或异常描述

故障对运营的影响

问题处理方式

外部接口

大部分外部接口出现异常,如广播,PIS,无线等

影响站台PIS,广播等

1.如与ATS通信前置机连接的所有外部接口均报告故障,此时故障应该定位在信号的通信前置机主机,如主机FEP软件无相应或操作系统死机,此时应立即人工退出FEP主机软件或关闭系统,此时备机将主动升主机。

2.如问题仍然没有解决,需查看FEP主机与应用服务器S直接的通讯是否正常,以及应用服务器是否正常,如应用服务器不正常,转应用服务器故障处理。

外部接口故障分析表

3.4.4  故障案例分析

以无锡地铁1号线作为分析背景列举两起外部接口问题分析。

案例1:无锡地铁1号线锡北运河下行站台PIS预计到站时发生跳变。

现象:锡北运河站下行站台PIS倒计时跳变。

故障分析:通过FEP日志分析(如图4-7,4-8所示),I7:17:36预计到达锡北运河下行站台(7号站2站台)的第一辆车的车组号由104变成了106。在17:18:40预计到达锡北运河下行站台的第一辆车的车组号又由106车变为104车。

 

 

FEP日志图

通过回放看到17:17:36这个时间点104车刚好到达堰桥站下行折返小站台(如图4-9所示),17:18:40这个时间点(如图4-10所示)104车刚到到达堰桥站下行站台。在17:17:36~17:18:40这段时间内应用服务器做预测计划的时候104车清掉了,直到104车到达堰桥站下行站台又104车加到预测计划中,所以堰桥站下行站台的下一站锡北运河站下行站台的PIS倒计时会发生跳变的情况。

 

回放截图1

回放截图2

分析结果:此问题由于应用服务器软件运算问题导致,后续需要升级软件解决这个问题(目前此问题已经通过升级应用服务器软件的方式解决)。

案例2:无锡地铁1号线FEP软件卡死。

现象:全线无进站广播、PIS信息、无线调度台无列车位置显示

故障分析:通过查看故障FEP的日志,发现日志中全是报错信息,通过日志的报错信息可以确定FEP卡死的原因由于发送信息发送太多,导致队列占满,PIS等信息无法发送出去,导致FEP卡死(如图4-11所示)但是由于该FEP一直处于卡死状态软件并没有退出,所以另一台FEP无法升级为主机导致了全县广播、PIS、无线问题的发生。

FEP软件卡死示意图

分析结果:此故障由于FEP软件卡死且不能自动退出导致,后续将对FEP软件进行升级,优化FEP信息处理能力,同事增加一个检测程序,检测到程序跑死后自动退出,然后备机升级为主机继续工作。

六.结论

ATS系统作为基于无线通信的列车控制系统的核心设备,对城轨交通列车的行车效率和运行安全起着至关重要的作用。本文以ATS系统在国内外的应用情况为研究背景,剖析了ATS系统的相关技术,以卡斯柯信号有限公司的iTS500系统为例,讨论了其系统的功能、特点及典型故障处理方法。 

论文主要完成了以下工作:  

1、通过对国产化iTS系统故障的收集和分析,形成了较为适用日常快速故障判断和分析的策略。

2、通过实际案例,验证本文中所阐述的故障分析步骤和流程的准确性和可靠性。

本论文在对城市轨道交通 ATS 系统功能计过程中存在以下不足:

1、该论文只针对目前国内其中一家系统的故障进行了分析和判断。存在采样和故障案例过于单一的不足。

2、要更好的针对ATS故障进行全面分析和判断开展讨论,还需要对国内目前大多数系统进行故障采样。


参考文献

[1] 林瑜筠编.城市轨道交通联锁系统[M].中国铁道出版社,2013(12):10-12.

[2] 崔科.卡斯柯自主知识产权的iCMTC信号系统[J]:现代轨道交通.2014(3):1-4

[3] 陈荣武,蒋葛夫.翟婉明等.城市轨道交通列车运行控制[M].北京科学出版社,2014(2).