(12)发明专利申请
(10)申请公布号 CN 110503209 A(43)申请公布日 2019.11.26
(21)申请号 201910671589.0(22)申请日 2019.07.24
(71)申请人 山东麦港数据系统有限公司
地址 250101 山东省济南市高新区新泺大
街2117号铭盛大厦10层(72)发明人 张保国 江广坤 王洪伟 吕关仁
顾德峰 刘鹏 王明涛 李倩倩 焦丽娜 (74)专利代理机构 济南诚智商标专利事务所有
限公司 37105
代理人 朱晓熹(51)Int.Cl.
G06Q 10/00(2012.01)G06Q 10/04(2012.01)G06F 17/18(2006.01)
权利要求书2页 说明书6页 附图2页
G06Q 50/26(2012.01)
CN 110503209 A(54)发明名称
一种基于大数据的钢轨分析预警模型构建方法与系统(57)摘要
本发明提供了一种基于大数据的钢轨分析预警模型构建方法与系统,本发明通过对现有工务段数据进行抽取,形成一米精度表,并关联钢轨相关台账表,形成完整的数据模型,完成数据仓库的搭建,并依赖于数据仓库的大数据优势对数据仓库中的数据利用时间序列以及逻辑回归进行分析预警模型的建立,通过分析预警模型获得未来一段时间内的钢轨状态相关参数的预测值,并将预测值与设定阈值进行比较,得到是否进行维护的决策指导信息,实现对钢轨安全的自动化分析预警。本发明可有效提高分析预警精确度,缩短预测周期,建立自动化维护以及大修计
切实保证铁路运行的划,实现设备维护智能化,
安全性和可靠性。
CN 110503209 A
权 利 要 求 书
1/2页
1.一种基于大数据的钢轨分析预警模型构建方法,其特征在于,所述方法包括以下步骤:
S1、根据工务段线路数据建立一米精度表,并关联钢轨相关台账表,完成数据仓库的搭建;
S2、根据过去一段时间内的钢轨状态相关参数的统计数据,利用时间序列分别对各参数建立分析预警模型,获取未来时间内各个参数的预测值,并将各个参数预测值与设定的阈值进行比较,获取比较结果;
S3、统计各个刻度点上的钢轨伤损变量历史数据,通过逻辑回归模型对样本进行训练,预测钢轨伤损情况;
S4、根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。
2.根据权利要求1所述的一种基于大数据的钢轨分析预警模型构建方法,其特征在于,所述一米精度表以一米为间隔,包括线名、行别、工务段线路基本属性。
3.根据权利要求1所述的一种基于大数据的钢轨分析预警模型构建方法,其特征在于,所述钢轨状态相关参数包括磨耗、TQI值、通过总重以及伤损数。
4.根据权利要求1所述的一种基于大数据的钢轨分析预警模型构建方法,其特征在于,所述时间序列为SARIMA模型,其表现形式如下:
s为季节性序列的变化周期,L为滞后算子,
AP(Ls)分别表示非季节与季节自回
归多项式,θBQ(Ls)分别表示非季节与季节移动平均多项式,下标P、Q、p、q分别表示季q(L)、节与非季节自回归、移动平均算子的最大滞后阶数,d、D分别表示非季节和季节性差分次数。
5.根据权利要求1所述的一种基于大数据的钢轨分析预警模型构建方法,其特征在于,所述钢轨伤损变量包括伤损频率、距离已有伤损的最近距离、磨耗、TQI值、通过总重、曲线半径、温度、钢轨基本属性。
6.根据权利要求1所述的一种基于大数据的钢轨分析预警模型构建方法,其特征在于,所述逻辑回归模型表示如下:
g(x)=w0+w1x1+…+wnxn当P(y=1|x)>0.5时,则该位置点钢轨伤损情况为重伤,否则伤损情况则为轻伤。7.一种基于大数据的钢轨分析预警模型构建系统,其特征在于,所述系统包括:数据仓库搭建模块,用于根据工务段线路数据建立一米精度表,并关联钢轨相关台账表,完成数据仓库的搭建;
钢轨状态预测模块,用于根据过去一段时间内的钢轨状态相关参数的统计数据,利用时间序列分别对各参数建立分析预警模型,获取未来时间内各个参数的预测值,并将各个参数预测值与设定的阈值进行比较,获取比较结果;
伤损预测模块,用于统计各个刻度点上的钢轨伤损变量历史数据,通过逻辑回归模型
2
CN 110503209 A
权 利 要 求 书
2/2页
对样本进行训练,预测钢轨伤损情况;
维护分析模块,用于根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。
8.根据权利要求7所述的一种基于大数据的钢轨分析预警模型构建系统,其特征在于,所述一米精度表以一米为间隔,包括线名、行别、工务段线路基本属性。
9.根据权利要求7所述的一种基于大数据的钢轨分析预警模型构建系统,其特征在于,所述时间序列为SARIMA模型,其表现形式如下:
s为季节性序列的变化周期,L为滞后算子,
AP(Ls)分别表示非季节与季节自回
归多项式,θBQ(Ls)分别表示非季节与季节移动平均多项式,下标P、Q、p、q分别表示季q(L)、节与非季节自回归、移动平均算子的最大滞后阶数,d、D分别表示非季节和季节性差分次数。
10.根据权利要求7所述的一种基于时间序列的钢轨分析预警模型构建系统,其特征在于,所述逻辑回归模型表示如下:
g(x)=w0+w1x1+…+wnxn
当P(y=1|x)>0.5时,则该位置点钢轨伤损情况为重伤,否则伤损情况则为轻伤。
3
CN 110503209 A
说 明 书
1/6页
一种基于大数据的钢轨分析预警模型构建方法与系统
技术领域
[0001]本发明涉及钢轨检测技术领域,特别是一种基于大数据的钢轨分析预警模型构建方法与系统。
背景技术
[0002]铁路工务基础设施,是铁路运输中必不可少的技术设备,主要包括轨道、路基、桥梁、隧道等,一般占铁路运输固定资产价值的60%左右。铁路工务设备的工作特点不同于一般工程结构物,具有荷载随机性和重复性、结构的组合性和散体性、养护维修的经常性和周期性的特点。在使用过程中由于列车荷载和自然环境的影响,不可避免的会发生疲劳、永久变形、劣化和破损,为了使铁路工务设备经常保持良好状态,保证列车能够按规定速度安全、平稳和不间断运行,就必须及时进行养护维修,并且要不断提高铁路设备修理质量和技术水平,实现线路设备生命周期成本最优的目标。
[0003]工务系统已经部署应用了一些检测监测设备和系统软件,对加强工务安全生产管理起到了重要作用,但仍不能满足发展的需要,普遍存在以下问题:[0004]既有系统十分零散,对于各个系统的操作比较繁琐;数据资源不能相互对接,无法互联共享;日常管理不能闭环;现有的人工分析预警工作效率低、精度低;钢轨的维护决策缺乏有效指导。
发明内容
[0005]本发明的目的是提供一种基于大数据的钢轨分析预警模型构建方法与系统,旨在解决现有技术中钢轨人工分析预警存在繁琐、效率低、精度低的问题,实现自动化分析预警,提高分析预测精确度,保障铁路安全。[0006]为达到上述技术目的,本发明提供了一种基于大数据的钢轨分析预警模型构建方法,所述方法包括以下步骤:[0007]S1、根据工务段线路数据建立一米精度表,并关联钢轨相关台账表,完成数据仓库的搭建;[0008]S2、根据过去一段时间内的钢轨状态相关参数的统计数据,利用时间序列分别对各参数建立分析预警模型,获取未来时间内各个参数的预测值,并将各个参数预测值与设定的阈值进行比较,获取比较结果;[0009]S3、统计各个刻度点上的钢轨伤损变量历史数据,通过逻辑回归模型对样本进行训练,预测钢轨伤损情况;[0010]S4、根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。[0011]优选地,所述一米精度表以一米为间隔,包括线名、行别、工务段线路基本属性。[0012]优选地,所述钢轨状态相关参数包括磨耗、TQI值、通过总重以及伤损数。[0013]优选地,所述时间序列为SARIMA模型,其表现形式如下:
4
CN 110503209 A[0014][0015]
说 明 书
2/6页
s为季节性序列的变化周期,L为滞后算子,
AP(Ls)分别表示非季节与季节
自回归多项式,θBQ(Ls)分别表示非季节与季节移动平均多项式,下标P、Q、p、q分别表q(L)、
示季节与非季节自回归、移动平均算子的最大滞后阶数, d、D分别表示非季节和季节性差分次数。
[0016]优选地,所述钢轨伤损变量包括伤损频率、距离已有伤损的最近距离、磨耗、TQI值、通过总重、曲线半径、温度、钢轨基本属性。[0017]优选地,所述逻辑回归模型表示如下:
[0018]
g(x)=w0+wlx1+…+wnxn[0020]当P(y=1|x)>0.5时,则该位置点钢轨伤损情况为重伤,否则伤损情况则为轻伤。[0021]本发明还提供了一种基于大数据的钢轨分析预警模型构建系统,所述系统包括:[0022]数据仓库搭建模块,用于根据工务段线路数据建立一米精度表,并关联钢轨相关台账表,完成数据仓库的搭建;[0023]钢轨状态预测模块,用于根据过去一段时间内的钢轨状态相关参数的统计数据,利用时间序列分别对各参数建立分析预警模型,获取未来时间内各个参数的预测值,并将各个参数预测值与设定的阈值进行比较,获取比较结果;[0024]伤损预测模块,用于统计各个刻度点上的钢轨伤损变量历史数据,通过逻辑回归模型对样本进行训练,预测钢轨伤损情况;[0025]维护分析模块,用于根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。[0026]优选地,所述一米精度表以一米为间隔,包括线名、行别、工务段线路基本属性。[0027]优选地,所述时间序列为SARIMA模型,其表现形式如下:
[0028][0029]
[0019]
s为季节性序列的变化周期,L为滞后算子,
AP(Ls)分别表示非季节与季节
自回归多项式,θBQ(Ls)分别表示非季节与季节移动平均多项式,下标P、Q、p、q分别表q(L)、示季节与非季节自回归、移动平均算子的最大滞后阶数, d、D分别表示非季节和季节性差分次数。
[0030]优选地,所述逻辑回归模型表示如下:
[0031][0032]
g(x)=w0+wlx1+…+wnxn[0033]当P(y=1|x)>0.5时,则该位置点钢轨伤损情况为重伤,否则伤损情况则为轻伤。[0034]发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
5
CN 110503209 A[0035]
说 明 书
3/6页
与现有技术相比,本发明通过对现有工务段数据进行抽取,形成一米精度表,并关
联钢轨相关台账表,形成完整的数据模型,完成数据仓库的搭建,并依赖于数据仓库的大数据优势对数据仓库中的数据利用时间序列以及逻辑回归分别进行分析预警模型的建立,通过分析预警模型获得未来一段时间内的钢轨状态相关参数的预测值,以及钢轨伤损情况,并将预测值与设定阈值进行比较,得到是否进行维护的决策指导信息,实现对钢轨安全的自动化分析预警。根据本发明所提供的分析预警信息预测基础设施状态变化趋势,可有效提高分析预警精确度,缩短预测周期,减少工作量,对重点监控位置或区域的设备运行与维护状态进行研判,建立自动化维护以及大修计划,实现设备维护智能化,切实保证铁路运行的安全性和可靠性。
附图说明
[0036]图1为本发明实施例中所提供的一种基于大数据的钢轨分析预警模型构建方法流程图;
[0037]图2为本发明实施例中所提供的包含线路所有信息的数据模型示意图;
[0038]图3为本发明实施例中所提供的一种基于大数据的钢轨分析预警模型构建系统框图。
具体实施方式
[0039]为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。[0040]下面结合附图对本发明实施例所提供的一种基于大数据的钢轨分析预警模型构建方法与系统进行详细说明。[0041]如图1所示,本发明实施例公开了一种基于大数据的钢轨分析预警模型构建方法,所述方法包括以下步骤:[0042]S1、根据工务段线路数据建立一米精度表,并关联钢轨相关台账表,完成数据仓库的搭建;[0043]S2、根据过去一段时间内的钢轨状态相关参数的统计数据,利用时间序列分别对各参数建立分析预警模型,获取未来时间内各个参数的预测值,并将各个参数预测值与设定的阈值进行比较,获取比较结果;[0044]S3、统计各个刻度点上的钢轨伤损变量历史数据,通过逻辑回归模型对样本进行训练,预测钢轨伤损情况;[0045]S4、根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。[0046]搭建数据仓库,将工务设备运行和监测数据进行抽取、清洗和挖掘,建立一米精度表,具体为从各个工务段获取各条线路标准的起终点路程,根据线路起终点路程设计出新
6
CN 110503209 A
说 明 书
4/6页
的关于线名、行别、工务段等线路基本属性和里程的一米刻度表。所述一米精度表以一米为间隔,有效提高钢轨数据精度。[0047]利用生成的1米刻度表关联钢轨相关的台帐表。所述台账表包括钢轨台帐、车站台帐、钢轨曲线关联表、线路设备维修表、道岔台帐、轨枕台帐以及钢轨通过总重表等根据起终点里程或者中心里程去维护的台账表。将带有里程的台帐表按照刻度和里程区间对应的关系进行关联,以通过总重表为例,得到每个粒度点所对应的通过总重信息。完整的数据模型见图2示例。
[0048]对各个工务段新增或者更改的数据做更新处理。各个工务段台帐数据汇入到大数据平台,按照各个台帐所标注的起终点里程信息,分解为1米为单位的粒度表,按照分解后的刻度值(里程数/m)进行对应关联到1米精度表,从而保证模型的时效性。[0049]在搭建完成数据仓库后,利用数据仓库的大数据优势进行分析预警模型的建立。[0050]在本发明实施例中,利用时间序列对钢轨状态建立分析预警模型。由于线路中各点关于钢轨状态的数据是随时间变化的,可能受季节变化、温度变化以及运载旺季淡季等变化而表现出周期性变化,比如梅雨季节、洪涝灾害期导致线路出现路基翻浆冒泥、道床下沉;夏季和冬季温度差别大,线路弹性、强度不同;春运铁路的运载量会有所增加等。因此在本发明实施例中采用时间序列进行分析预警模型的建立。
[0051]将某一监测点上某一钢轨状态相关参数进行以日为单位的统计,采用{Yt}代表某一钢轨状态相关参数的每日数据序列,对原始序列进行ADF检验,获取其概率值,判断其是否大于0.05,当大于0.05时,说明原始序列不平稳,为非平稳序列。在本发明实施例中,由于概率值大于0.05,因此选取SARIMA模型作为预测模型。[0052]由于SARIMA模型为研究时间序列的周期性特征,对ARIMA模型进行基于周期的季节差分,{Yt}为非平稳季节性时间序列,需进行D次季节差分,并建立周期为s的P阶自回归Q阶移动平均季节时间序列模型。
[0053]SARIMA模型的表现形式如下:
[0054][0055]
s为季节性序列的变化周期,L为滞后算子,
AP(Ls)分别表示非季节与季节
自回归多项式,θBQ(Ls)分别表示非季节与季节移动平均多项式,下标P、Q、p、q分别表q(L)、
示季节与非季节自回归、移动平均算子的最大滞后阶数, d、D分别表示非季节和季节性差分次数,因此可表示为SARIMA(p,d,q)(P,D,Q)s模型。[0056]在利用模型进行预测之前,对模型进行参数估计与检验,以保证精确度。[0057]根据模型获取钢轨状态相关参数的预测值,并通过与已有的标准阈值进行比较,预测线路基础设施状态,自动建立维护以及大修计划。[0058]在本发明实施例中,利用逻辑回归模型对钢轨伤损情况建立分析预警模型。逻辑回归模型为概率型非线性回归模型,是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。由于钢轨的伤损情况由多个因素影响,因此可通过逻辑回归模型判断钢轨某个位置点出现伤损的情况。
[0059]考虑具有n个独立变量的向量x=(x1,x2,...,xn),设条件概率P(y=1|x)=p 为根据观察值相对于钢轨发生伤损的概率,逻辑回归可表示为:
7
CN 110503209 A[0060]
说 明 书
5/6页
g(x)=w0+wlx1+…+wnxn
[0062]当P(y=1|x)>0.5时,则该位置点钢轨伤损情况为重伤,否则伤损情况则为轻伤。关于钢轨伤损的变量包括伤损频率、距离已有伤损的最近距离、磨耗情况、TQI值、通过总重、曲线半径、温度、钢轨基本属性。通过从历史数据中得到带有伤损情况标记的样本,用这些样本来训练逻辑回归模型,并对伤损情况进行预测,对于重伤的钢轨位置进行重点监控,并根据钢轨伤损变量最新数据值决定是否维修或换轨。
[0063]通过时间序列模型以及逻辑回归模型对钢轨进行分析预警,分别根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。[0064]本发明实施例通过对现有工务段数据进行抽取,形成一米精度表,并关联钢轨相关台账表,形成完整的数据模型,完成数据仓库的搭建,并依赖于数据仓库的大数据优势对数据仓库中的数据利用时间序列以及逻辑回归分别进行分析预警模型的建立,通过分析预警模型获得未来一段时间内的钢轨状态相关参数的预测值,以及钢轨伤损情况,并将预测值与设定阈值进行比较,得到是否进行维护的决策指导信息,实现对钢轨安全的自动化分析预警。根据本发明所提供的分析预警信息预测基础设施状态变化趋势,可有效提高分析预警精确度,缩短预测周期,减少工作量,对重点监控位置或区域的设备运行与维护状态进行研判,建立自动化维护以及大修计划,实现设备维护智能化,切实保证铁路运行的安全性和可靠性。
[0065]如图3所示,本发明还公开了一种基于大数据的钢轨分析预警模型构建系统,所述系统包括:
[0066]数据仓库搭建模块,用于根据工务段线路数据建立一米精度表,并关联钢轨相关台账表,完成数据仓库的搭建;[0067]钢轨状态预测模块,用于根据过去一段时间内的钢轨状态相关参数的统计数据,利用时间序列分别对各参数建立分析预警模型,获取未来时间内各个参数的预测值,并将各个参数预测值与设定的阈值进行比较,获取比较结果;[0068]伤损预测模块,用于统计各个刻度点上的钢轨伤损变量历史数据,通过逻辑回归模型对样本进行训练,预测钢轨伤损情况;[0069]维护分析模块,用于根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。
[0070]从各个工务段获取各条线路标准的起终点路程,根据线路起终点路程设计出新的关于线名、行别、工务段等线路基本属性和里程的一米刻度表,完成数据仓库的搭建。所述一米精度表以一米为间隔,有效提高钢轨数据精度。[0071]利用生成的1米刻度表关联钢轨相关的台帐表。所述台账表包括钢轨台帐、车站台帐、钢轨曲线关联表、线路设备维修表、道岔台帐、轨枕台帐以及钢轨通过总重表等根据起终点里程或者中心里程去维护的台账表。将带有里程的台帐表按照刻度和里程区间对应的关系进行关联,以通过总重表为例,得到每个粒度点所对应的通过总重信息。[0072]对各个工务段新增或者更改的数据做更新处理。各个工务段台帐数据汇入到大数据平台,按照各个台帐所标注的起终点里程信息,分解为1米为单位的粒度表,按照分解后
[0061]
8
CN 110503209 A
说 明 书
6/6页
的刻度值(里程数/m)进行对应关联到1米精度表,从而保证模型的时效性。
[0073]通过钢轨状态预测模块以及伤损预测模块在搭建完成数据仓库后利用数据仓库的大数据优势进行分析预警模型的建立。
[0074]由于线路中各点关于钢轨状态的数据是随时间变化的,可能受季节变化、温度变化以及运载旺季淡季等变化而表现出周期性变化,比如梅雨季节、洪涝灾害期导致线路出现路基翻浆冒泥、道床下沉;夏季和冬季温度差别大,线路弹性、强度不同;春运铁路的运载量会有所增加等。因此在本发明实施例中采用时间序列进行分析预警模型的建立。[0075]将某一监测点上某一钢轨状态相关参数进行以日为单位的统计,采用{Yt}代表某一钢轨状态相关参数的每日数据序列,对原始序列进行ADF检验,获取其概率值,判断其是否大于0.05,当大于0.05时,说明原始序列不平稳,为非平稳序列。在本发明实施例中,由于概率值大于0.05,因此选取SARIMA模型作为预测模型。[0076]由于SARIMA模型为研究时间序列的周期性特征,对ARIMA模型进行基于周期的季节差分,{Yt}为非平稳季节性时间序列,需进行D次季节差分,并建立周期为s的P阶自回归Q阶移动平均季节时间序列模型。
[0077]SARIMA模型的表现形式如下:
[0078][0079]
s为季节性序列的变化周期,L为滞后算子,
AP(Ls)分别表示非季节与季节
自回归多项式,θBQ(Ls)分别表示非季节与季节移动平均多项式,下标P、Q、p、q分别表q(L)、
示季节与非季节自回归、移动平均算子的最大滞后阶数,d、D分别表示非季节和季节性差分次数,因此可表示为SARIMA(p,d,q)(P,D,Q)s模型。[0080]在利用模型进行预测之前,对模型进行参数估计与检验,以保证精确度。根据模型获取钢轨状态相关参数的预测值,并通过与已有的标准阈值进行比较,预测线路基础设施状态,自动建立维护以及大修计划。
[0081]由于钢轨的伤损情况由多个因素影响,因此可通过逻辑回归模型判断钢轨某个位置点出现伤损的情况。考虑具有n个独立变量的向量x=(x1,x2,...,xn),设条件概率P(y=1|x)=p为根据观察值相对于钢轨发生伤损的概率,逻辑回归可表示为:
[0082]
g(x)=w0+wlx1+…+wnxn[0084]当P(y=1|x)>0.5时,则该位置点钢轨伤损情况为重伤,否则伤损情况则为轻伤。关于钢轨伤损的变量包括伤损频率、距离已有伤损的最近距离、磨耗情况、TQI值、通过总重、曲线半径、温度、钢轨基本属性。通过从历史数据中得到带有伤损情况标记的样本,用这些样本来训练逻辑回归模型,并对伤损情况进行预测,对于重伤的钢轨位置进行重点监控,并根据钢轨伤损变量最新数据值决定是否维修或换轨。
[0085]通过维护分析模块根据钢轨状态比较结果以及钢轨伤损情况判断需进行数据监控的钢轨重伤位置点,并决定是否进行维护。
[0086]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
[0083]
9
CN 110503209 A
说 明 书 附 图
1/2页
图1
图2
10
CN 110503209 A
说 明 书 附 图
2/2页
图3
11
因篇幅问题不能全部显示,请点此查看更多更全内容