编者按:
本周为大家推荐《地质力学学报》2024年4期的封面文章《基于EEMD-CNN-LSTM的新型综合模型在滑坡位移预测中的应用》。
作者:刘航源, 陈伟涛, 李远耀, 徐战亚, 李显巨
摘要:滑坡位移预测是滑坡稳定性评价的重要环节。尽管基于深度学习范式的时间序列方法预测滑坡位移取得了一定的成果,但由于滑坡位移数据的非平稳性、周期性和趋势性变化特征,导致当前时间序列模型的滑坡位移的多变量预测容易过拟合。为解决这一问题,针对滑坡位移数据的波动性和由周期项与趋势项位移叠加组成的特性,提出一种基于孤立森林(Isolation Forest,IF)异常检测、集成经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)、卷积神经网络(Convolutional Neural Networks,CNN)和长短期记忆神经网络(Long Short-Term Memory,LSTM) 相结合的滑坡位移预测模型。选择三峡库区以降雨为影响因子的阶跃型白家包滑坡为研究对象,引入IF算法对滑坡原始位移数据进行异常检测,使用EEMD方法提取滑坡趋势项和周期项位移,通过CNN捕捉局部周期项和趋势模式,并基于LSTM模型预测总体位移。结果表明,EEMD-CNN-LSTM在预测降雨情况时滑坡总体位移的均方根误差(RMSE)、平均绝对误差(MAE)、评价绝对百分比误差(MAPE)和决定系数(R2)4种指标分别为0.4190、0.3139、0.2379和0.9997,前3种精度评价指标较现有模型分别提升32.3%、25.1%、7.3%。相较于传统的LSTM模型、随机森林方法和EEMD-LSTM方法,EEMD-CNN-LSTM模型在有、无降雨这一外部影响因素下具有显著优势,能够较大地降低过拟合,提高预测的准确性。
关键词:坡位移预测;时间序列模型;卷积神经网络;集合经验模态分解;深度学习
图件及说明
图 1 CNN在EEMD-CNN-LSTM模型中的总体流程
通过CNN对周期项和趋势项的数据进行特征提取,输入周期项和趋势项数据,经过卷积层和池化层操作,提取出其关键特征。最后将周期项和趋势项的特征分别进行组合,采用拼接的方式,将其合并为对应周期项和趋势项的特征表示。上述过程如图1所示。
图 2 LSTM网络结构
文章引入了注意力机制,利用(t-1)时刻的预测值来动态分配适当的注意力权重,以生成与当前时刻(t时刻)的预测值相关的特征序列。这个注意力机制的引入增强了模型的能力,更好地捕捉时间序列中的相关信息。然后通过经过注意力机制分配权重后的特征向量,将其进一步输入到LSTM层以进行解码,最终经过一层全连接层获得预测值(图1)。作为解码器,LSTM能够更有效地利用时间序列数据,以捕捉时间序列中的长期依赖关系。网络结构如图2所示。
图 3 基于EEMD-CNN-LSTM模型的滑坡位移预测流程图
EEMD-CNN-LSTM滑坡位移模型的具体流程如图3所示。首先从描述滑坡位移变化趋势的影响因子中进行筛选,生成滑坡位移时间序列数据集。然后将滑坡位移时间序列数据输入到孤立森林异常检测算法中,以识别和剔除异常情况。
图 4 白家包滑坡及布设点位示意图
图 5 白家包滑坡剖面图(剖面具体位置见图4)
滑坡的左侧与山脊下部的基岩相接,右侧以山梁为分界,前缘宽度为500 m,后缘宽度为300 m,整体宽度大约为400 m,纵向长度约为550 m,滑坡的总面积为2.2×105 m^2(彭令和牛瑞卿,2011)。该滑坡呈短舌状平面形状,如图4所示。滑坡的底部由基岩构成,基岩主要由长石石英砂岩和泥岩组成,其倾向为285°,倾角为30°,属于逆向坡结构。滑坡的剖面如图5所示。
图 6 数据预处理
对白家包滑坡ZD1监测点获得的滑坡位移数据进行异常检测与数据归一化前后得到的数据如图6所示。根据异常检测结果,文章剔除了3个异常值点(图6a),将剔除后的数据归一化处理(图6b)。
图 7 EMD与EEMD模型的分解结果对比
利用EMD和EEMD这2种模型对滑坡累积位移数据进行分解后的结果如图7所示。EMD方法分解后的模态混淆问题比较严重,各个本征模态函数IMF包含有差异较大的特征时间尺度。相比之下,EEMD方法更好地处理了这些问题,实现了更优化的分解效果。
图 8 EEMD-CNN-LSTM模型对滑坡位移趋势项的预测结果
利用EEMD-CNN-LSTM模型对白家包滑坡累积位移数据在有降雨和无降雨情况下的趋势项预测结果及绝对误差如图8所示。无降雨数据的绝对误差和精度评价指标普遍优于有降雨数据,进一步验证了降雨数据对滑坡位移趋势项预测精度有一定的影响。
图 9 EEMD-CNN-LSTM模型对滑坡位移周期项的预测结果
利用EEMD-CNN-LSTM模型对滑坡累积位移数据在有降雨和无降雨情况下的周期项预测结果及绝对误差如图9所示,由于测试集选取时间较短,周期项没有大幅波动,总体呈上升趋势。降雨数据对滑坡位移周期项的预测上会产生一定的负相关影响,但并不显著。
图 10 EEMD-CNN-LSTM模型与EEMD-LSTM模型对滑坡位移趋势项预测结果对比
图 11 EEMD-CNN-LSTM模型与EEMD-LSTM模型对滑坡位移周期项预测结果对比
利用EEMD-CNN-LSTM模型和EEMD-LSTM模型在滑坡位移趋势项和周期项预测的对比如图10、图11所示,可以明显看出加入CNN进行特征提取后,EEMD-CNN-LSTM模型在滑坡位移分解后的两项较EEMD-LSTM模型均有明显的精度提升,证明了该方法的优越性。
图 12 EEMD-CNN-LSTM模型对白家包滑坡位移预测结果
将滑坡位移趋势项与周期项相加得到累积位移预测结果。由图12可以看出,EEMD-CNN-LSTM模型取得了较好的预测结果。没有降雨数据时,4项评价指标分别为:RMSE=0.4190 mm,MAE=0.3139 mm,MAPE=0.2379%,R2=0.9997。
图 13 EEMD-CNN-LSTM模型、EEMD-LSTM模型和LSTM模型以及随机森林模型对滑坡位移预测结果与真实值的对比(ZD1监测点)
图 14 EEMD-CNN-LSTM模型、EEMD-LSTM模型、LSTM模型和随机森林模型对滑坡位移预测结果与真实值的对比(ZD2监测点)
为验证EEMD-CNN-LSTM模型对滑坡位移预测的性能,以白家包滑坡另一监测点ZD2获得的数据作为辅助验证集。在以往的滑坡位移预测中,很多经典的机器学习和深度学习模型取得了不错的效果,如EEMD-LSTM模型、长短期记忆神经网络LSTM模型以及随机森林模型(Krkac et al.,2017;Li et al.,2018;Xu and Niu,2018;Biniyaz et al.,2022;孙德亮等,2023),因此文章使用这3种方法与EEMD-CNN-LSTM模型的预测结果进行对比,并且考虑有、无降雨2种情况。根据ZD1、ZD2监测点数据利用不同学习模型获得滑坡位移预测值与实际值对比如图13、图14。
文章结论
(1)文章针对降雨型滑坡位移预测中的数据波动性异常和过拟合等问题,引入了孤立森林(IF)算法,并将其与EEMD-CNN-LSTM模型集成,构建了一种适用于滑坡位移预测的综合模型。通过时间序列数据的重构和多层变分自编码器模型的引入,该模型能够有效利用滑坡位移数据的特征,显著提高预测的准确性和稳定性。
(2)EEMD-CNN-LSTM模型的预测表现优于传统的随机森林模型、LSTM模型以及EEMD-LSTM模型。根据白家包滑坡监测点ZD1数据,在没有降雨时该模型的预测评价指标表现为RMSE为0.4190 mm、MAE为0.3139 mm、MAPE为0.2379%、R2为0.9997;有降雨时该模型仍然保持高准确性,RMSE为0.4302 mm、MAE为0.2908 mm、MAPE为0.2431%、R2为0.9996。该模型在白家包滑坡ZD2监测点的滑坡位移预测中也取得较好效果,在与其他模型的对比中展现出卓越性能。
(3)相对于单一模型,EEMD-CNN-LSTM综合耦合模型在滑坡位移预测领域展现出更为出色的性能。但值得注意的是,在滑坡位移的阶跃阶段,模型的预测值略高于实际值,这为实际工程应用提供了一定的安全保障。未来的工作可以进一步优化模型的参数和算法,拓展适用于不同地形和气象条件的滑坡位移预测模型。同时,对于滑坡发生机理的深入研究以及实际工程应用的验证都是值得关注的方向。
文章首页
引用格式
刘航源,陈伟涛,李远耀,等,2024. 基于EEMD-CNN-LSTM的新型综合模型在滑坡位移预测中的应用[J]. 地质力学学报,30(4):633-646 doi:
10.12090/j.issn.1006-6616.2023145
LIU H Y,CHEN W T,LI Y Y,et al.,2024. Application of integrated model based on EEMD-CNN-LSTM for landslide-displacement prediction[J]. Journal of Geomechanics,30(4):633-646 doi: 10.12090/j.issn.1006-6616.2023145