阅读笔记

原文:Pre-Seismic Anomaly Detection from Multichannel Infrared Images of FY-4A Satellite

1.简介

本文提出了一种结合LSTM(long short-term memory)DBSCAN(density-based spatial clustering of applications with noise)模型的新算法,用于从风云四号卫星的多通道数据中提取震前异常。

地球系统复杂,红外辐射受多种因素影响。地震引起的红外辐射变化很难直接观察到。异常检测前需要消除背景场和高频噪声。许多信号处理方法也被用于检测这种震前异常,例如鲁棒卫星技术(RST)、小波变换、功率谱和其他经典信号处理方法。用于地震预测的红外数据大部分为长波红外图像,少数为中波红外图像。

image.png

2.资料与方法

2.1.数据与研究区域

风云四号卫星是中国最新一代的静止轨道气象卫星。风云四号卫星中的第一颗(FY-4A)于2016年12月发射,自2018年以来一直提供数据。FY-4A卫星有两个主要的光学探测器。一个是先进的地球静止辐射成像仪(AGRI),另一个是地球静止干涉红外探测器(GIIRS)。FY-4A的AGRI可以从14个通道获取图像,包括可见光和红外光。这些通道的波长如下图所示。

image.png

本文利用风云四号A卫星2019-2021年的数据,对震前多道红外异常进行了分析。前两年(2019-2020)的数据用于训练模型,最后一年(2021)的数据用于检测异常。地表辐射主要为中波红外线和长波红外线,为避免日照影响,仅采用7~14通道的夜间数据。

本文研究区域为下图红框内区域(90°E至110°E,17°N至42°N),发生5级以上地震20次,其中16次主震。

image.png

2.2.异常检测

2.2.1.Long Short-Term Memory (LSTM)

本文使用空间分辨率为4km的数据。对原始数据以5个像素为间隔进行下采样,以提高数据处理效率。亮温是通过查表得到的,每天的平均值是用夜间(UTC+8时间23:00-04:00)的亮温计算的。预处理后的数据为四维数据(二维地理坐标、时间、通道)。

image.png

image.png

image.png

2.2.2.Density-Based Spatial Clustering of Application with Noise (DBSCAN)

image.png

image.png

2.3.统计方法

image.png

image.png

image.png

概率增益G是指,相对于某一个大家都认可的、原理清晰但简单的预测方法(也称为“参考模型”),我们使用的预测方法相对于参考模型,所能提供的预测信息的有效性。概率增益G是从信息论中引入的概念,它的数值,可为具体的减灾决策提供重要的参考信息。例如,意大利地震学家利用一种叫做“传染型余震序列”(ETAS)的模型,对2009年意大利拉奎拉Mw6.3地震发生前1天的预测结果的概率增益G,相对于简单的用于长期预测的Poisson模型(这是个倒霉的模型经常被用来比较的模型)可达到5-25倍,也就是说,ETAS模型所作出的短期预测结果比这个地区平时的地震危险性高出了5~25倍。(来源:https://baijiahao.baidu.com/s?id=1567457803716189&wfr=spider&for=pc)

3.结果

3.1.LSTM模型的偏差

预处理数据和预测数据都是四维数据。 99.13°E、29.68°N的数据如图3所示,预处理后的数据复杂且变化无规律。由于吸收了大气中的水汽,第 9、10 和 14 通道的亮度温度低于其他通道。偏差数据揭示了观测数据和预测数据之间的差异。如图 4 所示,它在零附近波动。蓝线是训练数据集的偏差,橙色线是测试数据集的偏差。以随机选择日期(2021 年 1 月 30 日)的图像为例,将原始数据与偏差图像进行比较。 2021年1月30日的亮温图像如图5所示,偏差图像如图6所示,其中数字表示地形单位千米。亮温的地理空间分布与纬度和地形有关。高纬度和高海拔地区气温较低。水汽吸收带附近的时空差异相对不明显。偏差图像显示纬度的独立性。这表明LSTM模型可以消除红外亮温背景场,尤其是纬度引起的差异。

image.png

image.png

image.png

image.png

LSTM模型的训练和测试分数如表三所示。分数越小,意味着预测偏差越小,表明模型的性能越好。水蒸气吸收带周围通道(通道 9、10 和 14)中的 RMSE 较低。在其他通道中,长波红外通道(通道 11、12 和 13)的 RMSE 略高于中波红外通道(通道 7 和 8)。偏差值的频率分布如图 7 所示。大多数偏差都在零附近。

image.png

image.png

3.2.聚类结果

image.png

对于相同的半径,最小整数越大,异常率越大。较大的半径会增加计算量。综合考虑算法效率和异常率,本研究选取半径为2,最小整数为100。

image.png

image.png

image.png

图 9 和图 10 分别显示了杨壁和玛多地震的异常信息。散点的大小表示异常区域 (S),而颜色表示异常持续时间。坐标表示异常与地震之间的时空间隔。红色虚线为根据所谓的Dobrovolsky面积计算的孕震区半径,定义为式(24)

image.png

其中 M 是地震的震级。大面积和长持续时间的异常位于孕震带内(图9和图10中红色虚线下方的区域)。

image.png

从上面的结果可以看出,绝大部分的异常结果都在孕震区域内,并且持续时间较长。

3.3.统计结果

对于给定的 14 天预测时间窗口 (Wo),表 6 显示了不同预测半径 (Ro) 的相关率、命中率和概率增益。持续时间超过5天且覆盖面积超过1000像素的异常样本用于确定预测范围。研究区异常样本14个,5级以上地震20个,其中主震16个,前震1个,余震3个。前震和余震的震级均不超过5.6级。前震和余震被排除在外,因为它们占据与主震相似的时空区域。最高概率增益为 1.9137,这是根据预测半径 600 公里计算得出的。这意味着多道红外数据可以降低地震预测的不确定性。

同时,相关度为64.29%,命中率为68.75%。这意味着大多数异常样本与与地震有关。Molchan 图如图 11 所示。横轴是预测范围的时空占比,纵轴是未命中率(1-HR)。图 12 中穿过星形的线的斜率为负,等于概率增益的负值。当预测半径为 600 公里时,未命中率最低,概率增益最高。

image.png

image.png

有些靠近震中的区域,异常的持续时间反而减少了。原因可能由风场等气候变化导致的,作者并未给出解释。

4.讨论

最大概率增益为1.91,与总电子含量(TEC)异常的应用结果相似。概率增益受所用数据、算法和研究区域的影响。概率增益大于 1 意味着预测方法优于随机猜测。

2021年5月18日在两个震中附近观测到TEC异常,红外异常持续时间为2021年5月17日至2021年5月18日,如图14所示。在此期间,2021年5月18日两类异常位置最接近,说明震前红外异常与TEC异常之间存在一定的时空相关性。

image.png

虽然64.29%的相关率和68.75%的命中率高于TEC异常,但概率增益并没有提高。可能是预测范围的时空占用过高,因为本文异常覆盖区域较大,预测区域半径为600 km,预测时间窗为14天。很难确定地震的确切位置。

5.结论

提出了一种结合 LSTM 和 DBSCAN 模型的新算法,用于从风云四号卫星的多通道数据中提取震前异常。 1.91的概率增益表明该方法优于随机猜测,可以降低地震预测的不确定性。相关率为64.29%,命中率为68.75%。在这个地震案例分析中,红外和 TEC 异常表现出时空相关性。这表明该方法可用于在未来的研究中从多源数据中提取震前异常,以提高预测精度。