基于太阳风大数据的AE指数预测研究
摘要
关键词
太阳风;速度;关联度;灰色
正文
中图分类号:TP311.13 文献标识码:A
基金项目:国家自然科学基金资助项目(617071121);四川省教厅教改项目(14-156-774)
1 研究背景
极光电集流指数简称AE指数,用以描述极光带电流活动,代表极光在东西向极光带上的电射流激发的磁场扰动总强度。太阳以太阳风的形式向行星际空间辐射和释放能量,太阳风的高速粒子进入地球磁层会地扰动球磁层,并导致大气分子或原子电离从而形成绚丽的极光。太阳风携带IFM(行星际磁场)转南向时会与地球磁层发生磁重联,导致AE指数剧烈波动,这时可以通过太阳风情况和IFM对AE指数进行预测研究。AE指数主要是对磁层亚暴和极光亚暴活动情况的反映,它是磁活动研究和空间环境预报研究中的极其重要的指标量,AE指数预测对空间大气研究意义重大。
1992年,Lundstedt[1]首先提出在对日地扰动过程的预报中加入神经网络方法并得以应用,接着Price[2]等人又开始用非线性的输入/输出系统替代磁层来研究AE指数的预报。如今在利用神经网络进行太阳活动的预测方面有了一定的进展,Weigel[3]等人和Hernandez[4]等人用这种方法预报AE指数能够提前15分钟。在研究平滑和非平滑AE指数方面,Takalo[5]等人通过神经网络方法能够提前12分钟预报。
上面这些预报结果都不是特别理想,本文以ACE卫星[6]观测的太阳风大数据为基础,应用灰色关联分析方法确定影响AE指数预测的关键因素,以1h精度的ACE卫星观测数据为基础,构建3个BP网络[7]进行AE指数的预测研究,以期达到更好的预测效果。
2 AE指数的关联性因素分析
AE指数反映的不是一个独立的物理现象,它与太阳风现象关系密切[8],受众多的因素影响,这些因素包括巴特尔斯数,太阳黑子数,f10.7指数,太阳风等离子温度,Kp指数,Ap指数,Dst指数,太阳风质子密度,太阳风流压力等等,这些因素相互作用,相互影响,导致了AE指数预测的复杂性。为更好实现更好的预测效果,本文先对影响因素进行分析,找出影响预测结果的关键因素,然后把这些关键因素作为训练参数进行预测。
2.1 关联分析模型
影响太AE指数的众多因素中,如行星际磁场、磁场BY分量、太阳风速度、f10.7指数、太阳黑子数、太阳风密度、Ap指数、Kp指数、Dst指数等等。这些因素中有部分已知,部分因素未知。因此可以用灰色关联分析方法实现AE指数关联因素的研究。灰色关联分析算法的数学模型描述如下:
Step1:建立抽样调查数据矩阵。抽样数据
,假设有M个对象,N个指标,构建矩阵如下:
(1)
参考序列
![]()
Step2:对抽样调查数据矩阵进行归一化处理。
(2)
Step3:求抽样调查数据矩阵的差序列△0i(k) ,并确定
和
的值。△i=
,
Step4:计算抽样调查数据矩阵关联系数。
(3)
其中,φ为分辨系数,用于提高关联系数间的差异性,φ∈(0,1),默认值0.5。
Step5:计算太阳风风关联因素灰色关联度:![]()
2.2 关联分析结论
关联分析的数据来自NASA网站公布的ACE卫星的60分钟观测数据,观测数据的时间为2023年1月1日至2023年12月31日。关联分析结果如下表1:
表1 AE指数影响因素关联度
r(i) | 名称 | 关联度 |
r(1) | Ap指数 | 0.9477 |
r(2) | Kp指数 | 0.9455 |
r(3) | 行星际磁场 | 0.9194 |
r(4) | 磁场BY分量 | 0.9032 |
r(5) | 太阳风速度 | 0.8972 |
r(6) | 太阳风密度 | 0.8948 |
r(7) | 太阳黑子数 | 0.8832 |
r(8) | f10.7指数 | 0.8820 |
r(9) | Dst指数 | 0.8771 |
有上面的分析可以看出,与AE指数关联最为密切的Ap指数、Kp指数、行星际磁场、行星际磁场By分量、太阳风速度、太阳风密度。因此把上面六个因素作为AE指数预测的训练参数。
3 BP神经网络构建
本研究应用ACE卫星观测数据,取60分钟平均值数据为基本数据,然后在60分钟整倍数的基础上构建60分钟,120分钟和180分钟的平均样本数据,形成3个输入三层网络模型,并进行测试,测试样本为500个。BP网络模型的计算过程如下。
Step1:前向计算。
输入层为:
第i个神经元输入为:
(4)
其中,
为神经元的连接权重。神经元传输函数(sigmoid函数)为:
(5)
第i个神经元输出为:
![]()
网络输出为:
![]()
人工神经网络输出与教师信号Y(t)之间的误差为:
Step1:反向计算输出单元为:
![]()
中间单元为:
(6)
代表学习率,新的网络权重
通过反向传播计算迭代更新,通过给误差设定相应的值,当计算结果符合这个设定值之后结束计算。
通过对线性相关系数R、均方根误差RMSE、平均相对误差ARV三个指标来对检验数据段做误差分析。
(7)
(8)
(9)
其中T为目标值,即 AE实测值,O为网络的输出值,即AE预报值 ,N代表测试样本的总数,N=500。
线性相关系数R的绝对值小于或等于1,即|R|≤1。当Rr>0时是正相关,当Rr<0时是负相关,R的绝对值越大表示关系越紧密,R为0是表示无关。R的绝对值小于0.4表示相关性低;R的绝对值大于0.7表示相关性高;R的绝对值介于0.4与0.7之间表示相关性较高。
均方根误差RMSE,是指预测误差的平方和除以次数N的平方根,也称为标准误差。RMSE越小表示预测的精度越高。
平均相对误差ARV是指相对误差的平均值,ARV的值越小表示误差越小,精度越高。为更好AE指数预测正确性,本研究构建3个测试模型。
模型1:输入60min Ap指数、Kp指数、行星际磁场、行星际磁场By分量,输出60分钟 AE指数;
模型2:输入120 min Ap指数、Kp指数、行星际磁场、行星际磁场By分量、太阳风速度,输出120分钟 AE指数;
模型3:输入180 min Ap指数、Kp指数、行星际磁场、行星际磁场By分量、太阳风速度、太阳风密度,输出180分钟 AE指数。
数据来自NASA网站公布的ACE卫星的60分钟观测数据,观测数据的时间为2023年1月1日至2023年12月31日。数据处理方法:用1月至4月的数据构建60分钟观测数据,然后1月至3月数据为训练数据,4月数据为测试数据;用5月至8月的数据构建120分钟观测数据,然后5月至7月数据为训练数据,8月数据为测试数据;用9月至12月的数据构建180分钟观测数据,然后9月至11月数据为训练数据,12月数据为测试数据。每个模型测试样本数据量选择为500个。
3 测试与结果分析
三个训练模型分别选用时续60min,时续120min和时续180min的样本为输入参量,样本,预报提前时间设定为60min,隐藏层节点设置分别为20,40和60。模型3的神经网络结构图如下图1:
图1 BP神经网络结构图
这三个样本训练完毕后的预报结果图如下(图2~图4)所示。训练算法(traimlm)为Levenberg- Marquardt。
图2 输入样本时续60min的预报结果

图3 输入样本时续120min的预报结果
图4 输入样本时续180min的预报结果
通过对以上三张图的比较发现AE指数的预测值在曲线的基本走向上和AE指数的观测值还是比较吻合的,模型1(时续60min),模型2(时续120min),模型3(时续180min)的的平均偏离值分别是25.2nT,19.3nT和17.6nT,这表明模型3的在准确性较高。三种模型的R、RMSE和ARV值如下表2:
表2 模型1/2/3的相关统计特性对比
时间(2023年) | 对比系数 | 模型1 | 模型2 | 模型3 |
测试数据 (1月数据) | R | 0.87 | 0.85 | 0.89 |
RMSE | 0.77 | 0.53 | 0.67 | |
ARV | 0.24 | 0.20 | 0.28 | |
测试数据 (5月数据) | R | 0.90 | 0.87 | 0.84 |
RMSE | 0.57 | 0.62 | 0.78 | |
ARV | 0.27 | 0.22 | 0.34 | |
测试数据 (9月数据) | R | 0.99 | 0.88 | 0.89 |
RMSE | 0.78 | 0.58 | 0.64 | |
ARV | 0.23 | 0.17 | 0.22 |
4 结论
本文为了更准确的预报AE指数值,构建三个三层BP神经网络,基于太阳风大数据把Ap指数、Kp指数、行星际磁场、行星际磁场By分量、太阳风速度、太阳风密度做为神经网络的预报参数。选择2023年1月1日至2023年12月31日,共12个月的ACE卫星观测数据为网络训练和测试数据。从训练和预测结果看基本达到预测要求,但是预测的准确性有进一步提高的空间。
为提高预测的准确性,可以从训练参数和网络结构两方面进行改进。训练参数选择各自相互对立,但都与AE指数联系紧密的参数,在本研究中还可以添加太阳黑子数,Dst指数作为训练参数来提高预测的准确性,同时可以构建超过240min的参数序列来实现4h的提前预报。在BP网络结构中可以增加网络的中间层和增加每层的神经元来提高预测的准确性。
另外,由于预测是基于太阳风大数据,这些数据在观测过程中受到客观条件的限制,存在一定的误差,这也间接的导致了AE指数预测中的误差。
参考文献:
[1] Lundestedt H. Neural network and prediction of solar-terrestrial effects. Plant Space Sci ,1992,40(4) 457~464
[2]Price C P ,Prichard D, Bischoff J E . Nonlinear input/output analysis of the auroral electro jet index .J. Geophys. Res., 1994,99(A7):13 227~12 228
[3] Hernandez J V, Tajima T, Horton W .Neural net forecasting for geomagnetic activity. Geophys. Res. Lett., 1993,20(23):2707~2710
[4] Weigel R S , Horton W ,Tajima T.F. Forecasting auroral electro jet activity from solar wind input with neural net words. Geophys.Res.Lett.,1997,26(10):1353~1356.
[5] Takalo J,Timonen J . Neural network prediction of AE data Geophys. Res. Lett., 1997, 24(19): 2403~2406.
[6] Coleman,W.A., Turbulences viscosity and dissipation in the solar wind plasma. Astrophys. J., 1968, 153,371.
[7] Farrugia, L.F. Burlaga, V.A. Osherovich, I.G. Richarson, M.P. Freeman, R.P. Lepping, A. Lazarus .A study of an expanding interplanetary magnetic cloud and its interaction with the Earth׳s magnetosphere .J. Geophys. Res.: Space Phys., 98 (A5) (1993), pp. 7621–7632.
[8] Feldman ,W.C .,Montgomery ,M.D., et al., Interplanetary heating conduction IMP-7 results, Solar Wind Three,1974,334.
...