社会因素数值预测与风险预警:ARIMA模型在黑龙江、浙江、新疆的应用与展望

期刊: 环球科学 DOI: PDF下载

刘洪瑜 高知远 张子硕

电气工程学院 新疆大学 乌鲁木齐市 830017

摘要

在文中描述了利用数据搜集、统计分析以及ARIMA模型进行社会因素数值预测和预警的过程。首先,通过国家数据网的统计分析,在黑龙江、浙江、新疆这三个省市内针对失业率、最低生活保障人数、拟合人均可支配收入、每十万人口中的高等教育人数等因素展开分析和比较。其次,通过ARIMA模型(自回归和移动平均模型的组合)对历史数据进行分析,预测未来数值,并基于一定阈值判断风险区间,为犯罪率提供预警。最后,提供了对失业率、最低生活保障人数、拟合人均可支配收入、高等教育人数的多年预测数据,并根据模型结果为未来犯罪率高风险提供预警与建议。ARIMA模型的运用有助于实现数值预测和社会风险的预警,为相关决策提供数据支持。


关键词

数据科学、ARIMA模型、预测与风险预警

正文


1. 引言

在当今社会,随着数据科学和预测分析的飞速发展,人们对于如何利用数据来揭示和解决社会问题的兴趣与需求日益增长。社会因素的数值预测与风险预警成为了许多研究者关注的焦点,其应用不仅有助于更好地了解社会的运行规律,还能帮助政府和企业做出全面、精准的决策。在这个背景下,时间序列分析中的ARIMA模型以其简洁而有效的特性成为了研究的热门选择之一。

本文将聚焦于对中国不同地区——黑龙江、浙江、新疆的社会因素进行数值预测与风险预警,探讨ARIMA模型在这一领域的应用与展望。通过深入分析各地区的数据特征与趋势变化,我们将探讨ARIMA模型如何帮助我们理解和预测不同社会因素的发展走势,为制定有效的政策和风险管理提供数据支持。这一研究有望为社会科学与数据科学的融合提供新的思路与方法,促进社会发展与治理的智能化与可持续化。

2. 基于ARIMA模型预测

该模型属于时间序列分析模型中的一种,是由AR(自回归)模型和MA(移动平移)模型合并而成。AR模型可以捕捉具有历史趋势的数据的变化趋势;MA模型可以处理突发变化或噪声较大的时间序列数据;ARIMA模型则是结合了二者的优势,可以处理复杂的时序问题。对于该题目的要求,需要分析历年自然灾害造成的损失,ARIMA模型可以完成这一要求。ARIMA模型可以完成这一要求。ARIMA模型包括p个自回归,q个移动平均项以及差分的阶数d,该模型可以表示为

 

              1

其中:p,q表示模型的自回归阶数和移动平均阶数,是不为零的待定系数,为独立的误差项Yt为时间

在拟合ARMA模型后,我们得到了预测未来值的模型。

步骤:第一步:将上述四个区化为低犯罪风险区,正常地区,高风险犯罪。第一个区间和第二个区间样本数较少,于是我们将第一第二个区间合并为低犯罪风险区。将第三个区间归为正常地区,第四个归为高风险地区。

第二步:ARIMA模型分别预测四个参数32年的历史数值得到三个省未来几年的四个参数(失业率,最低生活保障人数,拟合人均可支配收入,每十万人口平均高等教育人数)

第三步:代入建立的决策树中预估处于哪个区间

效果检验

选择一个合适的ARIMA模型,来预测未来几年的失业率。对于三省数值我们采用了ARIMA(1,d,1)模型进行计算,把上图数据代入,利用软件’vscode’通过该模型可以预测三省未来的失业率

预测结果如下1:

 1 三省失业率预测(%)

年份\省份

黑龙江省

新疆维吾尔自治区

浙江省

2021

3.577014

2.312440

2.918318

2022

3.700134

2.033299

3.099177

2023

3.649726

1.833351

3.023000

2024

3.473284

1.669585

2.980020

2025

3.313277

1.524199

2.994744

2026

3.292451

1.389738

3.004806

2027

3.420014

1.262998

3.002039

观察此图我们发现ACF和PACF值均接近于0,说明模型预测效果良好。与此同时运用该模型,我们预测了三省其他参数的未来数值不难发现,新疆维吾尔自治区2021年和2024年犯罪率较高;浙江省2027年犯罪率较高[10],由此我们需要对其进行预警,并采取一定措施。对于数据库的多维度建立,我们基于大数据和人工智能技术,采用卷积神经网络进行筛查。我们将数据分为经济、教育和保障三个主要板块,并在此基础上建立原始数据库。条件分类假设包括经济、教育和保障对犯罪率的重要性。经济状况、失业率、和贫困可能导致犯罪率上升,教育水平和社会保障与犯罪率呈负相关。我们选择高中为分界线划分高等教育和非高等教育。在数据处理和统计方面,我们采用了数据归一化方法将数据压缩到0到1之间,并进行正态标准化,使数据处于标准正态分布状态。通过计算各地区的犯罪率方差,我们发现了犯罪率波动最大的省份。区域划分基于得到的数据,将其划分为四个区间等级,以0.25为增长率,表示相关性强弱不同。结合数据得出的犯罪率散点图,我们发现某些区间样本数量较少,因此采用SMOTE模型处理数据,增加少数类样本以实现样本类别均衡。

3. 结论

本研究以黑龙江、浙江、新疆为研究对象,通过数据搜集、统计分析和ARIMA模型展示了对失业率、最低生活保障人数、拟合人均可支配收入、高等教育人数等社会因素进行预测和风险预警的方法。通过ARIMA模型,预测分析了未来数值并对高风险预警提出建议。模型预测表明浙江省失业率维持低位,新疆2021和2024年失业率较高,黑龙江呈稳定下降趋势。此外,新疆和浙江高等教育人数持续增长,而黑龙江波动不定。模型表现良好,预警结果显示未来犯罪率可能在某些年份出现异常,需要警惕并采取相应措施。未来应加强基于ARIMA模型的数据预测与风险管理,为社会治理提供可靠决策支持。

参考文献

[1]谭芷滢.受教育水平与刑事犯罪率关系的实证研究[J].法制博览,2023,(26):12-16.

[2]郭冬梅,李昕,刘春晓,.房价、财富不平等与城市犯罪率——基于中国地级市面板数据的实证分析[J].中央财经大学学报,2021,(09):113-128.

[3]李丽,靳煜昕,鹿姜恒昆,刘梅香.南非高犯罪率的原因浅析[J].中国投资(中英文),2023,(ZB):80-82.

刘洪瑜  2003年7月 重庆市南岸区 本科生 电气工程及其自动化 新疆大学 830017

 


...


阅读全文