咨询案例

基于遥感数据和深度学习的经济统计指标监测案例

时间:2022-12-29

基于遥感数据和深度学习的经济统计指标监测案例

1. 研究背景

对于很多发展中国家来说,衡量国内经济发展水平是十分重要的。经济发展水平地细粒度、大规模的衡量与评估,对资源的配置和政策采纳至关重要。国内生产总值(GDP)是衡量区域生产力和消费水平的一个典型而又关键的指标。在国家范围生成高精度 GDP 地区图谱既能反映一个国家的总体发展水平,也能从侧面衡量国家内部的区域发展不平衡情况。在中国各地区,基于传统普查衍生方法的县级 GDP 收集工作,即中国最小行政单位的 GDP 值,是由地方政府统计服务机构自发进行的。然而,这种传统的普查方法仍存在许多弊端:

(1)时效性低。传统普查方法中数据不全面、不同区域间数据不可比且县一级统计机构缺乏专门人员,统计工作常常存在数据处理流程繁琐、数据更新慢问题,时效性很低。

(2)精度低。由于地区差异和测量技术的限制,普查的基本单位往往是省级的,难以进一步对县、乡镇等细化单位的具体情况进行详细的调查,精度较低。

(3)成本高。普查中的各社会经济指标主要靠人力统计,开展难度大,需要大量的人力、物力、财力,成本极高。

近年来,随着卫星科技的普及,利用遥感图像数据源来预测社会经济指标的思路受到广泛关注,一系列已开展的研究正在探索如何结合卫星遥感影像和新兴的统计学习方法来开展一种便捷、可拓展的方法,来对多样的经济指数进行评估。这种创新的评估方法可以有效地解决传统普查方法具有的一系列问题:时效性高,每月可更新预测数据;精度高,衡量单位可细化到县级、乡镇级;成本低,无需大量的人力、物力,仅利用遥感图像数据就可以高效、全面地衡量国家各地区的发展水平。

2. 研究目标

事实上,此前已有研究揭示了地区生产总值与地区夜间光照强度的高相关性,并且成功地运用统计回归方法与夜间灯光数据在全世界多个不同国家拟合社会经济指标并绘制地区图谱,但在实践过程中仍存在分辨率粗糙、 噪声大、难以提取特征等问题。本研究旨在对已有的研究进行改进和完善,寻求一种兼具开创性、便捷性和鲁棒性,并具有较强的实践意义的方法——结合夜间灯光数据和白天卫星遥感影像,基于遥感影像与注意力卷积神经网络,来预测中国地区县级区划单位的年度GDP值。

本研究首次将基于 CNN 的卫星图像区域经济指标估算方法应用在全中国地区,如此大规模、跨度广泛的全国范围的应用还是首创。此研究可用于下列各领域:而从更广泛的应用角度来讲,基于卫星图像做经济指标评估,能在很多政策制定、经济监测、金融投资、环境防治等领域起到关键作用,如以下几个应用举例:

(1)人口动态检测。本研究成果可以高效、低成本、全面地了解整个国家的人口数据,并能即时地更新对国家人口密度流动等方面的检测,进而为政府或产业做科学决策上的参考。

(2)资源分配。本研究成果有利于政府对不同地区进行更有效、合理的资源分配,尤其是对于一些较偏远、贫困的地区,经济指标数据不易获取,而结合卫星图像进行预测,更易于衡量各地区之间的贫富差异,进而有利于政府实施一系列帮扶政策,提高国民的幸福指数。

(3)金融投资。本研究可以用卫星图像来分析和预测新兴市场的潜力区域,从而扩大投资的市场目标。同时,卫星数据的丰富度结合企业公开数据、移动数据、传感数据等,也能将数据评估更为精准化。

(4)宏观经济分析。通过卫星遥感图像可以高效、全面地对地区各基础设施、产业建设进行动态监测。通过对路网、区域变化等方面的长期监测,能更好量化分析不同区域的经济发展;通过对原油油罐、农作物或牧场进行监测,能侧面对大宗商品期货提供分析决策;对光伏、风电等产业监测可为国家新能源产业发展提供参考;在农业保险领域,基于卫星图像分析能对气象灾害防治、受损定损等方面提供精准评估;此外,基于卫星图像还可以对景区客流量、车流量、机场停机量、港口船舶等进行量化基本面的数据分析。

3. 研究思路

本研究启发性地将夜间灯光数据与白天卫星遥感影像结合使用。在研究中,夜间灯光强度被当做区域经济发展水平的代理变量以及 CNN 网络的监督信号。由于夜间灯光强度的地区广泛性,利用灯光强度可以便捷地构建白天遥感影像的监督标签,这就让 CNN提取有意义的特征变得可行。随后,从 CNN 提取的特征结合简捷的统计计算模型这一解决方案为评估经济指标提供了新的路径。沿用这个思路,细粒度 GDP 区域图谱的评估也能及其高效并精准地开展。研究技术路线图如图1所示,基于该方法所获取的经济指标预测结果可视化如图2所示。

图片.png

图1 模型方法技术路线图


                                                                                                                       图片.png

2 基于该方法的经济指标预测可视化结果

4. 研究内容与结论

本研究将夜间灯光强度作为经济活动的代理变量,并为白天卫星遥感影像提供灯光强度等级的分类标签的同时训练基于注意力机制的 VGG-16卷积神经网络架构作为特征提取器。基于统计量计算的各个县域维度相同的特征向量被输入至回归模型中并对中国地区2000 多个县域的 GDP 取值进行拟合与预测。研究的主要结论如下:

(1)本研究利用 2017 年的数据进行训练并在 2018 年县域 GDP 值的预测上取得了 0.7 的 /span>2 得分。

(2)本研究的方法在定量和定性上都是可以解释的。一方面,利用 2017 年数据训练的模型在预测 2018 年县级 GDP 值表现出了较好的水平。另一方面,梯度可视化表明,基于CNN 的分类器能够分辨出与经济发展程度密切相关的视觉模式(如道路、建筑等)。

(3)本研究模型方法可以拓展到任意地区的经济活动探测中。得益于统计量计算方法的便利性,任意区域的图像集都能用来提取特征并为当地发展提供建设性的意见。


北京市海淀区中关村大街59号 电话:(86)10-62511318 传真:(86)10-62515246 邮编:100872

版权所有 © 中国人民大学统计学院