第一作者:王卫国(1992-),男,山西忻府区人,在读硕士生,研究方向为生态遥感。E-mail: [email protected]
利用山西省2002-2012年MODIS卫星遥感数据,建立了描述火灾空间分布及其影响因子的空间Logistic风险模型,从省域空间尺度和较长时间尺度上,开展火险评价与火险区划研究。结果表明,通过空间采样构建的Logistic火灾风险模型拟合效果很好。在显著性水平为0.05的情况下,通过模型系数检验和Wald检验,相对运行特征值(ROC)为0.757。经图层运算得到火烧概率分布图,并将山西省分为无火险区、低火险区、中火险区、高火险区和极高火险区。对山西省火灾风险空间变化影响较为显著的因子为高程(GC)、土地利用类型(LT)、地表温度(LST)、归一化差值植被指数(NDVI)和全球植被湿度指数(GVMI),对火灾风险空间变化影响不显著的因子则仅有坡度(PD)和道路可达性(DL)。NDVI和LST对火灾影响在省内全局显著,而GC、LT和GVMI仅对省内部分地区的火灾影响显著。山西省按火灾影响因素可划分为7类区域,不同类型区域应确定不同的防火重点,制定差别化的防火策略。
MODIS data in 2002-2012 was used to build the spatial logistic fire risk model based on the spatial distribution of fire and fire influencing factor by using geographic information system technology in Shanxi Province. Fire risk zoning study was conducted in a long temporal scale and provincial spatial scale. Logistic model of fire risk was built by spatial samples in fires region, and the simulated model fit well with the fire influencing factors ( P<0.05), and the relative operating characteristic (ROC) was 0.757. The probability distribution map of fire events was made by map algebra. Fire area of Shanxi Province was zoned five classes, include none, low, moderate, high, and extremely high fire risk zones. The factors influence the fire event occur include altitude (GC), land use type (LT), land surface temperature (LST), Normalized Difference Vegetation Index (NDVI) and global vegetation moisture index (GVMI), whereas the influences of slope (PD) and distance to the nearest path (DL) exhibit insignificant in Shanxi Province. The NDVI and LST are significant factors in Shanxi Province globally, whereas the GC, LT and GVMI are only significant factors locally. Seven fire prevention regions are delimitated according to the fire influencing factors. Different fire prevention policies and emphases should be taken into consideration for each of the seven fire prevention regions.
随着草地生态系统的退化, 火在草地生态系统演替和发展过程中所起的作用显得越来越重要[1]。火灾具有突发性强、破坏性大、处置救助困难、影响深远等特点。减少损失的有效途径在于尽早发现林火并组织有效地扑救, 而科学开展扑救的前提是要能够及时准确地进行火险预警。火险评价对火灾监测和防控有着重要的实际意义[2], 并且越来越受到学术界的关注和重视[3, 4]。火险预报普遍经历了由野外观测和对环境的经验判断阶段到基于物理原理的火险等级预报系统阶段, 在火险预报模型方面, 发展了众多全局或半局部模型, 典型代表如Logistic全局回归[5]、人工神经网络[6]、地理加权回归[7]、贝叶斯网络[8]、最大熵模型[9]等。火险区划主要划分方法包括聚类分析[10]、Fuzzy综合评判法[11]、主成分分析[12]、投影寻踪[13]等。以往的研究主要关注于火险预警, 对火灾模拟的精度加以验证, 但较少利用空间手段分析火灾因子的空间分布及空间影响程度[14]。事实上, 火灾发生及其诱发和蔓延机制十分复杂, 不同地区的火灾影响因素及其重要程度通常并不相同[15], 在涉及环境条件异质性较大的区域时这一问题尤为突出。科学分析火灾发生和影响因子间的空间联系, 将有助于科学解释火灾发生机制。反之, 若不明确二者间的关系则可能造成模拟和预报的结果出现偏差, 进而对火灾预防造成负面影响。
传统的火灾风险评价多利用统计数据和存档资料[16], 其准确性不高, 数据的现势性较差, 不仅导致评价精度差, 而且影响数据处理效率[17]。加之火灾的影响因素纷繁复杂, 且各因素间往往具有多重联系。遥感(RS)因其实时动态获取、覆盖面积大、低成本等优势, 结合地理信息系统(GIS)强大的空间分析功能, 正日益成为火险研究中重要和常用的技术手段[18]。但这些研究大多使用简单的多因子空间(加权)叠置方法对火险进行分类分区。此外, 利用遥感数据提取的火环境因子往往存在空间异质性[7, 19]。Logistic模型可用于带有二元因变量的地理空间过程模拟[20], 本研究利用山西省2002-2012年MODIS火烧迹地数据集MCD45A1, 以高程(GC)、坡度(PD)、土地利用类型(LT)、地表温度(LST)、归一化差值植被指数(NDVI)、全球植被湿度指数(GVMI)、道路可达性(DL)等作为火灾影响因子, 建立火灾风险评价的空间 Logistic模型, 在省域空间尺度和较长时间尺度上对火灾的影响因素和火险区划进行研究, 旨在为火灾安全风险防范和风险决策提供科学合理的参考依据。
山西省位于黄土高原东部, 东邻河北省, 西靠陕西省, 南接河南省, 北连内蒙古自治区。地理坐标为34° 36-40° 44' N, 110° 15-114° 32' E, 地势东北高、西南低, 地形可分为3区:晋中盆地, 自北而南大同、忻州、太原、临汾、运城盆地呈串珠状纵贯; 晋东山地, 以太行山为主, 还包括北部的恒山、五台山和南部的中条山; 晋西山地高原, 以吕梁山为主体。气候类型为中纬度大陆性季风气候, 四季分明, 降水少, 温差大, 光热资源丰富, 气象灾害多。年降水量400~500 mm, 平均气温4~12 ℃。全省土地面积14.73万km2, 总人口3 610.8万(2012年)。南部的中条山南坡以次生落叶灌木丛和落叶阔叶林及阔叶混交林为主, 还存在一些亚热带植物种类; 中部以中旱生的落叶灌木丛和针叶林为主; 高纬度的恒山、内长城以北分布暖温带及温带灌木丛。据统计(表1), 2002-2012年, 山西共发生44 686起火灾事故, 死亡人数共计345人, 受伤人数达400人, 经济损失高达36 688.3万元, 主要有森林火灾、草原火灾、季节性秸秆焚烧引起的火灾等, 火灾的发生对山西人民的生命健康和经济财产造成巨大的损失。
本研究中采用的遥感影像均获取自美国航空航天局(NASA), 包括:1)山西省2002-2012年火烧迹地数据集 MCD45A1, 为月尺度的3级产品, 空间分辨率为500 m。从NASA的陆地过程分布式数据档案中心(The Land Processes Distributed Active Archive Center, LPDAAC/NASA)获取, 进行投影的批量转换, 边界裁剪, 并通过ArcGIS生成二元因变量(0非火烧, 1火烧)栅格图; 2)山西省2002-2012年归一化差值植被指数(NDVI)数据集MOD13A3, 为Terra卫星全球月尺度的3级产品, 空间分辨率为1 km, 获取自NASA的戈达德太空飞行中心(Goddard Space Flight Center, GSFC); 3)GSFC的地表温度数据集MOD11A2(MODIS/Terra 8day L3 1 km); 4) GSFC的地表反射率数据集MOD09A1(MODIS/Terra 8day L3 500 m); 5)GSFC的土地覆盖数据集MCD12Q1 L3。数字高程模型(DEM)取自地理空间数据云(www.gscloud.cn/)的90 m分辨率的SRTM(Shuttle Radar Topography Mission)数据。道路和水体数据来源于1∶ 100万中国地图的数字化。
火灾的发生是多种因素作用的结果, 不仅与地形地貌、气候气象、植被覆盖等自然因素有关, 还与人类活动密切相关; 此外, 不同的地区, 这些因子对火灾发生和蔓延的影响程度也不同[21]。本研究选取了地形、人类活动、地表温度、植被长势4个方面, 7个火灾风险因子分别为高程(GC)、坡度(PD)、道路可达性(DL)、土地利用类型(LT)、地表温度(LST)、归一化差值植被指数(NDVI)和全球植被湿度指数(GVMI)。在ArcGIS中将DEM重采样为1 000 m的栅格, 分别生成PD和GC两个火灾风险因子。利用欧式距离工具生成火灾风险因子DL。MOD11A2、MOD13A3、MOD09A1和MCD12Q1数据对应生成LST、NDVI、GVMI和LT共4个风险因子。由于火灾迹地产品数据MCD45A1的时间分辨率为月度, MOD11A2为8天合成数据, 故通过4期8天数据进行最大值合成获取LST。GVMI采用对应时间4期8天的GVMI, 进行月最大值合成。8天的GVMI通过公式(1)计算得出[22]:
GVMI=
式中, NIR为MOD09A1产品中的波段2的反射率, SWIR是波段6的反射率。在LST、NDVI和GVMI因子计算中, 采用各数据集中的质量层来排除云覆盖区等低质量区域。MODIS Terra数据的l km土地覆盖类型年合成栅格数据产品包含5种不同的土地覆盖分类体系。本研究采用种植功能分类, 将土地类型分为常绿阔叶林、常绿针叶林、落叶阔叶林、落叶针叶林、灌木、草地、谷类作物、阔叶作物、城市与建筑区、稀疏植被、冰雪、水12类。考虑到生成7个火环境因子的原始数据的最低分辨率是1 km, 本研究将所有数据的分辨率均统一重采样到1 km。利用NASA提供的转换工具软件MRT对数据进行图幅拼接、裁剪、格式转换等操作, 并将各因子统一到Albers Conical Area投影系。
将最大值合成后的2002-2007年和2008-2012年的火烧迹地数据分别进行最大值合并, 制作两个时期的二值栅格图, 栅格数值0为非火烧, 数值1则为火烧。各变量可能存在空间自相关, 将影响模型的拟合精度。为了减轻这种效应, 分别从两个时期的二值栅格图火烧区抽取火点, 从2002-2007年两个时期的二值栅格图中随机抽取与火点数等量的非火点(各1 133个), 采样间隔为1 km, 并以随机方式抽取火点与非火点各70%作为训练样本。同时, 抽取时要确保所有因子值均有效, 各样点不能在水域内抽取。利用ArcGIS软件的区域统计功能, 生成2002-2007年、2008-2012年两个时段的动态火险因子(LST、NDVI和GVMI), 得到栅格因子图层。由于各因子量纲不同, 需将7个火险因子进行无量纲处理, 本研究采用极差标准化法进行处理。2002-2007年各抽取730个(占总数的70%)火点与非火点, 分别提取对应位置上的栅格因子值, 生成训练样本用于建立回归模型; 同时, 抽取剩余30%的火点与非火点(各340个)作为内部检验样本, 用于模型的内部检验。2008-2012年则抽取各1 193个火点与非火点用于生成独立检验样本, 以便进行模型的独立检验。
多重共线性(Multi-colineatity)是多重回归分析时存在的一个普遍问题。多重共线性是指多个自变量间有着近似的线性关系, 某自变量可近似通过其它自变量的线性函数来表征。自变量间的多重共线性会使得回归系数的标准误差过大, 拟合结果产生偏的参数估计, 模型因此出现不稳定, 得出的推断也随即无效。在实际回归分析应用中, 自变量间很难完全独立, 所以共线性的问题并不少见。多重共线性诊断指标一般有容忍度(Tolerance, T)、方差膨胀因子(Variance Inflation Factor, VIF)、特征根(Eigenvalue)和条件指数(Condition Index)等, 本研究采用方差膨胀因子(VIF)。VIF越大, 表示共线性越严重, VIF不应该大于5, 一般而言, 当VIF> 10时, 表示存在严重共线性[23]。
二项分类Logistic回归BLR(Binary Logistic Regression)是指因变量为二分类变量时的回归分析。在Logistic回归模型中, 因变量设为y, 服从二项分布, 取值为0(非火烧)和1(火烧), 自变量既可是名义变量, 也可是有序变量或比率变量, 它与因变量间存在非线性关系。火烧概率p与预测因子xi(i=1, 2, 3, …, n)之间的关系可表达为[24]:
p(y=1)=
式中, p(y=1)是火烧概率, xi是第i个火险因子, bi是拟合因子的系数, 反映了自变量xi对火烧概率p的贡献量, b0为常数项。借助SPSS软件, 通过所选2002-2007年随机抽取的70%等数量的火点与非火点训练子集, 即可估计系数bi与b0, 借助公式(2)即可求得整个研究区的火烧概率。
ROC(Relative Operating Characteristics)常用于对Logistic回归分析的结果进行检验, 验证驱动因素的解释能力。ROC在0.5~1, 如果ROC值接近0.5, 则反映出回归方程无法解释因变量; 若ROC值> 0.7, 说明自变量具有较好的解释因变量的能力[25]。
将下载到的山西省2002-2012年的MCD45A1 L3火烧迹地数据用MRT(MODIS Reprojection Tool)拼接。山西省2002-2012年火烧迹地遍布山西省11个地级市, 主要分布在晋城市中部、吕梁市南部、临汾市北部、忻州市大部, 其余地级市的局部地区也有分布(图1)。火烧密度较大的地区主要分布在晋城市、忻州市、吕梁市、临汾市、太原市和阳泉市。
3.2.1 多重共线性的检验结果 解释变量GC、DL、GVMI、LT、LST、NDVI和PD的VIF值分别为3.058、1.069、1.123、1.894、1.187、1.183和1.545。在所有因子中, GC因子的VIF值最大, 也仅为3.058, 说明共线性极好, 因此, 本研究将所有解释变量都将用于建立Logistic模型。
3.2.2 ROC曲线 ROC曲线是由变量特异性(横轴)和敏感度(纵轴)构成的坐标系中绘制的, 特异性为负正类率(负类判为正类的比例), 敏感度为真正类率(正类判为正类的比例), 它不同于先定概率以判定“ 是否发生火灾” , 而是将预测概率(PRE)作为检验变量进行分析。Logistic 回归分析将1代表着正类(火灾发生), 0 代表着负类(火灾不发生)。ROC曲线(图2)下面积(AUC)是一个无偏的区分指数, 用于检验模型区分火点的能力[26]:AUC值介于0.5到0.7之间, 说明模型的区分能力差; 若AUC值在0.7~0.9, 则说明模型区分能力好; 若AUC值> 0.9, 即区分能力极好。在SPSS软件中利用训练子集计算AUC值, 得到 ROC曲线下面积为0.757, 远超过0.5, 模型拟合效果很好, 表明模型对于火点与非火点的区分能力合理, 非常可靠。
3.2.3 模型参数估计及性能检验 各火灾影响因子均通过了 0.05 的显著度检验和Wald检验(表2)。对火灾的发生与否贡献率大小排序依次为GVMI> NDVI> LST> GC> LT> PD> DL。
将火烧概率分为5类火险等级:极高、高、中、低、极低火险区, 分别统计2002-2007年内部检验火点(340个)与2008-2012年独立检验火点(1 193个)落入火点的百分比, 制作检验火点落入百分比直方图(图3)。从图3可以看到, 多数检验火点均位于中火险、高火险和极高火险区, 高火险和极高火险区之和能够识别59%的内部检验火点和58%的独立检验火点, 显示了模型较高的可靠性。
基于Logistic模型计算研究区内的火烧概率, 根据式(2)得到:
据此, 经图层运算得到山西省火烧概率分布图(图4)。
依据计算得到的火烧概率分布图, 利用等间距法将山西省分为5 类火险区(表3和图5), 即极低火险区、低火险区、中火险区、高火险区和极高火险区。山西省火险地域分异明显(图5), 极高火险区主要集中分布在山西南部运城市的永济市、临猗县、盐湖区、垣曲县北部, 以及太原市、吕梁市和晋中市交界处, 其中以清徐县南部、汾阳市西部、文水县东南部分布面积最大; 侯马市、曲沃县、洪桐县、吉宁县东部和北部, 蒲县的南部也有零星分布。高火险区在晋东南分布于沁水县中部、泽州县、高平市、陵川县、屯留县、长治县、长子县、黎城县等地; 在晋北分布于忻府区东北部、定襄县大部、原平市中部, 五寨县和广灵县也有零星分布; 运城盆地分布于绛县、夏县、垣曲县、芮城县; 在临汾市分布于安泽县、襄汾县、乡宁县、蒲县、吉县; 在吕梁市分布于交口县、中阳县、方山县等地。中火险区主要分布在阳泉市、晋中市东部、长治市西北部、晋城市西部。低火险区和极低火险区主要分布在吕梁山脉、晋北地区、晋西北地区, 该地区多为黄土丘陵沟壑区, 地形破碎, 植被覆盖低; 在晋南、晋中的局部地区也有分布。
火险等级的划分能够显示火灾发生的可能性和灾情蔓延的风险, 表3为划分的山西省5类火险区, 其面积分别占全省总面积的29.6%、26.0%、22.9%、17.6%和3.9%, 其中, 极高火险区和高火险区占山西省总面积的21.5%, 超过了20%, 极高火险区、高火险区和中火险区则占44.4%, 接近全省面积的一半。
从Logistic建模结果可知, GC、LST、NDVI、GV-MI、LT体现出显著的空间变化, 而DL和PD对山西省内火灾发生的影响在空间上变化不明显, 随着坡度增加以及距主要道路的距离增大, 火灾发生的概率也呈现升高的趋势。根据局部系数制图方法[27], 预测因子系数值介于-1.96到1.96之间是不显著区, 不显示在系数图上, 不显著区表示该因子在本地的影响较弱。若预测因子的系数值> 1.96或< -1.96, 则回归系数图只显示显著区(对于火灾的影响在统计上显著的区域), 表示该地区此因子影响较强, 且系数< 0用冷色表示, 系数> 0以暖色显示。按照上述方法, GC、LST、NDVI、GVMI和LT的系数制图如图6所示。从系数估计显著区看到, NDVI和LST对全省火灾形成的影响显著, 显著区几乎覆盖了全省范围。其中, NDVI因子的强影响区主要位于东部的晋城、长治、晋中、阳泉、忻州东部, 以及临汾、运城、吕梁的部分地区。LST的强影响区主要分布在西部的吕梁山脉, 中部的太原盆地、临汾盆地、运城盆地。LT、GVMI和GC仅对山西省部分区域火灾的发生影响显著。其中, GC因子的影响显著区范围要大于GVMI和LT, 主要位于吕梁山脉和太行山脉的大同市、朔州市西北部、忻州大部、太原西部、吕梁中北部和晋中东部。LT因子的显著影响区主要分布在运城市、大同市、临汾市中部, 太原、吕梁、阳泉、长治、晋城也有少许分布。GVMI因子的强影响区分布面积较少, 只在太原、吕梁、阳泉、长治等地零星分布。
通过ArcGIS栅格计算器将GC、LST、NDVI、GVMI、LT系数估计显著区叠加生成火灾因素影响因素分区图(图6)。将山西省划分为7种影响类型区, 不同类型区的火灾影响因素差异较大。解释变量估计系数的绝对值刻画了该因子对火灾发生的影响大小。对各解释变量采用标准差法进行归一化处理, 在相同位置的栅格上, 解释变量估计系数绝对值的大小可用于评估不同因子对火灾发生影响程度的相对强弱程度。DL因子和PD因子回归系数的绝对值较小, 小于GC、LST、NDVI、GVMI、LT因子; 如果将DL因子和PD因子进行非平稳项拟合, 其显著区的面积将很小。因此, 本研究中的因子DL和PD不再参与评估。影响山西省火灾最重要的两种因素分别是NDVI与LST, 其次是GC、 LT、GVMI, 这些因素对山西省火灾的发生所起的作用相对较弱。各分区火险因子的相对重要性排序与全省的火灾发生影响因素的大小排序并不完全一致(表4)。在Ⅰ 类区中, GC是仅次于NDVI的火灾影响因素, Ⅲ 类区的LT和Ⅳ 类区的GVMI都是仅次于NDVI和LST的火灾第三大影响因素。
从空间上来看, Ⅰ 类火灾影响因素区的面积最小, 受GC和NDVI因子的影响, 主要分布在忻州市的静乐县、宁武县以及五台县, 这些地区海拔较高, 植被覆盖较好, 芦芽山国家森林公园、五台山国家地质公园等分布于此, 需更加关注此地区的山地火灾, 加强预防。Ⅱ 类区主要分布在晋南、晋东南以及晋北的忻州盆地和大同盆地, 此区火灾形成的原因主要是植被覆盖和地表温度。Ⅲ 类火灾因素区面积最大, 主要分布在太原、临汾、运城以及晋城的中部, 多为地形平缓的盆地, 包含了省内工农业较为发达的地区, 城市和建成区比重相对较高, 该地区火灾发生多为谷物秸秆焚烧或者城市地区的火灾事故, 在这类影响区要注意人为致火风险, 加大宣传力度, 提高城市居民防火意识, 在谷物秸秆焚烧季节对农民加以规范指导。Ⅳ 类区主要分布在阳泉市, 除了应重视NDVI和LST的影响外, 还应注意干燥植被点燃风险。Ⅴ 类火灾因素区主要分布吕梁山脉、太行山脉以及临汾盆地的霍山附近, 植被覆盖面积较大, 是山西省主要的林区, 为森林火灾的高发区, 应高度重视植被长势、地表温度和海拔的影响。Ⅵ 类区的面积仅次于Ⅲ 类区, 主要分布在吕梁市西部, 属多因素综合影响区。Ⅶ 类区为火灾影响因子影响较弱的地区。
火灾风险分析和火险区划是消防管理的重要组成部分, 遥感和地理信息系统(GIS)技术的应用可为火灾风险分析评价与火险区划提供全空间化、动态、详实、客观的信息分析手段。本研究利用山西省2002-2012年MODIS卫星遥感数据集, 构建火灾空间分布与火灾影响因子间的空间Logistic风险模型, 在较大时间尺度和省域空间尺度上进行火险评价与区划研究, 得到以下几点结论:
1)通过空间采样构建的Logistic火灾风险模型拟合效果很好, 在显著性水平为0.05的情况下, 通过模型系数检验和Wald 检验, ROC值为0.753, 是一种较好的探索性火险分析工具。
2)经图层运算得到火烧概率分布图, 并将山西省分为无火险区、低火险区、中火险区、高火险区和极高火险区。
3)NDVI和LST因子对山西省火灾发生具有全省范围的影响, 而GC、LT和GVMI仅对省内部分区域的火灾影响显著。PD和DL对山西省火灾发生的影响在空间上变化差异较小, GC、LT、LST、NDVI以及GVMI因子对存在着较为明显的空间差异。
4)山西省按火灾影响因素可划分为7类区域, 防火管理部门可参考本研究结果制定山西省火季内的防火对策, 各类型区须依据自身实际来划定防火的重点区域, 高效合理地安排防火资源。
由于火灾发生具有随机性和不确定性, 同时影响火灾发生及发展的原因千差万别, 并不是每一个因子都可以空间化, 加之本研究的核心内容并不是研究起火的原因, 而是旨在借助空间统计手段预估火灾发生的概率, 这不可避免地会带来一些误差。再者, 利用空间插值方法对降水、气温和相对湿度等气象因子插值生成空间连续分布的栅格数据, 此过程也会引入误差, 故本研究没有使用气象数据。这些问题期望在后续研究中加以改进。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|