相关标签

县区尺度的西北五省区人口构成地相关性分析

发布时间:2019-09-11 19:45

  人口分布是指人口在特定时间特定空间上的一种集聚状态[1].传统意义上对于人口分布的研究大部分是采用统计分析的方法来定性和定量地分析人口的变化特征[2,3],对研究单元的空间位置并未重视,因此在很多情况下很难准确地描述人口的空间分布,但地理信息系统具有其他学科难以替代的独特的空间数据管理与分析的能力[4],利用地理信息系统中的地统计模块,可以将人口分布表达得更加直观与形象,从而弥补了传统统计学中的不足,逐渐成为国内外学者研究人口空间分布的主要工具.

  关键词:人口分布;县域尺度;地统计学;变异函数;西北五省区

  地理学中度量人口分布的指标有很多,论文主要通过人口密度来研究西北五省区的人口分布状况[5].空间尺度作为人口密度的一种度量参量,具有大小之分[6].较大空间尺度上的土地面积和人口密度容易获得,但其均值仅能表现研究区域的宏观格局,分析单元的内部差异性被掩盖,较小空间尺度 的土地面积和人口密度获取困难,能够得到更加精准的人口分布的结果,但空间尺度过小会导致人口密度的空间变异性消失[7].因此,选择合适的空间尺度对于人口分布的研究至关重要.目前中国对于人口分布空间尺度的研究,多以省级和县级为主[8].西北五省区相对于全国而言人口密度相对稀疏,较小的空间尺度影响西北五省区人口密度的空间变异性.因此论文认为西北五省区以县域尺度为单元估算 人口密度较为适当.

  西北五省区属于我国经济欠发达的区域,也是精准扶贫重点工作区域.人口作为社会存在和发展的基础,其人口分布既是经济发展的结果又是推动经济发展的原因,人口的空间分布可以反映一个地区的社会经济发展状况,我国学者对于西北五省区人口的研究多是从省域、市域的角度出发,采用定性分析或者运用传统统计学的方法进行量化研究,当自然条件和社会因素同时发生变化时,各因素对人口分布的影响就缺乏量的可比性,但通过变异函数,我们可以量化各因素的影响程度,得知各因素对人口分 布的影响程度的大小.同时论文又将西北地区人口分布的变异函数与贫困县的分布情况进行分析比进而从侧面映射出可能影响西北地区贫困的因素.笔者以西北五省区县级行政区为基本单元利用地统计学中的变异函数来分析西北五省区人口分布的特征,为协调西北地区人与资源环境的关系,促进西北五省区经济发展为精准扶贫工作提供参考.

  1 研究区概况

  自然条件和资源环境状况是人类赖以生存和发展的基础,决定着人口分布的基本格局并对其产生 深远的影响,而社会因素则重塑了人口分布的空间结构.温度、地形、水资源、经济、历史等因素的交叉 组合使得人口表现出显著的地区差异.西北五省区地处我国大陆内部地区属于我国七大地理分区,它们的共性特点是干旱少雨、幅员辽阔、沙漠广阔、生态敏感、难以开发[9].西北五省区内的人口密集度并不高,各省区内部差异较大.

  总体而言,西北五省区地域面积比较宽广,自然地理环境恶劣,人口稀少,经济水平相对落后,在自然环境和社会环境上存在许多共性.然而其内部又存在明显的差异性.

  2 数据来源与研究方法

  2.1 数据来源

  论文中的人口数据来源于2016年西北地区各个省份的统计年鉴.研究行政单元370个,其中地市级51个,县级319个.西北五省区县域行政区划矢量数据来源于国家测绘局基础地理信息数据库.行政区划土地面积来源于2016年319个县级行政单元的县域统计年鉴,人口密度由各行政单元总人口除以对应区域的土地面积所得.

  2.2 研究方法

  论文主要从分布特征和变异特征两个方面来研究西北五省区的人口分布,研究分布特征的方法有 洛伦兹曲线、极值比.研究变异特征的方法为变异函数.变异函数通过研究抽样点在不同空间间隔上的差异,来定量地描述其空间分布规律,是地统计学中的关键函数,主要揭示了抽样点在空间上的相关 特征.

  2.2.1 洛伦兹曲线

  为了研究社会收入分配状况,统计学家引入了洛伦兹曲线,主要用来描述一个国家或地区的财富不平等状况[10].后来洛伦兹曲线被引入到地理学领域中,以此来分析人口分布的不均衡性.其具体方法为将研究区的平均人口密度按照从小到大的顺序进行排序,然后以人口累计百分比为横轴,面积累计百分比为纵轴,来建立直角坐标系,绘制研究区的人口密度曲线,最后得到洛伦兹曲线.洛伦兹曲线在坐标轴上表现为一条弯曲的曲线,其弯曲程度则与人口分布的均衡性有关.弯曲度越小的洛伦兹曲线,研 究区的人口分布越均匀;洛伦兹曲线弯曲程度越大,研究区的人口分布的不均衡性越严重;洛伦兹曲线为45度的直线时,人口分布均匀.

  2.2.2 极值比

  统计学中的极值比是指一组数组中最大值与最小值的比值,本论文中的极值比主要是西北五省区 在不同分析单元下各研究区人口密度最大值与人口密度最小值的比值.通过计算不同分析单元的极值 比,可以验证空间尺度对人口分布的影响,进而研究分析单元的平均化趋向.

  2.2.3 变异函数

  在一维条件下,点x 在x 轴上变化,将点x 处的值记为z(x),则在点x+h 处的值为z(x+h),则区域化变量z(x)在x 轴方向上的变异函数,记为r(h).

  2.2.4 变异函数

  在一维条件下,点x 在x 轴上变化,将点x 处的值记为z(x),则在点x+h 处的值为z(x+h),则区域化变量z(x)在x 轴方向上的变异函数,记为r(h).在二阶平稳假设条件下,对任意的h 有E[z(x +h)]=E[z(x)]其变异函数为:

  z(xi)是区域化变量z(x)在点xi 处的实测值.z(xi +h)是区域化变量在点xi +h 处的实测值,h 为间隔距离.变异函数有4个非常重要的参数,即基台值、变程、块金值和分维数[11].

  这4个参数决定变异函数的形状与结构.块金值 (c0)是变异函数在距离等于零时变异函数的值,反映空间变异受距离以外其他因素的影响程度.基台值 (c0 +c)是变异函数达到稳定值时的常数,基台值越大,表示系统内的空间异质性越强. 基台值越小,表示系统内的空间异质性越弱[12]. 变程 (A)是变异函数达到基台值时的空间距离,在该空间距离以内,空间相关性随间隔距离h 的增加而减少,在该空间距离以外不存在空间相关性.变异函数的分维数是一个量纲为1的数.

  在实际中,一些数据的理论模型是未知的,因此就需要通过实际的空间取样数据去估计理论模型, 对于变异函数来说不同的h值,可以计算出对应的r(h)值.因此需要一个理论模型去拟合一系列的 rh)的值,在统计学,有球状模型、幂函数模型、高斯模型、线性无基台值模型、抛物线模型等变异函数理论模型[13].

  其中,c0 为块金常数;a 为变程;c 为拱高;c0 +c 为基台值;h 是滞后距.指数模型的一般式:

  其中,c0 为块金常数;c 为拱高;c0 +c 为基台值;h 是滞后距.

  3 西北五省区人口分布特征分析

  3.1 人口密度的描述性统计分析

  地统计学方法进行空间分析时,如果样本数据不服从正态分布或近似服从正态分布,会进一步加大变异函数的波动程度,进而扩大变异函数的估计误差,因此在分析之前必须对样本数据的分布情况进行大致的分析并做相应的转化处理,才能很好地提高模型模拟的精确度.

  在 GS+软件中对西北五省区人口密度进行对数转换,对数转换前及对数转换后的结果见表1.

  由表1可知,对数转换前峰度系数为111.95,偏度系数为9.41.对数转换后,峰度系数为0.72,偏度系数为-0.53.转换后近似服从正态分布.

  3.2 人口密度的均衡分布

  图1的洛伦兹曲线代表着西北五省区319 个分析单元的均衡程度,由图1中的实际分布曲线可以看出,其弯曲程度较大,严重偏离对角线,表明西北五省的人口分布不均匀现象非常的严重,在洛伦兹曲线的左下角区域,当土地面积累计百分比达到48%时,人口累计百分约比为1%,对应地区人口密度<10(人/km2),该部分曲线几乎垂直于纵坐标而起,主要分布在玛多县、民丰县、肃南县、和田县等高海拔地区和沙漠地区.在洛伦兹曲线的中间区域,当土地面积累计百分比达到84% 时,人口累计 百 分 比 为 17%,该 地 区 人 口 密 度 约 为 50 (人/km2),主要位于凤县、环县、华池县、合作市等

  图1 西北五省区人口密度分布洛伦兹曲线

  甘肃省和陕西省黄土高原地区,在洛伦兹曲线的右上角区域,当土地面积累计百分比达到99% 时,人口累计百分比约为72%,也就是说剩下1% 的土地面积上分布着28% 的人口,该部分曲线几乎垂直于横坐标而起,该地区人口密度>1000(人/km2),主要分布在固原市、临夏市、渭南市、西安市、兰州市等西北五省各个省份的省会城市及地级市.

  3.3 人口密度的空间分布

  以人口密度作为主要指标,在 GIS中通过空间插值实现西北地区人口空间分布表达,用地形图来绘制西北五省人口分布图.将西北五省的人口密度划分为不同的级别可以更加直观地反映西北五省的 人口分布状况,有利于揭示各个级别人口分布的空间特征.本论文将人口密度分为4个单元:高密度单元(人口密度 大于或等于1000(人/km2 )、中高密度单元(1000(人/km2 )> 人口密度 大于或等于100(人/km2)、中低密度单元(100(人/km2)>人口密度大于或等于10(人/km2)、低密度单元(人口密度 小于或等于10(人/km2).4种人口密度的空间分布如图2所示.

  图2 西北五省区人口密度分布图

  由图2可知,高密度单元在西北五省区的分布比较少,主要是西北五省区的省会城市以及一些市.它们往往占据着得天独厚的地理优势、有着四通八达的交通网络,从而吸引着该地区的大量人口聚集于此.中高密度单元分布于西北的东部地区,主要是陕西省南部地区以及甘肃省的东部地区.中低 密度单元所占比例相对较多,主要为陕西省的北部、宁夏回族自治区的部分区域、甘肃省的东部、新疆省的西北部地区.低密度单元在西北地区的分布最多,位于新疆省和青海省的大部分地区以及少数民族聚集的地区,人口密度最低.

  3.4 人口密度分布的差异性分析

  以西北五省区51个地市级单元计算,面积最大的是巴音古楞蒙古自治州470954.3km2,面积最小的是嘉峪关市2935km2.人口最多的是西安市837.9万人,人口最少的是嘉峪关市24.6万人.人口密度最大的是西安市831.9(人/km2),人口密度最小的是果洛州0.5(人/km2). 极值比为1664. 以西北五省319个县级单元计算,面积最大的是玛多县253000.0km2,面积最小的是固原市45.0km2.人口最多的是兰州市区266.66 万人,人口最少的是阿克塞县1.05 万人.人口密度最大的是平凉工业园区5 764.7(人/km2)人口最小的是肃北县0.23(人/km2),极值比为96079.这表明研究的空间尺度不同,密度的平均化趋向不同,随着空间尺度的逐渐缩小各地区人口密度的平均化趋向逐渐降低,能够更加精确地反映人口空间分布.由于西北五省区人口密度乡镇尺度的数据获取较为困难,因此本论文认为以县 级数据进行研究较为合理,能够更好地反映西北五省区人口分布的差异性.

  4 西北五省区人口密度的变异分析

  4.1 变异函数模型的确立

  4.1.1 不同方向变异性分析

  通过西北五省区的四个方向上的数据来计算变异函数并分析西北五省区在这四个方向上的人口密度特征. 利用 GS系,即表现出各向同性的特征.同时,人口密度在四个方向上的变异又有明显的不同,即表现出各向异性的特征.当距离达到733km 左右的时候东西方向变异函数达到最大值,其图像近似符合线性模型.当距离达到1788km 左右的时候东北G西南方向变异函数达到最大值,其图像也大致和线性模型相吻合.当距离达到1542km 的时候东南G西北方向变异函数达到最大值,其图像近似符合球状模型,当距离达到1672km 左右的时候南北方向上变异函数达到最大值,其图像近似符合高斯模型. 由西北五省区四个方向上的变异函数图像可知,人口密度的空间分布呈现出明显的带状异质性,其波动性在南北方向和东南G西北方向上强,而在东北-西南方向和东西方向上则较弱,说明人口密度在不同的方向上具有不同的分布特征.

  从四个不同方向上的变异函数的分维数来看(表3)四个方向上的分维数的大小顺序依次是东西方向大于东北G西南方向大于东南- 西北方向大于南北方向. 说明西北五省区的人口密度均衡性最强的位于东西方向,但差异性最弱.而南北方向有着最强的差异性,均衡性最弱.与图5得出的结果相一致.

  4.1.2 综合变异性分析

  表3 四个不同方向上的变异函数的分维数

  东西方向 1.993 41.080 0.001东北G西南方向 1.816 0.302 0.751南北方向 1.607 0.149 0.900 东南G西北方向 1.697 0.180 0.873由前面西北五省四个方向上的变异函数图像可知,不同方向上具有不同的变异函数.因此,我们需要构造一个综合的变异函数模型,来全面地研究该区域的变异性特征[14].

  变异函数的理论模型主要有球状模型、指数模型和幂指数模型,其中属于曲线模型的有球状模型、指数模型、幂函数模型[15].由西北五省四个方向上的变异函数图像知,西北五省变异函数模型的拟合主要是曲线拟合.

  变异函数拟合方法一般分为直接估计和间接估计两大类. 直接估计方法可分为参数法和非参数法,其中参数法有极大似然函数法,而非参数法有交叉验证法.间接估计包括简单最小二乘法、加权最小二乘法以及广义最小二乘法[16].本论文选取基于最小二乘法的 GS+软件,分别用球状模型、指数模型、高斯模型对样本数据进行拟合.拟合结果见表4.

  通过对比分析各模型的参数,可以发现.就块金值而言,高斯模型远大于指数模型和球状模型;在基台值方面则相差较小,由高到低依次为:指数模型、球状模型、高斯模型. 就拟合效果方面而言,各模型理论模型 块金值(c0) 基台值(c0 +c) 变程(A) R2 RSS球状模型 0.01 6.408 1654 0.895 7.09指数模型 0.11 7.229 2646 0.839 11.4高斯模型 0.87 6.59 1479 0.91 6.02残差值(RSS)指数模型最大,高斯模型最小.可决系数(R2)指数模型最小,高斯模型最大.因此在拟合效果方面,最好的是高斯模型.最后得出西北五省变异函数模型为:

  4.2 结果分析

  西北五省区的变异性即存在一定的差异性又存在一定的共性.其变异性主要体现在四个方向上, 西北五省区的人口密度在东西方向上的均衡性最强,差异性最弱.而南北方向上的均衡性最弱,差异性 最强.但西北五省区的综合变异性又可以通过高斯模型进行拟合.西北五省区变异函数模型中块金值(c0 ) 为0.87,基台值 (c0 +c) 为6.59,块金值与基台值的比值即块金系数.若该数值低于25%,则系统存在强相关性,如果该数值高于75%,系统则存在弱相关.西北五省区人口密度变异函数块金值与基台值的比值为0.13,说明西北五省区人口密度具有强空间自相关性,表示由政策因素、人文环境、历史条件等随机性因素引起的变异占总变异的比例为13%,表示由自然环境、地理位置等结构性因素导致的变异占比总变异87%,结构性因子主导着其空间变异.

  5 西北五省区贫困人口分布特征

  西北五省区位于我国大陆内部,人均 GDP 一直处于较低水平,贫困人口比重高,贫困人口总量大, 分布广,发生率高,是西北人口的显著特征.2016 年国家级重点贫困县中,西北地区就有181 个,其中 43个在甘肃,56个在陕西,35个在新疆,38 个在青海,9 个在宁夏. 在 Arcgis.10 中做西北五省区贫困县的空间分布图,如图4所示.

  第3期 石佩珍,等:县域尺度的西北五省区人口分布地统计学分析

  图4 西北五省区贫困县分布图

  五个省区内部而言,贫困县主要位于青海省的大部分区域、甘肃省东南部地区、新疆维吾尔自治区的西南地区、陕西省南部的汉中、榆林、安康、商洛地区以及宁夏回族自治区的固原地区.

  整体而言,西北五省区从县域角度来看,东南方向和西南方向的贫富差距较大,其他方向的贫富差 距较小.这与变异函数模型得出的人口密度的分布特征并不完全吻合.例如甘肃省天水、庆阳、陇西、 陇南、宁夏回族自治区的六盘山地区等农业较集中人口密度相对较大的地区,同样也是西北乃至全国最为贫困的地区.两者之间的关系,值得我们进行深入的探讨.

  6 西北地区人口分布影响因素分析

  6.1 结构性因素主要影响西北五省区的人口分布

  由综合变异分析可知,西北五省区人口密度间存在着强空间自相关性,由政策因素、人文环境、历史条件等随机性因素引起的变异占总变异的比例为13%,表示由自然环境、地理位置等结构性因素导致的变异占比总变异87%.即西北五省区的人口分布主要受地理因素的影响,而社会因素则重塑了西北五省区的人口分布.

  西北五省区气候干旱,人们大多选择泽水而居.东部集中在黄河沿岸平原,呈带状.西部集中在沙漠边缘的绿洲,呈点状.中部区域包括甘肃省部分地区,青海省大部分区域海拔较高,昆仑山脉、祁连山脉、阿尔金山脉纵横分布,属于高寒区域,艰苦的地理环境导致这些区域人口密度较小,经济发展水平落 后,是我国精准扶贫的重点区域.

  地理条件优越的地区,哪些地区形成城镇,哪些地区形成高密集的区域,又有更深层次的原因.陕西省是西北五省区人口密度最大,经济最发达的地区. 是中华民族光辉灿烂的古代文明发祥地之一. 深厚的文化底蕴为陕西省的经济发展奠定了基础.西安古称长安,是中国西北大陆上的一颗璀璨的明珠.回顾历史,古代丝绸之路始于长安,商人云集,使长安成为了亚欧合作交流的国际化大都市.2013年,随着“新丝绸之路经济带”战略构想的提出,而陕西省作为“一带一路”战略的核心区,政府提出要将西安建设成为国际化大都市的策略,带动关中其他地区共同发展.

  6.2 人口分布在南北方向上的差异性最强

  由不同方向上的变异性分析可知,西北五省区的人口密度在四个方向上的变异存在着明显的不同, 南北方向的差异性最大,一方面是由北部地区沙漠分布多所引起的.甘肃省民勤县由于其土地沙漠化 加剧,导致人口自发性的大规模的外流.宁夏是我国沙漠化最为严重的地区之一,全区被沙漠包围,宁夏土地沙漠化主要集中在北部的盐池、灵武以及中部的中卫等地区,这部分地区作为我国生态安全的重要屏障区,其生态状况对我国西部乃至全国的生态安全显得尤为重要.而陕西省安康地区和商洛地区, 这些地区位于黄河中下游,属于关中地区,土地肥沃水资源丰富,地势平坦,海拔较低,适宜人类生存,人口密度最大.另一方面降水量对于新疆自治区人口分布的显著影响[17].位于北疆地区的乌鲁木齐区域年平均降水量为408mm,而位于南疆区域的哈密和阿尔泰地区年平均降水量仅为78.8mm.由此导致新疆地区南方和北方人口分布的差异.

  综合比较各西北五省区导致其南北方向上的人口分布的差异可知,地理因素极大的影响这些区域 的人口分布,但具体地理因素的影响程度不同,有些地区降水量对其影响较大,有些地区坡度因影响其 分布.因此,对各地理因素影响程度的量化分析,是我们以后需要研究的一个方向.

  6.3 “人”穷并非“地”穷,人口密集并非经济发达

  由变异分析可知,对于西北地区自然条件影响该地区人口分布,一般意义上而言,自然条件优越的 地区人口密度较大,由此产生的集聚效应导致人口密集的区域经济较发达.通过变异函数与西北地区贫困县的空间分布图进行比较可知,西北五省区贫困省的分布与其人口的分布状况、环境状况并不完全的吻合.西北地区的贫困人口分布在陕西省南部地区以及甘肃省的东部地区和宁夏区的南部地区等自 然条件比较优越的地区,坡度小的渭河等河谷地区,以及降雨量较大的南部甘谷、武山等县贫困人口规模较大,人口密集越密集的地区贫困发生率反而越高,较大的人口密度、落后的基础设施以及稀缺的就业资源和过剩的劳动力是该地区贫困发生的主要原因.

  7 讨论

  西北五省区的人口密度在南北方向上的差异性最强,这主要是由西北五省区的地理环境所导致的, 北部地区沙漠广布,我国大部分沙漠分布与此.甘肃的民勤县、宁夏北部的盐池、灵武地区、宁夏中部的 中卫地区都是我国沙漠化最为严重的地区,大面积的沙化面积导致人口大量流失.同时这些区域也是 重要的生态屏障区,这些地区的生态保护显得尤为重要.根据 GS+ 统计软件得出,高斯模型是西北五省区人口分布状况拟合精度最高的变异函数模型.由模型得出自然环境、地理位置等结构性因素主导着其空间变异.自然环境主要影响西北五省区的人口分布,尽管西北各个省份人口分布的区域特点不 尽相同,但是纵观整个西北地区,干燥和气候、复杂的地貌特征以及是否有丰富的资源是影响西北地区 人口分布的主要因素.人口的分布大多是择水而居.东部集中在黄河沿岸平原,呈带状.西部集中在沙漠边缘的绿洲,呈点状.国家政策和便利的交通设施重塑了人口的空间分布.自然地理和环境因素、 经济社会共同塑造了西北五省区人口分布特征,同时西北地区的贫困落后不只指“地”穷,还表现在收 入、产业发展、教育文化、基础设施等方方面面,要如期实现脱贫目标,应当在现有“精准扶贫大数据管理系统”的基础上,提高贫困的辨识度和精准度,从多种渠道实现扶贫政策.因此在考虑影响人口相关的政策时,应同时考虑自然地理和生态环境、以及社会经济方面的限制作用,只有这样才能使政府的相关 政策发挥最大的效力.

毕业论文:http://www.3lunwen.com/jj/tjx/3758.html

上一篇:浅谈面向就业导向的统计学课程多元教学方法

下一篇:没有了

     移动版:县区尺度的西北五省区人口构成地相关性分析

本文标签:
最新论文