您当前的位置:主页 > 香港挂牌之全篇 > 正文

第七章 空间数据的统计分析方法

2019-10-08 02:22  作者:admin 点击:次 

  第七章 空间数据的统计分析方法_理学_高等教育_教育专区。GIS空间分析中,空间属性数据的分析方法介绍

  空间统计应用 ? ? ? ? ? 汇总空间分布的关键特征 识别具有统计显著性的空间聚类和空间异常 值 评估聚集或离散的整体模式 根据属性相似性对要素进行分组 空间关系建模 地统计在科学和工程领域中的应用 ? ? ? 采矿行业 :量化矿物资源和评估项目的可行性 环境科学:评估污染级别以判断是否对环境和人身健 康构成威胁,以及能否保证修复。 土壤科学:绘制土壤营养水平(氮、磷、钾等)和其 他指标(例如导电率),以便研究它们与作物产量的关 系和规定田间每个位置的精确化肥用量。 ? ? 气象:温度、雨量和相关的变量(例如酸雨)的预测 公共健康领域:预测环境污染程度及其与癌症发病率 的关系。 探索性空间数据分析 采用探索性空间数据分析工具来研究 喀尔巴阡山中监测站处获取的臭氧测量值的属性 地统计分析用于研究区域中已测量的采样点为同一区域 内其他未测量位置创建准确预测。探索性空间数据分析工具 用于评估数据的统计属性,比如空间数据变异性、空间数据 相关性和全局趋势。 表面预测和误差建模 地统计工具可生成各种类型的地图图层,包括预 测图、分位图、概率图、预测标准误差图。 白俄罗斯放射铯土壤污染级别的预测图 阈值制图 概率图来预测值超过临界阈值的位置。 暗橙色和红色显示的位置表示概率大于 62.5%,此处放射性铯 污染超过森林浆果中最大允许级别(临界阈值)。 模型验证和诊断 将输入数据拆分成两个 子集。用数据的第一个子集 开发预测的模型。然后使用 “验证”工具,比较预测值 和其余位置的已知值。 预测伊利诺斯州农场的有机物 协同克里金法的表面预测 探索臭氧(主变量)和二氧化氮(二级变量)之间的空间相关性。在 绘制臭氧地图时,协同克里金法可使用二氧化氮数据改进预测。 第七章 空间数据的统计分析方法 空间数据的统计分析 着重于空间物体和现象的非空间特性的 统计分析,研究如何以数学统计模型来描 述和模拟空间现象和过程。 空间数据统计分析的目的 ? 描述事物在空间上的分布特征(随机的、聚集 的或规则的)。 分析数据的空间自相关性,空间自相关性对空 间格局的影响,如何利用这种关系构建模型。 ? 空间数据统计分析的流程 原始数据 检查、分析数据 选择合适的模型 检验模型或模型比较 分析结果 最后检验模型是否合理 或几种模型进行对比。 探索数据暗含的特点和 规律,比如是否为正态 分布、41kj开奖网,有没有趋势效应、 各向异性等 进行表面预测。包括半 变异模型的选择和预测 模型的选择。 主要内容 一 二 三 四 五 基本统计量 探索性空间数据分析 地统计分析 克里金插值方法 应用案例 一 基本统计量 集中趋势 描述数据特征 的统计量 基 本 统 计 量 其他统计量 离散程度 平均数 中位数 众数 分位数 偏度 极差 离差 平均离差 离差平方和 方差 标准差 变异系数 分布特征 峰度 总和 比率 比例 种类 插 值 方 法 的 选 择 从离散样本点 连续表面 模 型 参 数 的 设 置 不同的插值方法 模型参数设置 ? 有多少样本点参与到计算中来? ? 每个样本点的权重是相同的吗? ? 选择什么函数来模拟表面? ? …… 了解数据开始 探索性空间数据分析 Explore Spatial Data Analysis 主要内容 一 二 三 四 五 基本统计量 探索性空间数据分析 地统计分析 克里金插值方法 应用案例 二 探索性空间数据分析 Exploratory Spatial Data Analysis—ESDA 对样本数据性质的研究,没有先验的理论 假设,通过对数据全面深入分析来了解其在空 间分布、空间结构以及空间相互影响方面的特 征。 二 探索性数据分析 (一)基本分析工具 (二)检验数据分布 (三)寻找数据离群值 (四)全局趋势分析 (五)空间自相关分析 (一)基本分析工具 ?直方图:检查数据集的分布和汇总统计数据。 ?正态 QQ 图和常规 QQ 图:分别评估数据集是否是正态 分布以及研究两个数据集是否具有相似的分布。 ?Voronoi图:直观地检查数据集的空间可变性和稳定性。 ?趋势分析:查看并检查数据集的空间趋势。 ?半变异函数/协方差云:评估数据集的空间依赖性(半变 异函数和协方差)。 ?交叉协方差云:评估两个数据集间的空间依赖性(协方 差)。 探索性数据分析:直方图 直方图:对采样数据按一定的分级方案(等间隔 分级、标准差分等)进行分级,统计采样点落入 各个级别中的个数或占总采样数的百分比,并通 过条带图或柱状图表现出来。 ? 直方图的一些基本统计量,可以对数据有个初步 的了解。 ? 直方图可以直观的反映采样数据分布特征、总体 规律,合肥女律师遭家暴案宣判 被告人因故意杀人。可以用来检验数据分布和寻找数据离群值。 ? ?将数据分为若干 区间,统计每个区 间内的要素个数 ?给出一组统计量 ?检验数据是否符 合正态分布以及发 现离群值 直方图 ? ? 频率分布 汇总统计数据 用条形图表示,显示 了观察值位于特定区 间或组之内的频率。 通过描述统计数据位 置、离散度和形状的 统计量来概括数据 探索性数据分析:直方图 ? ? 作为一种快速检查手段,如果平均值和中值近 似相同,则初步证明数据可能呈正态分布。 该臭氧数据直方图表示数据为单峰(一个高峰) 并且向右偏移。分布图的右侧尾部表示存在的 采样点相对较少但臭氧浓度值较高。该数据不 接近于正态分布。 直方图 变换 对数变换 探索性数据分析:QQplot图 正态QQPlot分布图(Normal Quantile-quantile Plot) 评估具有n个值的单变量样本数据是否服从正态分布 ① 对采样值进行排序; ② 计算出每个排序后的数 据的累积值(i-0.5)/n; ③ 绘制累积值分布图; ④在累积值之间使用线性内 插技术,构建一个与其具有 相同累积分布的理论正态分 布图,求对应的正态分布值; 标准正态分布(平均值为 0 标准方差为 1 的高斯分布 如何构建正态 QQ 图? ⑤以横轴为理论正态分布值,竖轴为 采样点值,绘制样本数据相对于其标 正态 QQ 图 准正态分布值的散点图。 普通 QQ 图 评估两个数据集的分布的相似程度。 普通 QQ 图 使用 QQ 图检查数据分布 正态 QQ 图上的点可指示数据集的单变量分布的正态 性。如果数据是正态分布的,点将落在 45 度参考线上。 如果数据不是正态分布的,点将会偏离参考线。 探索性数据分析:趋势分析 识别数据中的全局趋势 ? ? ? 如果在数据中存在趋势,则该趋势就是可以通过数学 公式表示非随机(确定性)组成部分。如:通过平面 表示一个平缓的山坡。山谷可以使用二阶多项式通过 创建 U 形来表示出来。 将局部变化添加到表面。使用其中某个平滑函数为趋 势建模,从数据中移除趋势,通过为残差(移除趋势后 的剩余部分)建模继续进行分析。为残差建模时,将 分析表面中的局部变化。 通过“趋势分析”工具可以识别输入数据集中存在的/ 不存在的趋势,并且可以识别出最佳拟合此趋势的多 项式阶数。 趋势分析 ?“趋势分析”工具提供数据的三维透视图。采样 点的位置绘制在 x,y 平面上。在每个采样点的上 方,值由 z 维中的杆的高度给定。 ?“趋势分析”工具将散点图投影到 x,z 平面和 y,z 平面上。可以将其视为通过三维数据形成的横 向视图。 ?多项式即会根据投影平面上的散点图进行拟合。 ?附加要素是您可以旋转数据来隔离方向趋势。 ? ? 趋势很明显,呈倒置的 U 形。这表明可使用二 阶多项式对数据进行拟合。 趋势的影响力从区域的中心到各个边界逐渐减 弱(即,最大值出现在区域的中心,最小值出 现在边的附近)。 探索性数据分析:Voronoi图 Voronoi图的定义: 平面n个离散点,把平面分成n个区, 每个区包括一个点,该点所在的区是到 该点距离最近的点的集合。 检查局部变化 Voronoi 地图是由围绕采样点的位置形 成的一系列多边形所构成的地图。 ? ? ? 创建 Voronoi 多边形,以使多边形内的各个位置距该 多边形内的采样点的距离小于距任何其他采样点的距 离。 创建这些多边形后,采样点的相邻点将被定义为与该 所选采样点共享多边形一条边的任何其他采样点。 亮绿色的采样点被一个面包围,这个面以红色高亮显 示。与其他任何采样点(以深蓝色小圆点表示)相比, 红色面内的每个位置更接近亮绿色采样点。蓝色的面 都与红色的面共享一条边,因此,蓝色面内的采样点 是亮绿色采样点的相邻点。 检查局部变化 Voronoi 地图是由围绕采样点的位置形 成的一系列多边形所构成的地图。 ? ? ? 通过采用红色和蓝色多边形中采样点的”值”来计算 局部值。 然后将此局部值指定给红色多边形。 将针对所有多边形及其相邻点重复此过程,并以色带 的形式显示计算结果,以区分具有高局部值和低局部 值的区域。 探索性数据分析-半变异函数/协方差云 ?半变异函数和协方差函数将邻近事物比远处事 物更相似这一假设加以量化。 ?半变异函数和协方差都将统计相关性的强度作 为距离函数来测量。 ?对半变异函数和协方差函数建模的过程就是半 变异函数或协方差曲线与经验数据拟合。目标是 达到最佳拟合,并将对现象的认知纳入模型,使 模型便可用于预测。 半变异函数 ? 半变异函数定义为 γ(si,sj) = ? var(Z(si) - Z(sj)), 其中 var 是方差。 ? ? 如果两个位置 si 和 sj,在 d(si, sj) 的距离测量上彼 此相近,那么会希望这两个位置相似,以便缩小两 个位置的差值 Z(si) - Z(sj) 的大小。 当 si 和 sj 距离逐渐增大时,它们变得越来越不相 似,它们的值 Z(si) - Z(sj) 的差异也会增大。 标识的是差异 典型半变异函数的解析图 协方差函数 ? 协方差函数定义为 C(si, sj) = cov(Z(si), Z(sj)), 其中 cov 是协方差。 当两个位置si 和 sj 彼此相近时,希望这两个位 置相似,而它们的协方差(相关性)会变大。 当 si 和 sj 距离逐渐增大时,它们变得越来越不 相似,并且它们的协方差会变为零。 标识的是相关性 典型协方差函数的解析图 ? ? 半变异函数和协方差函数之间的关系 ? 在半变异函数和协方差函数关系: γ(si, sj) = sill - C(si, sj), Sill为基台,使用两种函数中的任一种来执行预 测,一般采用半变异函数。 典型半变异函数的解析图 典型协方差函数的解析图 了解半变异函数:变程、基台和块金 ? 半变异函数显示测量采样点的空间自相关。 变程 偏基台 基台 块金 变程:半变异函数的模型首次呈现水平状态的距离 块金:测量误差或小于采样间隔距离处的空间变化源 基台:半变异函数模型在变程处所获得的值(y 轴上的值) 半变异函数/协方差云 ?每一个点代表一个点对 ?空间距离越近,相关性越大 ?发现离群值以及是否存在各 向异性 在半变异函数图中,相互之间最接近的位置应该具有较小 的半变异函数值。随着位置对之间的距离增加,半变异函 数值也应该增加。但当到达某个距离时云会变平,这表示 相互间的距离大于此距离的点对的值不再相关。 观察半变异函数图,如果出现某些非常接近的数据位 置(在 x 轴上接近零)却具有高于预期的半变异函数 值(在 y 轴上的高值),则应该调查这些位置对,看 一下是否存在不准确的数据。 ?具有典型半变异函数值的位置对,其点对之间的距离 大致相同。 ?其中的大多数连线与海岸线大致平行,可以看到数据 受到方向因素的影响。 (二)检验数据分布 在地统计分析中,克里金方法是建立在平 稳假设的基础上,并假设数据服从正态分布。 如果数据不服从正态分布,需要进行一定的数 据变换,从而使其服从正态分布。因此,检验 数据分布特征,了解和认识数据具有非常重要 的意义。 (三)查找全局异常值和局部异常值 ? 全局异常值是相对数据集中的所有值具有非常高值或 非常低值的已测量采样点。 局部异常值是一个已测量采样点,具有整个数据集正 常范围内的值,但查看周围点时,其值显得异常高或 异常低。 识别异常值的原因有两个: ? ? ? 如果异常值是现象中的真实异常情况,那么这可能是 研究和理解现象的最重要的点。 ? 如果异常值是由数据输入过程中的错误导致的,那么 在创建表面之前应该进行校正或移除。 通过直方图工具查找异常值 通过半变异函数/协方差云识别异常值 如果数据集中存在具有异 常高值的全局异常值,则 无论什么距离所有点和异 常值的配对在半变异函数 云中也将具有高值。 彼此靠近的成对位置 具有高半变异函数值, 当把这些点擦除后, 可以看出所有这些点 都和单个位置配对。 此位置可能是局部异 常值。 局部异常值 通过 Voronoi 制图查找局部异常值 Voronoi 地图是由围绕采样点的位置形 成的一系列多边形所构成的地图。 ? ? ? 通过采用红色和蓝色多边形中采样点的”值”来计算 局部值。 然后将此局部值指定给红色多边形。 将针对所有多边形及其相邻点重复此过程,并以色带 的形式显示计算结果,以区分具有高局部值和低局部 值的区域。 (四)全局趋势分析 空间趋势反映了空间物体在空间区域上变化 的主体特征,它主要揭示了空间物体的总体规律, 而忽略局部的变异。 趋势面分析是根据空间抽样数据,拟合一个 数学曲面,用该数学曲面来反映空间分布的变化 情况。 趋势分析透视图 (五)空间自相关分析 ? ? ? 通过探索数据,能够更好地了解测量值之间的空 间自相关,有助于在选择空间预测的模型时做出 更好的决策。 各向同性:空间自相关仅依赖于两个位置之间 的距离。 各向异性:对于较长的距离,事物在某些方向 上比在其他方向上更相似。半变异函数和协方差 中存在这种方向影响。 利用“半变异函数/协方差云”工具探索空间结构 半变异函数云中选择相 隔一定距离的所有位置 对,可以对其进行操作。 数据的全局自相关 利用“半变异函数/协方差云”工具查找方向影响 查看半变异函数表面时,半变异函数的值中可能存 在方向差异。单击显示搜索方向并设置角度和带宽时, 将会看到连在一起的位置具有非常类似的值。 探索数据分析结果 ? 臭氧数据为单峰,但并不是非常接近于正态分布,如 直方图中所示。 正态 QQ 图也显示出数据不呈正态分布,因为图中的 点没有形成一条直线。可能需要进行数据转换。 通过“趋势分析”工具可以看到数据呈现一种趋势, 将该趋势细化后,可以看出二阶多项式是对其进行的 最佳拟合。 半变异函数/协方差云说明了极高的半变异函数值大部 分以垂直于海岸线的连线表示。使用此工具进行的分 析表明插值模型应该考虑到各向异性。 ? ? ? 主要内容 一 二 三 四 五 基本统计量 探索性空间数据分析 地统计分析 克里金插值方法 应用案例 地统计概念 ? ? 地统计(Geostatistics)又称地质统计,以 区域化变量为基础,借助变异函数,研究既具 有随机性又具有结构性,或空间相关性和依赖 性的自然现象的一门科学。 地统计分析理论基础: ? ? ? ? 前提假设 区域化变量 变异分析 空间估值 前提假设 ? 随机过程 统计学认为研究区域中的所有样本值都是随机过程的 结果,即所有样本值都不是相互独立的,它们是遵循 一定的内在规律的。地统计学就是要揭示这种内在规 律,并进行预测。 ? 正态分布 在统计学分析中,假设大量样本是服从正态分布的, 地统计学也不例外。在获得数据后首先应对数据进行 分析,若不符合正态分布的假设,应对数据进行变换, 转为符合正态分布的形式,并尽量选取可逆的变换形 式。 前提假设 ?平稳性 ?均值平稳,即假设均值是不变的并且与位置无关; ?与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平 稳。 ?二阶平稳是假设具有相同的距离和方向的任意两点的协方差 是相同的,协方差只与这两点的值相关而与它们的位置无关。 内蕴平稳假设是指具有相同距离和方向的任意两点的方差(即 变异函数)是相同的。 ?二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本 假设,通过协方差函数和变异函数可以进行预测和估计预测结 果的不确定性。 区域化变量 ? ? ? 当一个变量呈现一定的空间分布时,称之为区域化 变量,它反映了区域内的某种特征或现象。 区域化变量具有两个显著特征:随机性和结构性。 区域化变量是一个随机变量,具有局部的、随机的、 异常的特征;区域化变量具有一定的结构特点,变 量在点x与偏离空间距离为h的点x+h处的值Z(x)和 Z(x+h)具有某种程度的相似性,即自相关性。 区域化变量还具有空间局限性、不同程度的连续性 和不同程度的各向异性等特征。 变异分析 r(h) c(h) 变程 (Range) 块金 (Nugget) 偏基台值 (Partial Sill) 变程 (Range) 基台值 (Sill) 偏基台值 (Partial Sill) 基台值 (Sill) 块金 (Nugget) 半变异函数图 距离(h) 协方差函数图 距离(h) 半变异值的变化随着距离的加大而增加,协方差随着距离 的加大而减小。这主要是由于半变异函数和协方差函数都是事 物空间相关系数的表现,当两事物彼此距离较小时,它们应该 是相似的,因此协方差值较大,而半变异值较小;反之,协方 差值较小,而半变异值较大。 空间估值 数据显示 数据检查 1 2 3 4 首先是获取原始数据,检查、 分析数据; 然后选择合适的模型进行表 面预测; 最后检验模型是否合理或几 种模型进行对比。 模型拟合 模型诊断 模型比较 5 空间估值流程图 地统计模型构建流程 ? ? ? 通过探索性空间数据分析 (ESDA) 和变 异分析来检查数据; 构建满足需要的克里金模型 通过执行交叉验证和比较备用模型检查 结果是否准确以选择最佳的一个。 主要内容 一 二 三 四 五 基本统计量 探索性空间数据分析 地统计分析 克里金插值方法 应用案例 克里金插值基础 克里金方法(Kriging)又称空间局部插值法, 是以变异函数理论和结构分析为基础,在有限区 域内对区域化变量进行无偏最优估计的一种方法, 是地统计学的主要内容之一。 实质是利用区域化变量的原始数据和变异函 数的结构特点,对未知样点进行线性无偏、最优 估计。无偏是指偏差的数学期望为0,最优是指 估计值与实际值之差的平方和最小。 克里金插值基础 在克里金插值过程中,需注意以下几点: ? ? ? ? 数据应符合前提假设(随机过程、正态分布、平稳假设) 数据应尽量充分,样本数尽量大于80,每一种距离间隔 分类中的样本对数尽量多于10对 在具体建模过程中,很多参数是可调的,且每个参数对 结果的影响不同。如:块金值:误差随块金值的增大而 增大;基台值:对结果影响不大;变程:存在最佳变程 值;拟合函数:存在最佳拟合函数 当数据足够多时,各种插值方法的效果相差不大。 克里金插值基础 全局性插值: 全局多项式插值 确定性插值 局部性插值 反距离权插值 径向基插值 局部多项式插值 空间插值 普通克里金插值 简单克里金插值 地统计插值 泛克里金插值 概率克里金插值 析取克里金插值 协同克里金插值 空间插值分类体系 普通克里金插值 ? ? 普通克里金(Ordinary Kriging)是区域化变量 的线性估计,它假设数据变化成正态分布,认为 区域化变量Z的期望值是未知的。插值过程类似 于加权滑动平均,权重值的确定来自于空间数据 分析。 ArcGIS中普通克里金插值包括4部分功能: ? ? ? ? 创建预测图(Prediction Map) 创建分位数图(Quantile Map) 创建概率图(Probability Map) 创建标准误差预测图(Prediction Standard Error Map) 简单克里金插值 简单克里金是区域化变量的线性估计,它假 设数据变化成正态分布,认为区域化变量Z的期 望值为已知的某一常数。 ArcGIS中简单克里金插值包括4部分功能: ? ? ? ? 创建预测图(Prediction Map) 创建分位数图(Quantile Map) 创建概率图(Probability Map) 创建标准误差预测图(Prediction Standard Error Map) 泛克里金插值 泛克里金假设数据中存在主导趋势,且该趋势可 以用一个确定的函数或多项式来拟合。在进行泛克里 金分析时: ? ? ? 分析数据中存在的变化趋势,获得拟合模型; 对残差数据(即原始数据减去趋势数据)进行克里金分析; 将趋势面分析和残差分析的克里金结果加和,得到最终结果。 创建预测图(Prediction Map) 创建分位数图(Quantile Map) 创建概率图(Probability Map) 创建标准误差预测图(Prediction Standard Error Map) ArcGIS中泛克里金插值包括4部分功能: ? ? ? ? 指示克里金插值 在很多情况下,并不需要了解区域内每一个 点的属性值,而只需了解属性值是否超过某一阈 值,则可将原始数据转换为(0,1)值,选用指 示克里金法(Indicator Kriging)进行分析。 ArcGIS中指示克里金插值包括2部分功能: 创建概率图(Probability Map) 创建标准误差指示图(Standard Error of Indicator Map) ? ? 析取克里金插值 如果原始数据不服从简单的分布(高斯或对 数正态等),则可选用析取克里金法(Disjunctive Kriging),它可以提供非线性估值方法。 ArcGIS中析取克里金插值包括4部分功能: ? ? ? ? 创建预测图(Prediction Map) 创建概率图(Probability Map) 创建标准误差预测图(Prediction Standard Error Map) 创建标准误差指示图(Standard Error of Indicator Map) 协同克里金插值 ? ? 当同一空间位置样点的多个属性之间存在某个 属性的空间分布与其它属性密切相关,且某些 属性获得不易,而另一些属性则易于获取时, 如果两种属性空间相关,可以考虑选用协同克 里金法。 协同克里金法把区域化变量的最佳估值方法从 单一属性发展到二个以上的协同区域化属性。 但它在计算中要用到两属性各自的半方差函数 和交叉半方差函数,比较复杂。 主要内容 一 二 三 四 五 基本统计量 探索性空间数据分析 地统计分析 克里金插值方法 应用案例 案例背景 美国环境保护局负责监控加利福尼亚州的大气 臭氧浓度。将在该州范围内所分布的多个监测 站对臭氧浓度进行测量。 ?基于已测得的数据, 预测整个州的臭氧分布情况。 Geostatistical Analyst (地统计分析工具) 通过执行以下操作可实现最佳预测: ? 检查所有采样点之间的关系, ? 插值生成臭氧浓度的连续表面 ? 预测的标准误差(不确定性) ? 预测超出临界值的概率 ? ? ? ? ? 探索性数据分析概念 探索性数据分析工具有哪些,功能和特点是什么? 地统计分析概念及理论基础 地统计的模型构建流程 常用的克里金插值方法及各自方法的特点 Box-Cox、反正弦和对数变换 反正弦变换 Y(s) = sin-1(Z(s)), 其中 Z(s) 介于 0 到 1 之间。 ? 用于表示比例或百分比的数据。通常在数据为比例形 式时,方差在接近 0 和 1 时最小,接近 0.5 时最大。 ? 反正弦变换有助于使整个研究区域内的方差更加恒定, 通常还会使数据呈正态分布。 ? Box-Cox、反正弦和对数变换 Box-Cox 变换(幂变换 ) Y(s) = (Z(s)λ - 1)/λ,其中 λ≠ 0 ? 假设数据由某种现象的计数组成。对于这些类型的数 据,方差通常与平均值相关。也就是说,如果在某一 部分研究区域中计数值很小,这一局部区域的变异性 就小于计数值更大的另一区域的变异性。 ? 在这种情况下,平方根变换将有助于使整个研究区域 内的方差更加恒定,通常还会使数据呈正态分布。平 方根变换是 Box-Cox 变换中 λ = ? 时的特例。 ? Box-Cox、反正弦和对数变换 对数变换 Y(s) = ln(Z(s)),其中 Z(s) 0,ln 为自然对数。 ? 对数变换实际上是 Box-Cox 变换中 λ = 0 时的特例 ? 通常用于呈正偏分布的数据,其中有些值非常大。 ? ?汇总关键特征 问题 中心在哪里? 哪个要素的地理位置最便利? 主导方向或方位是什么? 示例 人口中心在哪里以及它如何随时间变化? 新建的支持中心应定址在哪里? 冬季的主要风向是什么? 此地区断层线的朝向如何? 哪个犯罪团伙所涉案的地域最大? 哪种疾病菌株的分布范围最广? 根据动物选择的生活地点,各物种的融合 程度如何? 残骸现场的方位在哪里?残骸的集中区域 在哪里? 要素的分散程度、密集程度或 整合程度如何? 是否存在定向趋势? 标识具有统计显著性的聚类 问题 热点在哪里?冷点在哪里?聚类的 集中程度如何? 异常值在哪里? 如何可以实现最有效的资源调配? 示例 富裕地区与贫困地区之间过渡界限在哪里? 哪里是生物多样性最高且栖息条件最好的地方? 在洛杉矶的哪些地方找到异常的消费模式? 哪里的糖尿病发病率非常高? 哪里的厨房火灾占住宅火灾的比例高于预期值? 白天发生的犯罪案件与夜晚发生的犯罪案件是否 具有相同的空间模式? 避难场所应设置在哪里? 数据库中的哪些犯罪与刚刚发生的犯罪行为最为 相似? 根据空间、时间和征兆判断,哪些疾病事件很可 能属于同一次爆发事件。 哪些位置与问题发生位置相距最远 哪些要素最相似?数据的空间结构 是什么样的? 评估整体空间模式 问题 各空间特征之间是否存在差异 空间模式是否随着时间的推移 而发生变化? 示例 哪一类犯罪的空间聚集度最高? 哪些植物物种的分布在整个研究区域中最为离散? 富裕区和贫困区在空间上是否或多或少地出现隔离? 是否突然存在药品购买高峰? 随着时间推移,该疾病是保持固定在同一个地理位置 ,还是扩散到邻近的地方? 防范措施是否有效? 该疾病的空间模式是否反映出高危人群的空间模式? 商业旺地的空间模式是否与商业设施的空间模式相偏 离? 回归残差是否表现出具有统计显著性的空间自相关? 哪个距离最能反映分析的合适比例? 空间过程彼此之间是否类似 数据在空间上是否相关? 哪个距离上的空间聚类最明显 分组分析 ? ? ? ? 在动物观察方面,了解鲑鱼在不同生命阶段的聚集地点和 时间,了解它们的领地,可以帮助规划保护区,以帮助确 保成功繁育。 作为一名农学家,可能想将研究领域内的不同土壤进行分 类。对通过一系列样本发现的土壤特征使用分组分析可以 帮助识别出明显的、空间上相邻的土壤类型的聚类。 按购买方式、人口统计特征和/或旅行方式对客户进行分组 ,可以帮助您为公司产品制订有效的营销策略。 城市规则师需要将各个城市划分成不同的邻域,以便有效 地定位公共设施、促进地方能动性和提高社区参与度。对 城市街区的物理和人口统计特征使用分组分析,可以帮助 规划师确定具有相似物理和人口统计特征并且在空间上相 邻的城市区域。 关系建模 问题 示例 是否存在相关性?关系的稳固 教育程度与收入之间是什么关系?这种关系在整个研 究区域内是否一致? 程度如何?哪些变量是最一 致的预测因子?这些关系在 财产破坏的行为数与入室盗窃数之间是否存在明确的 整个研究区域是否一致? 关系? 哪些候选解释变量的组合将生成正确指定的回归模型 患病几率是否会随着与水体要素的接近而增加? 哪些因素可能会导致特定结果 有哪些关键可变因素可以解释森林火灾频发的原因? 的发生?还有什么地方可能 哪些人口特征导致了较高的公共交通工具使用率? 有类似的反应? 应对哪些环境群落加以保护以促进濒危物种的再引入 缓解措施在哪里会最有效? 哪些地方的孩子会始终保持高的考试分数?似乎与哪 些特征联系在一起?每个特征分别在哪些地方最 为重要? 哪些因素与高于预期的交通事故的发生比例相关?在 每个事故高发地点,哪些因素是最强的预测因子 关系建模 问题 示例 模式可能会发生什么样的变化 911 报警呼叫的热点在哪里?哪些可变因素可有效 ?我们可以做出哪些准备工 预测呼叫数?鉴于对未来的预测,对应急资源的 作? 预期需求有哪些? 此位置为什么会成为热点?此 位置为什么会成为冷点? 为什么在某些特定区域癌症发病率如此高? 为什么在一些地区的识字率很低? 美国是否有持续发生年轻人早逝的地方?原因是什么 “Voronoi 图”工具提供下列方法来指定或计算面的值: ? 简单:指定给面的值是在该面内的采样点处记录的值。 ? 平均值:指定给面的值是根据面及其相邻面计算出的平 均值。 ? 众数:利用五个组距对所有多边形进行分类。指定给面 的值是面及其相邻面的众数(最常出现的组)。 ? 聚类:利用五个组距对所有多边形进行分类。如果面的 组距与其每个相邻面的组距都不同,则该面将灰显并放 进第六组以区分该面与其相邻面。 ? 熵: 所有的面都利用基于数据值(小分位数)的自然分 组的五个组进行分类。指定给面的值是根据面及其相邻 面计算出的熵。 偏度定义中包括正态分布(偏度 =0),右偏分布(也叫正偏分布 ,其偏度0),左偏分布(也叫 负偏分布,其偏度0)。 峰度包括正态分布(峰度值=3) ,厚尾(峰度值3),瘦尾(峰 度值3),均看尾部


六盒图库管家婆| 香港马会生活幽默图| 香港黄大仙求什么最灵| 凤凰网心水论坛| 百万六合网| 大红鹰大红鹰高手论坛| 白猫图库马经王牌料| 白小结祺袍诗句彩图| 生肖表排码表图| 管家婆天线宝宝彩图|