[0028] 以下结合附图和具体实施例,对本发明作详细的说明。
[0029] 如图1所示,一种基于半变异函数的地理空间点数据采样方法,具体步骤是:
[0030] 步骤(1)使用半变异函数捕捉地理空间点数据的地理统计特征;该方法利用作为插值模型的前提和重要输入的半变异函数来表征地理统计特征,从而通过地理统计特征的保持,实现插值质量的提高。具体方法是:
[0031] (1‑1)对地理空间点数据的经验半变异函数建模: 其中,i和j为欧几里得距离是h的任意两点,γ(h)为i与j之间的平均半方差,N(h)为欧几里得距离是h的所有点对的集合,|N(h)|为N(h)中点对的个数,zi和zj分别是i和j的属性值;
[0032] (1‑2)计算经验半变异函数与拟合模型之间的误差平方和,选择最小误差平方和对应的拟合模型作为最佳拟合模型,以满足各向同性这一要求,最佳拟合模型即表征地理空间点数据的地理统计特征。
[0033] 步骤(2)利用Z‑order采样生成初始采样点,实时计算采样前后半变异函数的差异,以此构建目标函数,驱动模拟退火优化算法,对Z‑order采样生成的初始采样点进行替换,在保持地理空间点数据空间分布的基础上,优化其地理统计特征的保持,进而实现插值质量的提高,实现采样。具体方法如图2所示:
[0034] (2‑1)使用Z‑order采样算法,根据采样率生成初始样本集S0,作为当前样本集S;
[0035] (2‑2)实时计算采样前后最佳拟合模型的差异,并以此构建目标函数,驱动模拟退火优化算法,对Z‑order采样生成的初始采样点S0进行替换,模拟退火的目标函数:
[0036] 模拟退火的目标函数:偏基台值差c1=|Vs‑psill‑V0‑psill|,Vs‑psill和V0‑psill分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的偏基台值;变程值差c2=|Vs‑range‑V0‑range|,Vs‑range和V0‑range分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的变程值;半方差均方根误差 N为经验半变异函数中步长条柱单元的个数, 和 分别表示当前样本集S与原始地理空间点数据O的经验半变异函数第n个步长条柱对应的半方差,n=1,2,…,N;
[0037] (2‑3)轮盘赌选取Z‑order子集,随机选取Z‑order子集中的数据点,替换Z‑order子集中的原始采样点,生成新的样本集S′;
[0038] 轮盘赌选取Z‑order子集的概率 为第k个Z‑order子集已经被选择的次数;
[0039] (2‑4)根据设定的模拟退火的目标函数c1、c2、c3,决定是否接受新的样本集S′:如果新的样本集S′满足Δc1<0且Δc3<0,或者Δc2<0且Δc3<0,直接接受新的样本集S′,作为当前样本集S;否则,根据模拟退火算法概率的接受机制,决定是否接受新的样本集S′,如果接受,则将S′作为当前样本集S,否则将上一次的样本集作为当前样本集S;Δc1、Δc2、Δc3分别表示由新的样本集S′计算得到的c1、c2、c3,相对于由当前样本集S计算得到的c1、c2、c3的增量;
[0040] (2‑5)重复(2‑3)和(2‑4),迭代替换,直到新的样本集被连续拒绝次数阈值σ,终止采样进程,σ≥30,本实施例中拒绝次数阈值为30次;以最后一次接受的样本集作为最终采样结果。
[0041] 可以看出,通过Z‑order采样产生的初始解和限制在Z‑order子集内的替换点的操作,使得原始地理空间点数据的空间分布能够很好地保持;此外,将模拟退火的评估函数设置为上述的c1、c2和c3,可以将搜索过程引向好的解,从而最小地理统计特征变化。因此,该方法生成的采样点能够在保持空间分布的基础上,实现插值质量的提高。
[0042] 步骤(3)从空间分布和属性插值两个方面进行采样结果的可视化评估与定量比较,并对结果差异进行形状增强的可视化展示。具体方法是:
[0043] (3‑1)首先,计算评估插值准确性的指标,包括SI‑RMSE(插值结果与原始数据之间的均方根误差,参考文献:Radar Rainfall Estimates Comparison with Kriging Interpolation of Gauged Rain)、SI‑R(插值结果与原始数据之间的相关系数,参考文献:Detection of interpolation using correlation coefficients);
[0044] 计算评估空间分布保持的KDE errors(核密度估计误差,参考文献:Quality and efficiency for kernel density estimates in large data);
[0045] 计算采样点克里金插值结果与原始属性值之间的绝对差值;
[0046] (3‑2)然后,利用热力图映射差异值,通过等高线图的使用,得到形状增强的可视化差异表现。
[0047] 基于本发明提出的采样方法,采样结果不仅保持了地理空间点数据的空间分布,而且提高了属性插值的准确性。为了说明该方法的有效性,分别从空间分布和属性插值两个方面对采样结果进行可视化评估与定量比较。但是,用于评估的传统热力图,在大规模散点图本身就存在过度绘制的情况下,差异的视觉表现力明显下降。因此,该方法设计了一种形状增强的可视化评估优化方案:首先,计算采样点克里金插值结果与原始属性值之间的绝对差值;然后,使用等高线图,映射绝对差值,得到形状增强的可视化差异表现。
[0048] 如图3所示,等高线图的使用带来两个好处:一是避免了大规模散点图高密度区域的视觉混乱,二是形状的融合增强了差异的视觉表现。从图4的(a)、(b)、(c)和(d)、(e)、(f)的对比中,可以看出形状优化后的差异评估具有更好的视觉感知效果。
[0049] 该方法有效性评估如下:
[0050] 通过定量比较与可视化评估来说明我们所提出的基于半变异函数的地理空间点数据采样方法的有效性。采用3个地理空间点数据集(D1、D2、D3)进行评价。如下表所示,将采样方法(以“OUR”表示)与Z‑order采样(以“ZS”表示)、随机采样(以“RS”表示)这两种具有普适性和权威性的采样方法进行了比较。
[0051]
[0052] 在1%、5%和10%三种采样率下,使用以上三个个指标:插值结果与原始数据之间的均方根误差(SI‑RMSE)与相关系数(SI‑R)以及评估空间分布保持的KDE errors来比较不同方法的采样结果。从表中可以看出,该方法在不同采样率下,SI‑RMSE值都优于其他方法,而SI‑R的值也仅有一个是差于ZS,KDE errors与ZS的结果类似,且更大概率优于ZS,而ZS被认为能够有效保持地理点的空间分布。这表明,本发明方法的采样结果不仅保持了原始地理空间点数据的空间分布,而且更好地保持了空间插值的准确性。
[0053] 如图3所示,从KDE热力图中可以直观地看出,本发明方法的采样结果在空间分布的保持上与ZS采样类似,并且在一些区域上还要优于ZS,这表明本发明方法能够实现地理空间点数据空间分布的保持。
[0054] 如图4中的(d)、(e)、(f)所示,该方法利用克里金插值对本发明方法、Z‑order采样以及随机采样的采样结果进行插值,同时利用等高线图来可视化地展示插值结果与原始数据之间的差异,从图中可以看出,该方法采样点的插值结果与原始数据之间的差异最小,特别是在高亮出的区域A、B、C处,由此说明本发明方法的采样结果能够在保持地理空间点数据空间分布的基础上,更好地提高属性插值结果的准确性。