首页 > 专利 > 杭州电子科技大学 > 一种基于半变异函数的地理空间点数据采样方法专利详情

一种基于半变异函数的地理空间点数据采样方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-08-11

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-12-31

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-09-13

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-08-11

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202110918781.2	申请日	2021-08-11
公开/公告号	CN113792105B	公开/公告日	2022-09-13
授权日	2022-09-13	预估到期日	2041-08-11
申请年	2021年	公开/公告年	2022年
缴费截止日
分类号	G06F16/29 、G06F16/2458 、G06F16/248 、G06T11/20 、G06N7/00	主分类号	G06F16/29
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	2
权利要求数量	3	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	1	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	周志光、郑凤玲、温晋、陈圆圆、刘玉华、苏为华	第一发明人	周志光
地址	浙江省杭州市下沙高教园区2号大街	邮编	310018
申请人数量	1	发明人数量	6
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

杭州君度专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

陈炜

摘要

本发明公开了一种基于半变异函数的地理空间点数据采样方法。本发明方法首先利用半变异函数，捕捉地理空间点数据的地理统计特征，并在采样过程中实时动态统计采样前后半变异函数差异；然后以差异最小化为目标，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点进行替换，实现地理统计特征的保持，采样结果既保持了地理空间点数据的空间分布，又提高了属性插值准确性。本发明方法从空间分布和属性插值两方面进行采样结果的可视化评估与定量比较，通过等高线图增强了采样前后差异的视觉表现。本发明实现了一个用于大规模地理空间点数据的采样模型，使用户能够轻松地通过采样点还原原始数据特征，可视化地探索和分析地理空间。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-09-13	授权
2	2021-12-31	实质审查的生效	IPC(主分类): G06F 16/29 专利申请号: 202110918781.2 申请日: 2021.08.11
3	2021-12-14	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于半变异函数的地理空间点数据采样方法，其特征在于，该方法步骤包括：
步骤(1)使用半变异函数捕捉地理空间点数据的地理统计特征；
步骤(2)利用Z‑order采样生成初始采样点，实时计算采样前后最佳拟合模型的差异，以此构建目标函数，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点进行替换，在保持地理空间点数据空间分布的基础上，优化其地理统计特征的保持，实现采样；
步骤(3)从空间分布和属性插值两个方面进行采样结果的可视化评估与定量比较，并对结果差异进行形状增强的可视化展示；
步骤(1)具体方法是：
(1‑1)对地理空间点数据的经验半变异函数建模：其中，i
和j为欧几里得距离是h的任意两点，γ(h)为i与j之间的平均半方差，N(h)为欧几里得距离是h的所有点对的集合，|N(h)|为N(h)中点对的个数，zi和zj分别是i和j的属性值；
(1‑2)对经验半变异函数进行拟合，计算经验半变异函数与相应拟合模型之间的误差平方和，选择最小误差平方和对应的拟合模型作为最佳拟合模型，以满足各向同性这一要求，最佳拟合模型即表征地理空间点数据的地理统计特征；
步骤(2)具体方法是：
(2‑1)使用Z‑order采样算法，根据采样率生成初始样本集S0，作为当前样本集S；
(2‑2)实时计算采样前后最佳拟合模型的差异，并以此构建目标函数，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点S0进行替换，模拟退火的目标函数：
偏基台值差 Vs‑psill和V0‑psill分别表示当前样本集S和原始地理空间
点数据O的最佳拟合模型的偏基台值；变程值差c2＝|Vs‑range‑V0‑range|，Vs‑range和V0‑range分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的变程值；半方差均方根误差N为经验半变异函数中步长条柱单元的个数，和分别表示当前
样本集S与原始地理空间点数据O的经验半变异函数第n个步长条柱对应的半方差，n＝1,
2,…,N；
(2‑3)以一定概率选取Z‑order子集，随机选取Z‑order子集中的数据点，替换Z‑order子集中的原始采样点，生成新的样本集S′；
(2‑4)根据设定的模拟退火的目标函数c1、c2、c3，决定是否接受新的样本集S′：如果新的样本集S′满足Δc1＜0且Δc3＜0，或者Δc2＜0且Δc3＜0，直接接受新的样本集S′，作为当前样本集S；否则，根据模拟退火算法概率的接受机制，决定是否接受新的样本集S′，如果接受，则将S′作为当前样本集S，否则将上一次的样本集作为当前样本集S；Δc1、Δc2、Δc3分别表示由新的样本集S′计算得到的c1、c2、c3，相对于由当前样本集S计算得到的c1、c2、c3的增量；
(2‑5)重复(2‑3)和(2‑4)，迭代替换，直到新的样本集被连续拒绝次数阈值σ，终止采样进程，σ≥30；以最后一次接受的样本集作为最终采样结果。

2.如权利要求1所述的一种基于半变异函数的地理空间点数据采样方法，其特征在于，步骤(3)具体方法是：
(3‑1)首先，计算评估插值准确性的指标，包括SI‑RMSE和SI‑R；计算评估空间分布保持的KDE errors；计算采样点克里金插值结果与原始属性值之间的绝对差值；
(3‑2)然后，利用热力图映射差异值，通过等高线图的使用，得到形状增强的可视化差异表现。

3.如权利要求1所述的一种基于半变异函数的地理空间点数据采样方法，其特征在于，(2‑3)中选取Z‑order子集的概率为第k个Z‑order子集已经被选择的次数。

说明书

技术领域

[0001] 本发明属于信息技术领域，涉及一种基于半变异函数的地理空间点数据采样方法。

背景技术

[0002] 随着地理空间信息技术的快速发展，地理空间点数据在流行病学、经济学和气候学等领域得到了广泛的收集。散点图通常用于可视化地理空间点数据集，分别用坐标和视觉元素描述空间位置和数据属性。然而，利用大规模地理空间点数据获得的散点图往往存在严重的透支和视觉混乱问题，使其空间分布与属性关系感知困难。为此，许多研究提出了多种考虑数据特征的采样方法来简化大规模地理空间点数据，以缓解散点图的过度绘制问题。例如，Parada‑Mayorga等人设计了一个蓝噪声采样来生成一个可以模拟人类视觉感知的样本集，同时保留原始点的空间密度。Chen等人提出了一种分层多类采样方法来缓解散点图的透支问题，并保留了多类点的相对密度顺序以进行定量分析。Zhou等设计了一种基于属性的采样模型，用于大规模地理空间点数据的视觉抽象，同时保留了数据属性的空间密度和空间自相关性。

[0003] 空间插值是一种应用广泛的空间分析方法，通过空间预测模型，根据空间相似性或地理统计学特征来估计未采样的属性空间。另外，空间插值的精度与采样点的代表性密切相关。因此，利用具有代表性的地理空间点数据进行有效插值是挖掘未知点空间信息、恢复原始数据特征的关键。然而，传统的采样方法没有很好地考虑属性的插值因素，这将为空间数据挖掘带来较大的不确定性，如发现有价值的模式等。经过与领域专家的密切讨论，他们提出了有效地保留数据属性的地理统计学特征，对提高插值结果精度的有益性。因此，生成具有良好地理统计特征的样本集对于大规模地理空间点数据的简化和后续的地理空间分析非常重要。然而，在采样过程中考虑空间插值仍存在三个技术问题：(1)如何表征属性的地理统计学特征，以实时动态约束采样过程，生成更适合空间插值的点；(2)如何定义一个基于半变异函数的采样模型，在保持地理空间点数据空间分布的基础上，进一步保证属性插值结果的准确性；(3)如何评估采样结果在保持空间分布与插值质量上的有效性。

发明内容

[0004] 本发明的目的是提供一种基于半变异函数的地理空间点数据采样方法。

[0005] 为实现上述目的，本发明采取的技术方案是：

[0006] 步骤(1)使用半变异函数捕捉地理空间点数据的地理统计特征；

[0007] 步骤(2)利用Z‑order采样生成初始采样点，实时计算采样前后半变异函数的差异，以此构建目标函数，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点进行替换，在保持地理空间点数据空间分布的基础上，优化其地理统计特征的保持，实现采样；

[0008] 步骤(3)从空间分布和属性插值两个方面进行采样结果的可视化评估与定量比较，并对结果差异进行形状增强的可视化展示。

[0009] 进一步，步骤(1)具体方法是：

[0010] (1‑1)对地理空间点数据的经验半变异函数建模：其中，i和j为欧几里得距离是h的任意两点，γ(h)为i与j之间的平均半方差，N(h)为欧几里得距离是h的所有点对的集合，|N(h)|为N(h)中点对的个数，zi和zj分别是i和j的属性值；

[0011] (1‑2)计算经验半变异函数与拟合模型之间的误差平方和，选择最小误差平方和对应的拟合模型作为最佳拟合模型，以满足各向同性这一要求，最佳拟合模型即表征地理空间点数据的地理统计特征。

[0012] 又进一步，步骤(2)具体方法是：

[0013] (2‑1)使用Z‑order采样算法，根据采样率生成初始样本集S0，作为当前样本集S；

[0014] (2‑2)实时计算采样前后最佳拟合模型的差异，并以此构建目标函数，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点S0进行替换，模拟退火的目标函数：

[0015] 偏基台值差c1＝|Vs‑psill‑V0‑psill|，Vs‑psill和V0‑psill分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的偏基台值；变程值差c2＝|Vs‑range‑V0‑range|，Vs‑range和V0‑range分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的变程值；半方差均方根误差 N为经验半变异函数中步长条柱单元的个数，和分别表示当前样本集S与原始地理空间点数据O的经验半变异函数第n个步长条柱对应的半方差，n＝1,2,…,N；

[0016] (2‑3)轮盘赌选取Z‑order子集，随机选取Z‑order子集中的数据点，替换Z‑order子集中的原始采样点，生成新的样本集S′；

[0017] 轮盘赌选取Z‑order子集的概率为第k个Z‑order子集已经被选择的次数；

[0018] (2‑4)根据设定的模拟退火的目标函数c1、c2、c3，决定是否接受新的样本集S′：如果新的样本集S′满足Δc1＜0且Δc3＜0，或者Δc2＜0且Δc3＜0，直接接受新的样本集S′，作为当前样本集S；否则，根据模拟退火算法概率的接受机制，决定是否接受新的样本集S′，如果接受，则将S′作为当前样本集S，否则将上一次的样本集作为当前样本集S；Δc1、Δc2、Δc3分别表示由新的样本集S′计算得到的c1、c2、c3，相对于由当前样本集S计算得到的c1、c2、c3的增量；

[0019] (2‑5)重复(2‑3)和(2‑4)，迭代替换，直到新的样本集被连续拒绝次数阈值σ，终止采样进程，σ≥30；以最后一次接受的样本集作为最终采样结果。

[0020] 更进一步，步骤(3)具体方法是：

[0021] (3‑1)首先，计算评估插值准确性的指标，包括SI‑RMSE(插值结果与原始数据之间的均方根误差)和SI‑R(插值结果与原始数据之间的相关系数)；计算评估空间分布保持的KDE errors(核密度估计误差)；计算采样点克里金插值结果与原始属性值之间的绝对差值；

[0022] (3‑2)然后，利用热力图映射差异值，通过等高线图的使用，得到形状增强的可视化差异表现。

[0023] 本发明的有益效果是：本发明方法利用半变异函数，捕捉地理空间点数据的地理统计特征，并在采样过程中实时动态地统计采样前后的半变异函数差异；然后以差异最小化为目标，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点进行替换，进而实现地理统计特征的保持，使得采样结果既保持了地理空间点数据的空间分布，又实现了属性插值准确性的提高。此外，从空间分布和属性插值两方面进行采样结果的可视化评估与定量比较，并通过等高线图的使用，从形状方面增强采样前后差异的视觉表现，进而直观地评估和比较本采样方法。本发明方法实现了一个用于大规模地理空间点数据的采样模型，使用户能够轻松地通过采样点还原原始数据特征，可视化地探索和分析地理空间。

实施方案

[0028] 以下结合附图和具体实施例，对本发明作详细的说明。

[0029] 如图1所示，一种基于半变异函数的地理空间点数据采样方法，具体步骤是：

[0030] 步骤(1)使用半变异函数捕捉地理空间点数据的地理统计特征；该方法利用作为插值模型的前提和重要输入的半变异函数来表征地理统计特征，从而通过地理统计特征的保持，实现插值质量的提高。具体方法是：

[0031] (1‑1)对地理空间点数据的经验半变异函数建模：其中，i和j为欧几里得距离是h的任意两点，γ(h)为i与j之间的平均半方差，N(h)为欧几里得距离是h的所有点对的集合，|N(h)|为N(h)中点对的个数，zi和zj分别是i和j的属性值；

[0032] (1‑2)计算经验半变异函数与拟合模型之间的误差平方和，选择最小误差平方和对应的拟合模型作为最佳拟合模型，以满足各向同性这一要求，最佳拟合模型即表征地理空间点数据的地理统计特征。

[0033] 步骤(2)利用Z‑order采样生成初始采样点，实时计算采样前后半变异函数的差异，以此构建目标函数，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点进行替换，在保持地理空间点数据空间分布的基础上，优化其地理统计特征的保持，进而实现插值质量的提高，实现采样。具体方法如图2所示：

[0034] (2‑1)使用Z‑order采样算法，根据采样率生成初始样本集S0，作为当前样本集S；

[0035] (2‑2)实时计算采样前后最佳拟合模型的差异，并以此构建目标函数，驱动模拟退火优化算法，对Z‑order采样生成的初始采样点S0进行替换，模拟退火的目标函数：

[0036] 模拟退火的目标函数：偏基台值差c1＝|Vs‑psill‑V0‑psill|，Vs‑psill和V0‑psill分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的偏基台值；变程值差c2＝|Vs‑range‑V0‑range|，Vs‑range和V0‑range分别表示当前样本集S和原始地理空间点数据O的最佳拟合模型的变程值；半方差均方根误差 N为经验半变异函数中步长条柱单元的个数，和分别表示当前样本集S与原始地理空间点数据O的经验半变异函数第n个步长条柱对应的半方差，n＝1,2,…,N；

[0037] (2‑3)轮盘赌选取Z‑order子集，随机选取Z‑order子集中的数据点，替换Z‑order子集中的原始采样点，生成新的样本集S′；

[0038] 轮盘赌选取Z‑order子集的概率为第k个Z‑order子集已经被选择的次数；

[0039] (2‑4)根据设定的模拟退火的目标函数c1、c2、c3，决定是否接受新的样本集S′：如果新的样本集S′满足Δc1＜0且Δc3＜0，或者Δc2＜0且Δc3＜0，直接接受新的样本集S′，作为当前样本集S；否则，根据模拟退火算法概率的接受机制，决定是否接受新的样本集S′，如果接受，则将S′作为当前样本集S，否则将上一次的样本集作为当前样本集S；Δc1、Δc2、Δc3分别表示由新的样本集S′计算得到的c1、c2、c3，相对于由当前样本集S计算得到的c1、c2、c3的增量；

[0040] (2‑5)重复(2‑3)和(2‑4)，迭代替换，直到新的样本集被连续拒绝次数阈值σ，终止采样进程，σ≥30，本实施例中拒绝次数阈值为30次；以最后一次接受的样本集作为最终采样结果。

[0041] 可以看出，通过Z‑order采样产生的初始解和限制在Z‑order子集内的替换点的操作，使得原始地理空间点数据的空间分布能够很好地保持；此外，将模拟退火的评估函数设置为上述的c1、c2和c3，可以将搜索过程引向好的解，从而最小地理统计特征变化。因此，该方法生成的采样点能够在保持空间分布的基础上，实现插值质量的提高。

[0042] 步骤(3)从空间分布和属性插值两个方面进行采样结果的可视化评估与定量比较，并对结果差异进行形状增强的可视化展示。具体方法是：

[0043] (3‑1)首先，计算评估插值准确性的指标，包括SI‑RMSE(插值结果与原始数据之间的均方根误差，参考文献：Radar Rainfall Estimates Comparison with Kriging Interpolation of Gauged Rain)、SI‑R(插值结果与原始数据之间的相关系数，参考文献：Detection of interpolation using correlation coefficients)；

[0044] 计算评估空间分布保持的KDE errors(核密度估计误差，参考文献：Quality and efficiency for kernel density estimates in large data)；

[0045] 计算采样点克里金插值结果与原始属性值之间的绝对差值；

[0046] (3‑2)然后，利用热力图映射差异值，通过等高线图的使用，得到形状增强的可视化差异表现。

[0047] 基于本发明提出的采样方法，采样结果不仅保持了地理空间点数据的空间分布，而且提高了属性插值的准确性。为了说明该方法的有效性，分别从空间分布和属性插值两个方面对采样结果进行可视化评估与定量比较。但是，用于评估的传统热力图，在大规模散点图本身就存在过度绘制的情况下，差异的视觉表现力明显下降。因此，该方法设计了一种形状增强的可视化评估优化方案：首先，计算采样点克里金插值结果与原始属性值之间的绝对差值；然后，使用等高线图，映射绝对差值，得到形状增强的可视化差异表现。

[0048] 如图3所示，等高线图的使用带来两个好处：一是避免了大规模散点图高密度区域的视觉混乱，二是形状的融合增强了差异的视觉表现。从图4的(a)、(b)、(c)和(d)、(e)、(f)的对比中，可以看出形状优化后的差异评估具有更好的视觉感知效果。

[0049] 该方法有效性评估如下：

[0050] 通过定量比较与可视化评估来说明我们所提出的基于半变异函数的地理空间点数据采样方法的有效性。采用3个地理空间点数据集(D1、D2、D3)进行评价。如下表所示，将采样方法(以“OUR”表示)与Z‑order采样(以“ZS”表示)、随机采样(以“RS”表示)这两种具有普适性和权威性的采样方法进行了比较。

[0051]

[0052] 在1％、5％和10％三种采样率下，使用以上三个个指标：插值结果与原始数据之间的均方根误差(SI‑RMSE)与相关系数(SI‑R)以及评估空间分布保持的KDE errors来比较不同方法的采样结果。从表中可以看出，该方法在不同采样率下，SI‑RMSE值都优于其他方法，而SI‑R的值也仅有一个是差于ZS，KDE errors与ZS的结果类似，且更大概率优于ZS，而ZS被认为能够有效保持地理点的空间分布。这表明，本发明方法的采样结果不仅保持了原始地理空间点数据的空间分布，而且更好地保持了空间插值的准确性。

[0053] 如图3所示，从KDE热力图中可以直观地看出，本发明方法的采样结果在空间分布的保持上与ZS采样类似，并且在一些区域上还要优于ZS，这表明本发明方法能够实现地理空间点数据空间分布的保持。

[0054] 如图4中的(d)、(e)、(f)所示，该方法利用克里金插值对本发明方法、Z‑order采样以及随机采样的采样结果进行插值，同时利用等高线图来可视化地展示插值结果与原始数据之间的差异，从图中可以看出，该方法采样点的插值结果与原始数据之间的差异最小，特别是在高亮出的区域A、B、C处，由此说明本发明方法的采样结果能够在保持地理空间点数据空间分布的基础上，更好地提高属性插值结果的准确性。

附图说明

[0024] 图1为本发明的整体流程示意图；

[0025] 图2为本发明中对原始地理空间点数据进行采样示意图；

[0026] 图3为本发明中空间分布评估示意图；

[0027] 图4为本发明中插值结果评估示意图。

1信息控制系统 2信息处理器件 3一种信息通信用理线夹 4便携式信息终端 5权证基础信息系统 6低成本机器通信用户设备及信道状态信息上报方法、基站及信道状态信息处理方法 7一种临时信息咨询台 8计算机信息防盗装置 9一种临时信息咨询台 10一种临时信息咨询台