首页 > 专利 > 杭州电子科技大学 > 一种凸规划聚类水污染溯源方法专利详情

一种凸规划聚类水污染溯源方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2018-06-22
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-01-15
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2022-01-07
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2038-06-22
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201810649092.4 申请日 2018-06-22
公开/公告号 CN109063730B 公开/公告日 2022-01-07
授权日 2022-01-07 预估到期日 2038-06-22
申请年 2018年 公开/公告年 2022年
缴费截止日
分类号 G06K9/62G06Q50/06 主分类号 G06K9/62
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 2
权利要求数量 3 非专利引证数量 1
引用专利数量 0 被引证专利数量 0
非专利引证 1、CN 107341341 A,2017.11.10CN 106157243 A,2016.11.23朱剑“.基于移动平台的水域突发污染溯源研究”《.中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》.2014,(第10期),李娇“.视觉特征结合映射模型学习的行人再识别算法研究”《.中国优秀硕士学位论文全文数据库 信息科技辑》.2018,(第04期),Yize Chen et al.“.Optimal Control ViaNeural Networks:A Convex Approach”. 《arXiv》.2018,Srivastava et al..“BreakthroughCurves Characterzation and Identificationof an Unknown Pollution Source inGroundwater Using an Artificial NeuralNetwork(ANN)”《.Environmental Forensics》.2014,龙玉桥 等.“地下水污染物溯源的数字模拟方法研究进展”《.地下水》.2017,第39卷(第1期),;
引用专利 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 郭春生、林翰闻、蔡蒙、杨萌 第一发明人 郭春生
地址 浙江省杭州市经济技术开发区白杨街道2号大街1158号 邮编 310018
申请人数量 1 发明人数量 4
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
浙江千克知识产权代理有限公司 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
周希良
摘要
本发明提供一种凸规划聚类水污染溯源方法,包括:基于Siamese网络的邻近点相似度描述样本;利用所述邻近节点相似度抽取水污染溯源特征;将所述水污染溯源特征结合监测网络节点的地理分布信息,构造图模型;将水污染溯源等价于所述图模型的全局优化分割,将所述图模型的全局优化分割转换为最小传导率;最大化特征基内接椭球体的凸规划,实现多类水污染的同时溯源。本发明在水污染检测网络中对水污染进行溯源,利用全光谱指纹图谱的相似度,并结合江河湖泊水流的连通性和单向性构建图模型,将水污染溯源等价于网络图模型上的全局优化分割问题,既有效地规避的类别数多或类别样本数量不足的问题,又能够充分利用全光谱指纹图谱的丰富信息。
  • 摘要附图
    一种凸规划聚类水污染溯源方法
  • 说明书附图:图1
    一种凸规划聚类水污染溯源方法
  • 说明书附图:图2
    一种凸规划聚类水污染溯源方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2022-01-07 授权
2 2019-01-15 实质审查的生效 IPC(主分类): G06K 9/62 专利申请号: 201810649092.4 申请日: 2018.06.22
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种凸规划聚类水污染溯源方法,其特征在于,包括以下步骤:
S1,基于Siamese网络的邻近点相似度描述样本;步骤S1具体为:定义一组样本对(x1,x2),作为Siamese网络的输入值,样本对标签为y;当样本对属于相同类别时,样本对标签y=1;反之,样本对标签y=0;
针对两个输入x1和x2,网络低维空间的相似度输出结果分别为GW(x1)和GW(x2),Siamese网络的相似度损失函数定义为:
L(W;x1,x2,y)=yL1(W;x1,x2)+(1‑y)L2(W;x1,x2)
2 2
式中L1(W;x1,x2)=||GW(x1)‑GW(x2)|| ,L2(W;x1,x2)=max(c‑||GW(x1)‑GW(x2)|| ,0);W为Siamese网络参数,常数c定义为相似度的最大值
S2,利用所述邻近点相似度抽取水污染溯源特征;步骤S2具体包括:
S21,定义溯源特征变换网络的损失函数为:
式中θ表示变换网络y=Fθ(x)的参数,w(xi,xj)是由Siamese网络输入xi和xj计算得到的相似度;
d
S22,抽取m个样本x1,...,xm∈R ,构成一个m×d的矩阵X,设对应的溯源特征为一个m×k的矩阵Y,正交化约束描述为:
其中Ik×k是一个k阶单位阵;
正交化层表示为 其中L从 的Cholesky分解中获得, 用来满足正
交化约束;
S23,进行网络训练过程,具体包括前向计算过程和反向计算过程;
所述前向计算过程为:
随机选择m个数据构成数据批X;
前向网络计算,得到网络归一化层输入
计算Cholesky分解
设置网络归一化层权系数为 并计算输出
所述反向计算过程为:
利用Siamese网络计算输入数据对的相似度;
计算溯源特征变换网络的损失函数;
反向传播,更新除归一化层之外的全部网络参数;
S3,将所述水污染溯源特征结合监测网络节点的地理分布信息,构造图模型;将水污染溯源等价于所述图模型的全局优化分割,将所述图模型的全局优化分割转换为最小传导率;步骤S3的具体为:
利用所述溯源特征结合监测网络节点的地理分布信息,构造一个图模型G=(V,E),其中节点集V对应监测网络节点,边沿集E由相邻节点(vi,vj)和连接权值wi,j集合构成,wi,j的定义为:
wi,j=||Yi‑Yj||2
其中节点i和节点j在地理邻域范围之内;
根据所述图模型G,将水污染的溯源等效于图模型的全局优化分割,设节点集S是图模型节点集V的一个子集,定义节点集S的传导率为:
其中 V\S表示集合S在集合V上的补
集;
将图模型的全局优化分割转换为最小传导率,表示为:
其中k是分割区域数,S1S2∪…∪Sk=V;
S4,最大化特征基内接椭球体的凸规划,求解所述最小传导率。

2.如权利要求1所述的方法,其特征在于:步骤4具体计算过程为:
S41,将溯源特征的基分为多个类别,每个类别的代表基表示为:
min[‑logdetX]
T
满足条件:pXp≤1,X>0,正定,任意p∈S,其中S==[p1,p2,…pn];
k
S42,计算拉普拉斯矩阵L最小k个特征值对应的特征矢量f1,f2,…,fk,构造矩阵P∈R×n T
,P=[f1,f2,…,fk],矩阵P的列向量表示为p1,p2,…pn;
S43,确定矩阵P列向量p1,p2,…pn以原点为中心的最小封闭区域H(S),根据最小封闭区域边界上的列向量点构造分类指示标记集I=[i1,i2,…,ik],其中i1表示 属于节点集T1,i2表示 属于节点集T2;
S44,归一化处理 初始化节点分类集{T1,T2,…,Tk}为
空集,根据分类指示标记集I=[i1,i2,…,ik],计算:
a)选择 计算 确定极大值对应列向量pj;
b)更新
输出节点分类集{T1,T2,…,Tk}。

3.根据权利要求2所述的方法,其特征在于:步骤S43中,如果边界上的列向量点大于k个,使用连续投影算法选择k个在k‑1维子空间上投影范数最小的边界上的列向量点。
说明书

技术领域

[0001] 本发明属于水污染溯源技术领域,尤其涉及一种凸规划聚类水污染溯源方法。

背景技术

[0002] 水资源是人类生产生活的最关键资源,如今,生态环境遭到严重破坏,水体污染严重,水资源的保护和水污染的治理成为现代社会最关注的问题。而且,随着城市化和经济社会发展,水资源问题更加严峻,成为我国可持续发展的重要制约因素。然而大量水域被污染,这更加加工了水资源短缺的现状,其中污染源投多是企业偷拍超标废水引起,为了能够有效防控水污染事件的发生,需要加强对企业排污的监管力度和监管技术。
[0003] 水污染溯源就是确定污染源头,现有的水污染溯源计算方法包括因子分析、聚类分析和层析分析三种,其中,聚类分析是将样品或变量按照它们性质上的亲疏程度进行分类的多元统计分析方法。聚类分析的目的是根据已知数据,计算各观察个体或变量之间亲疏关系的统计量,根据最短距离法、最长距离法、中间距离法和重心法等准则,使同一类内的差别较小,而类与类之间的差别较大,最终将观察个体或变量分为若干类。然而,现有的水污染溯源聚类分析方法,不能准确定位到发生污染概率最大的污染源,为水污染环境监控中心提供的数据不够准确。

发明内容

[0004] 基于上述现有技术存在的缺陷,本发明提出一种凸规划聚类水污染溯源方法,以准确定位发生污染概率最大的污染源,为水污染环境监控提供准确数据。
[0005] 为实现本发明的目的,本发明采用如下技术方案:
[0006] 一种凸规划聚类水污染溯源方法,包括以下步骤:
[0007] S1,基于Siamese网络的邻近点相似度描述样本;
[0008] S2,利用所述邻近节点相似度抽取水污染溯源特征;
[0009] S3,将所述水污染溯源特征结合监测网络节点的地理分布信息,构造图模型;将水污染溯源等价于所述图模型的全局优化分割,将所述图模型的全局优化分割转换为最小传导率;
[0010] S4,最大化特征基内接椭球体的凸规划,求解所述最小传导率。
[0011] 进一步地,步骤S1具体为:
[0012] 定义一组样本对(x1,x2),作为Siamese网络的输入值,样本对标签为y;当样本对属于相同类别时,样本对标签y=1;反之,样本对标签y=0;
[0013] 针对两个输入x1和x2,网络低维空间的相似度输出结果分别为GW(x1)和GW(x2),Siamese网络的相似度损失函数定义为:
[0014] L(W;x1,x2,y)=yL1(W;x1,x2)+(1‑y)L2(W;x1,x2)
[0015] 式中L1(W;x1,x2)=||GW(x1)‑GW(x2)||2,L2(W;x1,x2)=max(c‑||GW(x1)‑GW(x2)||2,0);W为Siamese网络参数,常数c定义为相似度的最大值。
[0016] 进一步地,步骤S2具体包括:
[0017] S21,定义溯源特征变换网络的损失函数为:
[0018]
[0019] 式中θ表示变换网络y=Fθ(x)的参数,w(xi,xj)是由所述Siamese网络输入xi和xj计算得到的相似度;
[0020] S22,抽取m个样本x1,...,xm∈Rd,构成一个m×d的矩阵X,设对应的溯源特征为一个m×k的矩阵Y,正交化约束描述为:
[0021]
[0022] 其中Ik×k是一个k阶单位阵;
[0023] 正交化层表示为 其中L从 的Cholesky分解中获得, 用来满足正交化约束;
[0024] S23,进行网络训练过程,具体包括前向计算过程和反向计算过程;
[0025] 所述前向计算过程为:
[0026] 随机选择m个数据构成数据批X;
[0027] 前向网络计算,得到网络归一化层输入
[0028] 计算Cholesky分解
[0029] 设置网络归一化层权系数为 并计算输出
[0030] 所述反向计算过程为:
[0031] 利用Siamese网络计算输入数据对的相似度;
[0032] 计算溯源特征变换网络的损失函数;
[0033] 反向传播,更新除归一化层之外的全部网络参数。
[0034] 进一步地,步骤S3的具体为:
[0035] 利用所述溯源特征结合监测网络节点的地理分布信息,构造一个图模型G=(V,E),其中节点集V对应监测网络节点,边沿集E由相邻节点(vi,vj)和连接权值wi,j集合构成,wi,j的定义为:
[0036] wi,j=||Yi‑Yj||2
[0037] 其中节点i和节点j在地理邻域范围之内;
[0038] 根据所述图模型G,将水污染的溯源等效于图模型的全局优化分割,设节点集S是图模型节点集V的一个子集,定义节点集S的传导率为:
[0039]
[0040] 其中 V\S表示集合S在集合V上的补集;
[0041] 将图模型的全局优化分割转换为最小传导率,表示为:
[0042]
[0043] 其中k是分割区域数,S1∪S2∪…∪Sk=V。
[0044] 进一步地,所述步骤4具体计算过程为:
[0045] S41,将溯源特征的基分为多个类别,每个类别的代表基表示为:
[0046] min[‑log det X]
[0047] 满足条件:pTXp≤1,X>0(正定),任意 其中
[0048] S42,计算拉普拉斯矩阵L最小k个特征值对应的特征矢量f1,f2,…,fk,构造矩阵TP=[f1,f2,…,fk],矩阵P的列向量表示为p1,p2,…pn;
[0049] S43,确定矩阵P列向量p1,p2,…pn以原点为中心的最小封闭区域 根据最小封闭区域边界上的列向量点构造分类指示标记集I=[i1,i2,…,ik],其中i1表示 属于节点集T1,i2表示 属于节点集T2;
[0050] S44,归一化处理 i=1,2,…,n,初始化节点分类集{T1,T2,…,Tk}为空集,根据分类指示标记集I=[i1,i2,…,ik],计算:
[0051] a)选择 计算 确定极大值对应列向量pj;
[0052] b)更新
[0053] 输出节点分类集{T1,T2,…,Tk}。
[0054] 进一步地,所述步骤S43中,如果边界上的列向量点大于k个,使用连续投影算法选择k个在k‑1维子空间上投影范数最小的边界上的列向量点。
[0055] 相对于现有技术,本发明具有以下优点:
[0056] 本发明在水污染检测网络中对水污染进行溯源,利用全光谱指纹图谱的相似度,并结合江河湖泊水流的连通性和单向性构建图模型,将水污染溯源等价于网络图模型上的全局优化分割问题。提出利用最小传导率问题的近似解决方法,通过最大化特征基内接椭球体的凸规划问题,实现多类水污染的同时溯源,既有效地规避的类别数多或类别样本数量不足的问题,又能够充分利用全光谱指纹图谱的丰富信息。

实施方案

[0060] 为了使本领域技术人员更好地理解本发明的技术方案,下面将结合具体的实施方式,对本发明进行详细地介绍说明。
[0061] 本发明所述凸规划聚类水污染溯源方法,包括如下步骤:
[0062] S1,基于Siamese网络的邻近点相似度描述样本;
[0063] S2,利用所述邻近节点相似度抽取水污染溯源特征;
[0064] S3,将所述水污染溯源特征结合监测网络节点的地理分布信息,构造图模型;将水污染溯源等价于所述图模型的全局优化分割,将所述图模型的全局优化分割转换为最小传导率;
[0065] S4,最大化特征基内接椭球体的凸规划,求解所述最小传导率。
[0066] Siamese网络是一种相似性度量方法,即便是每个类别只有少数几个样本,但不同河段和区域的观测样本对都可以用于Siamese网络相似性度量的训练,这样Siamese网络获取的观测样本对相似度数值就可以为水污染预警提供一种可行途径。
[0067] 如图1所示为Siamese网络邻近监测节点的全光谱指纹图谱,Siamese网络的基本思想是通过网络将输入映射到目标空间,在目标空间使用简单的距离(欧式距离等)进行对比相似度。在训练阶段最小化来自相同类别的样本对损失函数值,最大化来自不同类别的样本对损失函数值。由于利用抽象的相似性度量代替具体的样本正常(不存在水污染)与异常(存在水污染),既有效地规避的类别数多或类别样本数量不足的问题,又能够充分利用全光谱指纹图谱的丰富信息。
[0068] 如图2所示Siamese网络结构图,左右两个网络是完全相同的网络结构,它们共享相同的网络权值。这个网络主要的优点是淡化了标签,使得网络具有很好的扩展性,可以对那些没有训练过的类别进行分类,这点是优于很多算法的。而且这个算法对一些小数据量的数据集也适用,变相的增加了整个数据集的大小,使得数据量相对较小的数据集也能用深度网络训练出不错的效果。
[0069] 本实施例中,步骤S1具体为:
[0070] 定义一组样本对(x1,x2),作为Siamese网络的输入值,样本对标签为y;当样本对属于相同类别时,样本对标签y=1;反之,样本对标签y=0;
[0071] 针对两个输入x1和x2,网络低维空间的相似度输出结果分别为GW(x1)和GW(x2),Siamese网络的相似度损失函数定义为:
[0072] L(W;x1,x2,y)=yL1(W;x1,x2)+(1‑y)L2(W;x1,x2)  (1)
[0073] 式中L1(W;x1,x2)=||GW(x1)‑GW(x2)||2,L2(W;x1,x2)=max(c‑||GW(x1)‑GW(x2)||2,0);W为Siamese网络参数,常数c定义为相似度的最大值,通常取值为1。
[0074] 水质检测传感器获取的数据,由于各种非线性因素的影响区分度并不理想,无法直接用于作为水污染溯源特征。为了获取溯源特征,希望构造一种特征变换y=Fθ(x),能够将输入样本x映射为溯源特征y。溯源特征同时需符合前面的相似度评价,即样本相似则溯源特征的欧氏距离接近。
[0075] 因此,本实施例中,步骤S2具体为:
[0076] S21,定义溯源特征变换网络的损失函数为:
[0077]
[0078] 式中θ表示变换网络y=Fθ(x)的参数,w(xi,xj)是由所述Siamese网络输入xi和xj计算得到的相似度。
[0079] 若所有样本点映射到相同溯源特征(即所有的x,有Fθ(x)=y0),此时网络成为退化网络没有实际意义。为了防止网络退化,网络最后添加一个正交化层,实现网络输出的正交化约束。
[0080] 步骤S22,抽取m个样本x1,...,xm∈Rd,构成一个m×d的矩阵X,设对应的溯源特征为一个m×k的矩阵Y,则正交化约束描述为:
[0081]
[0082] 其中Ik×k是一个k阶单位阵。
[0083] 对于像ATA为满秩的任意矩阵A,可以通过Cholesky分解ATA=LLT获得QR分解,其中‑1 ‑1 T ‑1 TL是下三角矩阵,L 也是下三角矩阵,而(L ) 是上三角矩阵。设置Q=A(L ) ,则:
[0084] QTQ=L‑1ATA(L‑1)T=L‑1LLT(L‑1)T=(L‑1L)=I  (4)
[0085] 因此,正交化层表示为 其中L是从 的Cholesky分解中获得的, 是用来满足正交化约束。
[0086] 步骤S23,进行网络训练过程,具体包括前向计算过程和反向计算过程;
[0087] 所述前向计算过程为:
[0088] 随机选择m个数据构成数据批X;
[0089] 前向网络计算,得到网络归一化层输入
[0090] 计算Cholesky分解
[0091] 设置网络归一化层权系数为 并计算输出
[0092] 所述反向计算过程为:
[0093] 利用Siamese网络计算输入数据对的相似度;
[0094] 计算溯源特征变换网络的损失函数;
[0095] 反向传播,更新除归一化层之外的全部网络参数。
[0096] 本实施例中,步骤S3具体计算过程为:
[0097] 利用溯源特征,可以结合监测网络节点的地理分布信息,构造一个图模型G=(V,E),其中节点集V对应监测网络节点,边沿集E由相邻节点(vi,vj)和连接权值wi,j集合构成,wi,j的定义为:
[0098] wi,j=||Yi‑Yj||2  (5)
[0099] 其中节点i和节点j在地理邻域范围之内。
[0100] 这里需要说明的是,经图谱网络获取的溯源特征具有二次范数可分性,故连接权值定义为溯源特征差值的二次范数;地理邻域范围并不是一个确定的常数,根据监测网络节点的地理分布不同局域具有不同的地理邻域范围数值。
[0101] 根据获取的图模型G,水污染的溯源问题等效于图模型的全局优化分割问题。设节点集S是图模型节点集V的一个子集,定义节点集S的传导率为:
[0102]
[0103] 其中 V\S表示集合S在集合V上的补集。这意味着图模型的全局优化分割问题转换为最小传导率问题,可以表示为:
[0104]
[0105] 这里k是分割区域数(即需要同时对监测网络中的k‑1个污染事件进行溯源),S1∪S2∪…∪Sk=V。
[0106] 理论上最小传导率问题是不可解的,是一个NP困难问题,需要寻求一种近似解决方法。注意到以下两点事实:1)溯源特征在欧氏空间上呈现聚类特性;2)溯源特征经过归一化正交处理获取。这意味着溯源特征的基在欧氏空间中是空间角近似可分,各个类别的代表基可以通过最大化所有基的内接椭球体获得,等价于一个凸规划问题。
[0107] 因此,本实施例中,步骤S4具体计算过程为:
[0108] S41,将溯源特征的基分为多个类别,每个类别的代表基表示为:
[0109] min[‑log det X]  (8)T
[0110] 满足条件:pXp≤1,X>0(正定),任意 其中T
[0111] 这样,就可以根据选择的k个满足条件pXp=1的基,可以通过内积运算对集合中的所有基进行类别归属确定。
[0112] S42,计算拉普拉斯矩阵L最小k个特征值对应的特征矢量f1,f2,…,fk,构造矩阵T即P=[f1,f2,…,fk] ,矩阵P的列向量表示为p1,p2,…pn;
[0113] S43,确定矩阵P列向量p1,p2,…pn以原点为中心的最小封闭区域 根据最小封闭区域边界上的列向量点构造分类指示标记集I=[i1,i2,…,ik],其中i1表示 属于节点集T1,i2表示 属于节点集T2,其它雷同。
[0114] 如果边界上的列向量点大于k个,使用连续投影算法选择k个在k‑1维子空间上投影范数最小的边界上的列向量点;
[0115] S44,归一化处理 i=1,2,…,n,初始化节点分类集{T1,T2,…,Tk}为空集,根据分类指示标记集I=[i1,i2,…,ik],计算:
[0116] c)选择 计算 确定极大值对应列向量pj;
[0117] d)更新
[0118] 输出节点分类集{T1,T2,…,Tk}。
[0119] 以上实施例仅用于说明本发明的优选实施方式,但本发明并不限于上述实施方式,在所述领域普通技术人员所具备的知识范围内,本发明的精神和原则之内所作的任何修改、等同替代和改进等,其均应涵盖在本发明请求保护的技术方案范围之内。

附图说明

[0057] 为了更清楚地说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0058] 图1是Siamese网络邻近监测节点的全光谱指纹图谱;
[0059] 图2是Siamese网络结构图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号