首页 > 专利 > 杭州电子科技大学 > 一种基于混合协同过滤的Web服务QoS预测方法专利详情

一种基于混合协同过滤的Web服务QoS预测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2013-03-06

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2013-07-10

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2016-04-27

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2033-03-06

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201310070867.X	申请日	2013-03-06
公开/公告号	CN103139310B	公开/公告日	2016-04-27
授权日	2016-04-27	预估到期日	2033-03-06
申请年	2013年	公开/公告年	2016年
缴费截止日
分类号	H04L29/08 、H04L12/26	主分类号	H04L29/08
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	0
权利要求数量	1	非专利引证数量	0
引用专利数量	3	被引证专利数量	0
非专利引证
引用专利	US2006101116A1、US2012158631A1、CN102882657A	被引证专利
专利权维持	5	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	俞东进、吴萌萌、殷昱煜、李万清、穆海伦	第一发明人	俞东进
地址	浙江省杭州市下沙高教园区2号大街	邮编
申请人数量	1	发明人数量	5
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

杭州君度专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

杜军

摘要

本发明公开一种基于混合协同过滤的Web服务QoS预测方法，现有的Web服务QoS预测方法的预测精确度不高，特别是在QoS数据稀疏的情况下该情况更为严重，本发明根据用户和服务的相关信息，首先将用户和服务分类，然后根据目标用户和目标服务所属分类的不同使用不同的预测方法计算其QoS预测值，并在计算预测值的过程中使用改进的欧氏距离方法计算用户间和服务间的相似度。与传统方法相比，本发明具有较高的Web服务QoS的预测精度，尤其在历史QoS数据稀疏情况下，其预测精度相比现有方法有明显提高。

摘要附图
说明书附图：图1

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2016-04-27	授权
2	2013-07-10	实质审查的生效	IPC(主分类): H04L 29/08 专利申请号: 201310070867.X 申请日: 2013.03.06
3	2013-06-05	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于混合协同过滤的Web服务QoS预测方法，
定义1特殊用户类；用户QoS均值最大的Nu个用户组成特殊用户类；其中，用户QoS均值是指与该用户相关的所有QoS记录的平均值，Nu是控制特殊用户类中用户个数的阈值，根据实际情况指定；
定义2特殊服务类；服务QoS均值最大的Ns个服务组成特殊服务类；其中，服务QoS均值是指与该服务相关的所有QoS记录的平均值，Ns是控制特殊服务类中服务个数的阈值，根据实际情况指定；
定义3用户区域；将用户按照所在物理位置的不同分成f类，用户URi表示属于第i个区域的用户的集合，用UR表示用户区域的集合，即UR＝{UR1,UR2,...,URf}；
定义4区域敏感服务；若服务s满足s∈{sj||median(URi,sj)-median(UR,sj)|≥λ×MMAD(UR,sj)}，则称服务s对区域URi敏感；其中，sj表示一个名为sj的服务；λ为控制区域敏感服务的阈值，根据实际情况指定；median(URi,s)表示区域URi中用户调用服务s所得QoS记录的集合的中值，简称区域URi的中值；median(UR,s)表示用户区域集合UR中各个区域中值所组成的集合的中值；MMAD(UR,s)表示用户区域集合UR中各个区域中值与median(UR,s)的差的绝对值所组成的集合的中值，计算公式为MMAD(UR,s)＝median(|median(URi,s)-median(UR,s)|),i＝1,2,...,f,median(UR,sj)表示区域UR中用户调用服务sj所得QoS记录的集合的中值；
定义5区域中心；区域URi对服务s的中心是指：区域URi中所有用户调用服务s所得QoS集合的中值，计算公式为：
定义6用户相似度；用户u1和u2的相似度使用改进欧式距离计算，具体公式为：
其中，S表示用户u1和u2共同调用过的服务集合，|S|表示用户u1和
用户u2共同调用服务的个数，ds表示服务s被用户调用所得QoS数据的标准偏差，计算公式为： Us表示调用服务s的用户集合，|Us|表示调用服务s的用户的
个数，表示用户ui调用服务s的QoS值，表示与服务s相关的所有QoS记录的平均值,ru,s表示用户u调用服务s的QoS值；
定义7服务相似度；服务s1和s2的相似度使用改进欧式距离计算，具体公式为：
其中，U表示共同调用服务s1和s2的用户集合，|U|表示共同调用服
务s1和s2的用户的个数，du表示用户u调用服务所得QoS数据的标准偏差，计算公式为：
Su表示用户u调用的服务集合，|Su|表示用户u调用服务的个数，
ru,s表示用户u调用服务s的QoS值，表示与服务u相关的所有QoS记录的平均值；
定义8综合预测方法；综合预测方法的计算公式为：P(ru,s)＝wu*Pu+ws*Ps，其中，Pu表示基于用户的预测结果，计算公式为 Lu表示目标用户u的相似邻居集
合，表示用户u1调用服务s的QoS，表示用户u与u1的相似度，Ps表示基于服务的预测结果，计算公式为其中Ls表示目标服务s的相似邻居集合，表示用户
u调用服务s1的QoS，表示服务s与服务s1的相似度，wu和ws分别表示基于用户预测结果和基于服务预测结果的权重，wu+ws＝1，计算公式为：
conu和cons分别为调节基于用户和基于服务预测结果权重的固定因子，计算公式为：
w为调节基于用户和基于服务预测结果权重的可
变因子，根据实际情况指定；
其特征在于该方法包括以下步骤：
步骤(1)获取用户调用Web服务QoS历史记录信息，并将所获取的初始QoS矩阵正规化，具体计算公式为：其中，ru,s表示用户u调用服务s的QoS，表示与用户u相关的所有QoS记录的平均值，σu表示用户u调用服务所得QoS数据的标准偏差,r′u，s表示将所获取的初始QoS矩阵正规化得到的值；
步骤(2)根据用户和服务的相关信息，将用户分为普通用户类和特殊用户类，将服务分为普通服务类、特殊服务类和区域敏感服务类；根据定义1确定特殊用户类，根据定义2确定特殊服务类，根据定义3和定义4确定区域敏感服务类，未被划分入特殊用户类、特殊服务类、区域敏感服务类的用户和服务分别组成普通用户类和普通服务类；
步骤(3)目标用户属于特殊用户类，而目标服务不属于特殊服务类，则使用UMEAN方法计算预测值，即将目标用户调用过的QoS记录的均值作为预测值；
步骤(4)目标服务属于特殊服务类，而目标用户不属于特殊用户类，则使用IMEAN方法计算预测值，即将目标服务被调用的QoS记录的均值作为预测值；
步骤(5)目标服务属于特殊服务类，且目标用户属于特殊用户类，则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值；
步骤(6)目标服务对于目标用户所属区域敏感，根据定义5，将目标用户所属区域对目标服务的中心作为最终的预测值；
步骤(7)目标用户和目标服务分别属于普通用户类和普通服务类，根据定义6和定义7，使用改进欧氏距离计算用户间和服务间的相似度，使用Top-K算法选择目标用户和目标服务的相似邻居，最后根据定义8使用综合预测方法计算最终的预测值。

说明书

技术领域

[0001] 本发明属于服务选择领域，具体涉及到一种基于混合协同过滤的Web服务QoS预测方法。

背景技术

[0002] 当前，利用Web服务组合技术有效地组织Internet中的各类服务，开发既满足用户功能性需求、又满足服务质量（Quality of Service，简称QoS）需求的企业级应用，已成为Internet环境下软件开发的重要方式。其中，服务选择是服务组合过程中的关键环节。由于存在大量功能、行为相同或相似而QoS不同的Web服务，进行服务选择时必须考虑它们的QoS属性。

[0003] 迄今为止，国内外研究者已提出了许多基于QoS的服务选择方法，这些方法大多针对服务的QoS信息较为完整的情况，然而实际情况并非都是如此。服务的QoS信息通常来自于用户调用后得到的数据。但是一个用户一般并不可能调用过所有的服务，这样就需要在众多的候选服务中，在服务QoS信息不完全情况下进行选择。

[0004] 当前，服务QoS预测已成为Web服务领域的一个热点问题。通过大量实验的验证和比较，基于协同过滤的预测方法是迄今为止整体预测精度最好的方法。但是在QoS数据稀疏的情况下，该类方法的预测精度较其他方法提高并不十分明显。同时，通过分析真实QoS数据，可以发现QoS数据的重要特点正是数据稀疏性。

发明内容

[0005] 本发明针对现有技术的不足，提出了一种基于混合协同过滤的Web服务QoS预测方法。

[0006] 本发明一种基于混合协同过滤的Web服务QoS预测方法的具体步骤是：

[0007] 步骤(1) 获取用户调用Web服务QoS历史记录信息，并将所获取的初始QoS矩阵正规化，具体计算公式为：，其中，表示用户u调用服务s的QoS，表示与用户u相关的所有QoS记录的平均值，表示用户u调用服务所得QoS数据的标准偏差；

[0008] 步骤(2) 根据用户和服务的相关信息，将用户分为“普通用户类”和“特殊用户类”，将服务分为“普通服务类”、“特殊服务类”和“区域敏感服务类”；根据定义1确定“特殊用户类”，根据定义2确定“特殊服务类”，根据定义3和定义4确定“区域敏感服务类”，未被划分入以上任意类的用户和服务分别组成“普通用户类”和“普通服务类”；

[0009] 步骤(3)目标用户属于“特殊用户类”，而目标服务不属于“特殊服务类”，则使用UMEAN方法计算预测值，即将目标用户调用过的QoS记录的均值作为预测值；

[0010] 步骤(4) 目标服务属于“特殊服务类”，而目标用户不属于“特殊用户类”，则使用IMEAN方法计算预测值，即将目标服务被调用的QoS记录的均值作为预测值；

[0011] 步骤(5) 目标服务属于“特殊服务类”，且目标用户属于“特殊用户类”，则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值；

[0012] 步骤(6) 目标服务对于目标用户所属区域敏感，根据定义5，将目标用户所属区域对目标服务的中心作为最终的预测值；

[0013] 步骤(7) 目标用户和目标服务分别属于“普通用户类”和“普通服务类”，根据定义6和定义7，使用改进欧氏距离计算用户间和服务间的相似度，使用Top-K算法选择目标用户和目标服务的相似邻居，最后根据定义8使用综合预测方法计算最终的预测值。

[0014] 定义1 特殊用户类。用户QoS均值最大的个用户组成“特殊用户类”。其中，用户QoS均值是指与该用户相关的所有QoS记录的平均值，是控制特殊用户类中用户个数的阈值，可根据实际情况指定。

[0015] 定义2 特殊服务类。服务QoS均值最大的个服务组成“特殊服务类”。其中，服务QoS均值是指与该服务相关的所有QoS记录的平均值，是控制特殊服务类中服务个数的阈值，可根据实际情况指定。

[0016] 定义3 用户区域。将用户按照所在物理位置的不同分成f类，用户表示属于第i个区域的用户的集合，用表示用户区域的集合，即。

[0017] 定义4区域敏感服务。若服务s满足，则称服务s对区域敏感。其中，表示一个名为的服务；为控制区域敏感服务的阈值，可根据实际情况指定；表示区域中用户调用服务s所得QoS记录的集合的
中值，简称区域的中值；表示用户区域集合中各个区域中值所组成的集合
的中值；表示用户区域集合中各个区域中值与的差的绝对值所
组成的集合的中值，计算公式为。

[0018] 定义5区域中心。区域对服务s的中心是指：区域中所有用户调用服务s所得QoS集合的中值，计算公式为：。

[0019] 定义6 用户相似度。本发明中，用户u1和u2的相似度使用改进欧式距离计算，具体公式为：，其中，表示用户u1和u2共同调用过的服务集合，表示用户u1和用户u2共同调用服务的个数，表示服务s被用户调用所得QoS数据的标准偏差，计算公式为：，表示调用服务s的用户集合，表示调用服务s的
用户的个数，表示用户ui调用服务s的QoS值，表示与服务s相关的所有QoS记录的平均值。

[0020] 定义7 服务相似度。本发明中，服务s1和s2的相似度使用改进欧式距离计算，具体公式为：，其中，表示共同调用服务s1和s2的用户集合，表示共同调用服务s1和s2的用户的个数，表示表示用户u调用服务所得QoS数据的标准偏差，计算公式为：，表示用户u调用的服务集合，表示用户u调用服务的
个数，表示用户u调用服务s的QoS值，表示与服务u相关的所有QoS记录的平均值。

[0021] 定义8 综合预测方法。综合预测方法的计算公式为：，其中，表示基于用户的预测结果，计算公式为（表示目标用户u的相似邻
居集合，表示用户u1调用服务s的QoS，表示用户u与u1的相似度），表示基于服务的预测结果，计算公式为其中表示目标服务s的相似邻居集合，表示
用户u调用服务s1的QoS，表示服务s与服务s1的相似度，和 ( )分别表示基于用户预测结果和基于服务预测结果的权重，计算公式为：，
，和分别为调节基于用户和基于服务预测结果权重的固定因
子，计算公式为：，，为调节基于用户和基于服务预
测结果权重的可变因子，可根据实际情况指定。

[0022] 有益效果：本发明通过考虑用户和服务的自身特性将用户和服务分类，并且根据目标用户和目标服务所属分类的不同使用不同的预测方法计算其QoS预测值，并利用改进的欧氏距离方法计算用户和服务的相似度，解决了传统相似度计算方法可能存在的对相似度值评估过高的问题，同时通过引入平衡因子整合了相似用户对相同服务QoS的预测结果和相同用户对相似服务QoS的预测结果。与传统方法相比，本发明具有较高的Web服务QoS的预测精度，尤其在历史QoS数据稀疏情况下，其预测精度相比现有方法有明显提高。

实施方案

[0024] 如图1所示，本发明一种基于混合协同过滤的Web服务QoS预测方法包括以下步骤：

[0025] 步骤(1) 获取用户调用Web服务QoS历史记录信息，并将所获取的初始QoS矩阵正规化，具体计算公式为：，其中，表示用户u调用服务s的QoS，表示与用户u相关的所有QoS记录的平均值，表示用户u调用服务所得QoS数据的标准偏差；

[0026] 步骤(2) 根据用户和服务的相关信息，将用户分为“普通用户类”和“特殊用户类”，将服务分为“普通服务类”、“特殊服务类”和“区域敏感服务类”；根据定义1确定“特殊用户类”，根据定义2确定“特殊服务类”，根据定义3和定义4确定“区域敏感服务类”，未被划分入以上任意类的用户和服务分别组成“普通用户类”和“普通服务类”；

[0027] 步骤(3)目标用户属于“特殊用户类”，而目标服务不属于“特殊服务类”，则使用UMEAN方法计算预测值，即将目标用户调用过的QoS记录的均值作为预测值；

[0028] 步骤(4) 目标服务属于“特殊服务类”，而目标用户不属于“特殊用户类”，则使用IMEAN方法计算预测值，即将目标服务被调用的QoS记录的均值作为预测值；

[0029] 步骤(5) 目标服务属于“特殊服务类”，且目标用户属于“特殊用户类”，则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值；

[0030] 步骤(6) 目标服务对于目标用户所属区域敏感，根据定义5，将目标用户所属区域对目标服务的中心作为最终的预测值；

[0031] 步骤(7) 目标用户和目标服务分别属于“普通用户类”和“普通服务类”，根据定义6和定义7，使用改进欧氏距离计算用户间和服务间的相似度，使用Top-K算法选择目标用户和目标服务的相似邻居，最后根据定义8使用综合预测方法计算最终的预测值。

[0032] 定义1 特殊用户类。用户QoS均值最大的个用户组成“特殊用户类”。其中，用户QoS均值是指与该用户相关的所有QoS记录的平均值，是控制特殊用户类中用户个数的阈值，可根据实际情况指定。

[0033] 定义2 特殊服务类。服务QoS均值最大的个服务组成“特殊服务类”。其中，服务QoS均值是指与该服务相关的所有QoS记录的平均值，是控制特殊服务类中服务个数的阈值，可根据实际情况指定。

[0034] 定义3 用户区域。将用户按照所在物理位置的不同分成f类，用户表示属于第i个区域的用户的集合，用表示用户区域的集合，即。

[0035] 定义4区域敏感服务。若服务s满足，则称服务s对区域敏感。其中，表示一个名为的服务；为控制区域敏感服务的阈值，可根据实际情况指定；表示区域中用户调用服务s所得QoS记录的集合的中
值，简称区域的中值；表示用户区域集合中各个区域中值所组成的集合的
中值；表示用户区域集合中各个区域中值与的差的绝对值所组成
的集合的中值，计算公式为。

[0036] 定义5区域中心。区域对服务s的中心是指：区域中所有用户调用服务s所得QoS集合的中值，计算公式为：。

[0037] 定义6 用户相似度。本发明中，用户u1和u2的相似度使用改进欧式距离计算，具体公式为：，其中，表示用户u1和u2共同调用过的服务集合，表示用户u1和用户u2共同调用服务的个数，表示服务s被用户调用所得QoS数据的标准偏差，计算公式为：，表示调用服务s的用户集合，表示调用服务s的
用户的个数，表示用户ui调用服务s的QoS值，表示与服务s相关的所有QoS记录的平均值。

[0038] 定义7 服务相似度。本发明中，服务s1和s2的相似度使用改进欧式距离计算，具体公式为：，其中，表示共同调用服务s1和s2的用户集合，表示共同调用服务s1和s2的用户的个数，表示表示用户u调用服务所得QoS数据的标准偏差，计算公式为：，表示用户u调用的服务集合，表示用户u调用服务
的个数，表示用户u调用服务s的QoS值，表示与服务u相关的所有QoS记录的平均值。

[0039] 定义8 综合预测方法。综合预测方法的计算公式为：，其中，表示基于用户的预测结果，计算公式为（表示目标用户u的相似邻
居集合，表示用户u1调用服务s的QoS，表示用户u与u1的相似度），表示基于服务的预测结果，计算公式为其中表示目标服务s的相似邻居集合，表示
用户u调用服务s1的QoS，表示服务s与服务s1的相似度，和 ( )分别表示基于用户预测结果和基于服务预测结果的权重，计算公式为：，
，和分别为调节基于用户和基于服务预测结果权重的固定因
子，计算公式为：，，为调节基于用户和基于服务预
测结果权重的可变因子，可根据实际情况指定。

附图说明

[0023] 图1 本发明的主要流程图。