首页 > 专利 > 杭州电子科技大学 > 一种基于层次化物品协同过滤推荐方法专利详情

一种基于层次化物品协同过滤推荐方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2019-09-04
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2020-02-11
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-09-28
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2039-09-04
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201910830873.8 申请日 2019-09-04
公开/公告号 CN110688583B 公开/公告日 2021-09-28
授权日 2021-09-28 预估到期日 2039-09-04
申请年 2019年 公开/公告年 2021年
缴费截止日
分类号 G06F16/9536 主分类号 G06F16/9536
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 1
引用专利数量 1 被引证专利数量 0
非专利引证 1、2008.05.22刘登祥.“基于分层策略的协同过滤算法研究”《.中国优秀硕士学位论文全文数据库 信息科技辑》.2016,Gayatri Gadepalli等“.Tag andResource-aware Collaborative FilteringAlgorithms for Resource Recommendation”. 《2010 Seventh International Conference onInformation Technology》.2010,;
引用专利 US2008120288A 被引证专利
专利权维持 3 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 张新、王东京、俞东进 第一发明人 张新
地址 浙江省杭州市经济技术开发区白杨街道2号大街 邮编 310018
申请人数量 1 发明人数量 3
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
浙江千克知识产权代理有限公司 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
周希良
摘要
本发明公开了一种基于层次化物品协同过滤推荐方法,包括以下步骤:收集用户对物品的行为数据以及物品的元数据;对收集的行为数据和物品的元数据进行建模和物品相似度计算;基于层次化物品协同过滤的推荐。本发明主要是利用多种数据,包括用户对物品的行为数据和物品的元数据信息,以此计算物品之间的相似度并实施基于层次化物品协同过滤的推荐,缓解数据稀疏和冷启动问题的影响,进而改进推荐结果的准确率和多样性。
  • 摘要附图
    一种基于层次化物品协同过滤推荐方法
  • 说明书附图:图1
    一种基于层次化物品协同过滤推荐方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-09-28 授权
2 2020-02-11 实质审查的生效 IPC(主分类): G06F 16/9536 专利申请号: 201910830873.8 申请日: 2019.09.04
3 2020-01-14 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于层次化物品协同过滤推荐方法,其特征在于包括如下步骤:

10.收集用户和物品的行为数据以及物品的元数据;

20.对收集的行为数据和元数据进行建模并计算物品相似度;

30.基于层次化物品协同过滤的推荐;
所述的步骤10包括:

101.收集所有用户的行为数据 U={u1,u2,...,u|U|}为所有
u
用户的集合,用户u∈U的历史行为数据为H ={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合;

102.收集集合I中所有物品的元数据M,包括类别、属性和标签;
所述的步骤20包括:

201.将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话;以用户u∈U为例,其历史行为数据根据时间划分为
用户u的第n个会话定义为

202.根据上述数据分别构建物品‑用户索引表、物品‑会话索引表和物品‑元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系;

203.根据用户的行为数据以及物品的元数据,计算物品之间的相似度,其计算公式为:
sim(i,j)=α·simu(i,j)+β·sims(i,j)+γ·simm(i,j)
其中,i,j∈I,α、β和γ是对应相似度的权重;
是物品在用户层的相似度,Ui和Uj是分别与物品i
和j的有交互行为的用户集合,根据物品‑用户索引表获得,|U|是集合U的大小;
是物品在用户层的相似度,Si和Sj是分别包含物品i
和j的会话集合,根据物品‑会话索引表获得;
是物品在用户层的相似度,Mi和Mj是分别是物品
i和j的元数据集合,根据物品‑元数据索引表获得;
所述的步骤30包括:

301.根据用户的行为数据以及物品的相似度,计算目标用户u对物品i的兴趣,其计算公式如下:
其中,Ii,k是和i最相似的k个物品的集合;Iu是用户u交互过的物品集合;

302.利用上述公式对所有物品进行排序,把前n个物品推荐给目标用户u。
说明书

技术领域

[0001] 本发明属于数据挖掘及推荐技术领域,具体涉及一种基于层次化物品协同过滤推荐方法。

背景技术

[0002] 推荐系统能够帮助用户从海量在线内容中找到相关项目来降低搜索成本,而准确计算物品的相似度是实现个性化推荐系统的核心之一。然而,传统方法通常遭受诸如推荐精度低、推荐效果类似等问题,无法满足用户的需求。协同过滤推荐算法能够利用用户和物品之间的行为数据实施推荐,在一定程度上提高了推荐的准确率和用户的满意率。然而,现有协同过滤方法无法充分利用内容数据,且面临冷启动和数据稀疏等问题。因此,如何充分包括用户的细粒度行为数据和物品的内容数据在内的丰富信息,是改进推荐系统的准确性、推荐结果多样性以及用户满意度的关键之一。

发明内容

[0003] 针对现有技术所存在的上述技术问题,本发明提供了一种基于层次化物品协同过滤推荐方法,能够改善推荐的效果和性能。
[0004] 本发明包括如下内容:
[0005] 1、一种基于层次化物品协同过滤推荐方法,包括如下步骤:
[0006] 10.收集用户对物品的行为数据以及物品的元数据;
[0007] 20.对收集的行为数据和物品元数据进行建模并计算物品之间的相似度;
[0008] 30.基于层次化物品协同过滤的推荐。
[0009] 其中步骤10包括:
[0010] 101.收集所有用户的行为数据 U={u1,u2,...,u|U|}u
为所有用户的集合,用户u∈U的历史行为数据为H={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合。
[0011] 102.收集I中所有物品的元数据M,包括但不限于类别、属性、标签等信息。
[0012] 其中步骤20包括:
[0013] 201.将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话。以用户u∈U为例,其历史行为数据可以根据时间划分为用户u的第n个会话定义为
[0014] 202.根据上述数据分别构建物品‑用户索引表、物品‑会话索引表和物品‑元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系。
[0015] 203.根据用户的行为数据以及物品的元数据,计算物品之间的相似度,其计算公式为:
[0016] sim(i,j)=α·simu(i,j)+β·sims(i,j)+γ·simm(i,j)
[0017] 其中,i,j∈I,α、β和γ是对应相似度的权重;
[0018] 是物品在用户层的相似度,Ui和Uj是分别与物品i和j的有交互行为的用户集合,根据物品‑用户索引表获得,|U|是集合U的大小;
[0019] 是物品在用户层的相似度,Si和Sj是分别包含物品i和j的会话集合,根据物品‑会话索引表获得;
[0020] 是物品在用户层的相似度,Mi和Mj是分别是物品i和j的元数据集合,根据物品‑元数据索引表获得;
[0021] 其中步骤30包括:
[0022] 301.根据用户的行为数据以及物品的相似度,计算目标用户u对物品i的兴趣,其计算公式如下:
[0023]
[0024] 其中,u是目标用户;Ii,k是和i最相似的k个物品的集合;Iu是用户u交互过的物品集合。
[0025] 302.利用上述公式对所有物品进行排序,把前n个物品推荐给目标用户u。
[0026] 本发明的有益效果是:
[0027] 1)充分利用用户对物品的交互行为数据和物品的元数据,缓解数据稀疏和冷启动问题;
[0028] 2)设计了基于层次化物品协同过滤推荐算法,能够提升推荐结果的准确率和多样性,进而提升用户的满意度。

实施方案

[0030] 为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
[0031] 本发明基于层次化物品协同过滤推荐方法包括以下步骤:
[0032] (1).收集所有用户的行为数据 U={u1,u2,...,u|U|}为u
所有用户的集合,用户u∈U的历史行为数据为H={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合。收集I中所有物品的元数据M,包括但不限于类别、属性、标签等信息。
[0033] (2).将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话。以用户u∈U为例,其历史行为数据可以根据时间划分为用户u的第n个会话定义为
[0034] (3).根据上述数据分别构建物品‑用户索引表、物品‑会话索引表和物品‑元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系。
[0035] (4).根据用户的行为数据以及物品的元数据,计算物品之间的相似度,其计算公式为:
[0036] sim(i,j)=α·simu(i,j)+β·sims(i,j)+γ·simm(i,j)
[0037] 其中,i,j∈I,α、β和γ是对应相似度的权重;
[0038] 是物品在用户层的相似度,Ui和Uj是分别与物品i和j的有交互行为的用户集合,根据物品‑用户索引表获得,|U|是集合U的大小;
[0039] 是物品在用户层的相似度,Si和Sj是分别包含物品i和j的会话集合,根据物品‑会话索引表获得;
[0040] 是物品在用户层的相似度,Mi和Mj是分别是物品i和j的元数据集合,根据物品‑元数据索引表获得。
[0041] (5).根据用户的行为数据以及物品的相似度,计算目标用户u对物品i的兴趣,其计算公式如下:
[0042]
[0043] 其中,u是目标用户;Ii,k是和i最相似的k个物品的集合;Iu是用户u交互过的物品集合。
[0044] (6).利用上述公式对所有物品进行排序,把前n个物品推荐给目标用户u。
[0045] 图1给出了本实施方式基于层次化物品协同过滤推荐方法的架构。该推荐系统分为两个主要模块:预处理模块和预测模块。预处理模块中,首先获取所有用户的行为数据和物品的元数据,并构建物品‑用户索引表、物品‑会话索引表和物品‑元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系,基于三张表计算物品之间的相似度,得到物品相似度数据库。在预测模块中,提取目标用户的物品交互记录,结合物品相似度数据库计算目标用户对候选物品的潜在兴趣并排序,最后将排名靠前的物品推荐给用户。表1给出了本发明推荐方法中根据用户的行为数据构建会话的示例。
[0046] 表1
[0047]
[0048] 用户u1的前4条交互行为记录的时间较为接近,最后3条交互行为记录的时间较为接近,且二者之间的时间间隔较大,因此分别被划分到两个会话 和 中。
[0049] 上述的对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0029] 图1为本发明推荐方法的系统架构示意图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号