首页 > 专利 > 中国计量大学 > 一种基于物品图网络中路径表征的会话推荐方法专利详情

一种基于物品图网络中路径表征的会话推荐方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-09-06

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-12-14

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-02-18

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-09-06

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202111035998.5	申请日	2021-09-06
公开/公告号	CN113704440B	公开/公告日	2022-02-18
授权日	2022-02-18	预估到期日	2041-09-06
申请年	2021年	公开/公告年	2022年
缴费截止日
分类号	G06F16/332 、G06F16/33 、G06F16/338 、G06F16/9535 、G06N3/04 、G06N3/08	主分类号	G06F16/332
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	0
权利要求数量	1	非专利引证数量	1
引用专利数量	0	被引证专利数量	0
非专利引证	1、CN 111159382 A,2020.05.15CN 113239147 A,2021.08.10CN 111310045 A,2020.06.19CN 112069415 A,2020.12.11CN 110598130 A,2019.12.20KR 20180017637 A,2018.02.21李浩等.融合循环知识图谱和协同过滤电影推荐算法《.计算机工程与应用》.2020,第56卷(第2期),;
引用专利		被引证专利
专利权维持	0	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	中国计量大学	第一申请人	中国计量大学
专利权人	中国计量大学	当前专利权人	中国计量大学
发明人	顾盼、祝凯林	第一发明人	顾盼
地址	浙江省杭州市下沙高教园区学源街258号	邮编	310018
申请人数量	1	发明人数量	2
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明公开了一种基于物品图网络中路径表征的会话推荐方法。该方法根据给定用户的当前会话，挖掘出用户的当前兴趣，给用户推荐下一步最可能感兴趣的物品。主要由四个部分组成：第一部分是基于所有会话集合构建物品图；第二部分是根据当前会话和物品图网络，对当前会话进行扩充，得到扩充之后的会话路径；第三部分是采用分层门控循环单元网络对扩充之后的会话路径进行表征，得到用户兴趣表征；最后一部分是根据用户兴趣表征，推荐物品。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-02-18	授权
2	2021-12-14	实质审查的生效	IPC(主分类): G06F 16/332 专利申请号: 202111035998.5 申请日: 2021.09.06
3	2021-11-26	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于物品图网络中路径表征的会话推荐方法，其特征在于：
基于所有会话集合构建物品图T＝(V，E)；V是平台中物品的集合，E是边，表示物品和物品之间的转移关系；物品图中的边来源于会话，对于任意一个会话s＝{v1，v2，…，v|s|}，(vj‑1，vj)表示一个用户点击物品vj‑1之后点击物品vj，将(vj‑1，vj)作为为图网络T的有向边；
且图的边数值属性为边(vj‑1，vj)出现的次数；将出现次数少于ε的边过滤掉；最后，本发明采用离线文件存储每个节点所有时间下在图网络T中的1‑hop和2‑hop邻居节点；也就是，对于任意一个物品vj，存储所有时间下的B1‑hop(j)邻居集合和B2‑hop(j)邻居集合；
根据当前会话和物品图网络，对当前会话进行扩充，得到扩充之后的会话路径；当前会话为s＝{v1，v2，…，v|s|}，采用图网络T对当前会话进行扩充，将当前会话s＝{v1，v2，…，v|s|}映射到图网络中的路径，挖掘该路径是否存在捷径；这里的捷径指会话{v1，v2，…，v|s|}中任意两个不相邻物品之间是否存在距离为1或者2的路径；具体做法根据当前会话的时间，读取出当前会话中任一物品vj的上一时刻的B1‑hop(j)邻居集合和B2‑hop(j)邻居集合，查看会话中的其他物品是否在B1‑hop(j)或者B2‑hop(j)内，且确保捷径连接的两个物品在会话中不相邻；若当前会话s＝{v1，v2，…，v|s|}中存在两个物品vi和vj之间存在捷径，那么在vi和vj之间添加一条边；
采用分层门控循环单元网络对扩充之后的会话路径进行表征，得到用户兴趣表征；扩充之后的会话路径仍是有序的，且会话中的一个物品的数据输入来源有两种，一种是原始会话中的上一个物品，一个是捷径中的上一个物品；本方法采用分层门控循环单元网络对扩充之后的会话路径进行表征；当前会话{v1，v2，…，v|s|}，对应向量表征为{x1，x2，…，x|s|}，采用分层门控循环单元网络获得用户兴趣表征的具体公式如下：
gτ＝σ(Wxg·xτ+Whg·hτ‑1+Wcg·hcut_idx(τ))
其中，gτ是决定原始会话上一层的信息和捷径上一层的信息输入下一层的门控单元；
Wxg、Whg和Wcg是控制门控单元gτ的参数；是融合了原始会话上一层的信息hτ‑1和捷径上一层的信息hcut_idx(τ)的上文信息，cut_idx(τ)表示xτ的最近捷径的下标，xτ的捷径可能会出现多个，只取距离最近的捷径；rτ是重置门(resetgate)，zτ为更新门(updategate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出；是当前记忆内容；xτ是当前层的节点输入；Wxz、Whz、Wxr和Whr分别是控制更新门zτ和重置门rτ的参数；Wxh和Whh是控制当前记忆内容的参数；⊙是元素级别的矩阵相乘，σ是sigmoid函数，tanh是tanh激活函数；门控循环单元网络GRU的输入序列为{v1，v2，…，v|s|}，门控循环单元网络输出为h|s|，也就是用户兴趣表征为p＝h|s|；
根据用户兴趣表征，推荐物品；将物品vj的向量xj乘以用户兴趣向量p，再应用softmax函数计算出物品vj的分数：
其中，p代表用户的兴趣向量，代表物品vj成为下一个交互物品的可能性；同时根据的对数似然函数值，计算损失函数：
其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

说明书

技术领域

[0001] 本发明属于互联网服务技术领域，尤其是涉及一种基于物品图网络中路径表征的会话推荐方法。

背景技术

[0002] 会话(Session)是一个时间段内用户的交互行为，基于会话的推荐是基于当前会话推荐用户下一个点击的物品。在实际场景中，有些用户是匿名登录，无法获取该用户的历史交互行为数据以及用户详细信息。因此，只能基于该匿名用户的当前会话给用户推荐感兴趣的物品。传统的会话推荐方法有基于物品的协同过滤(Item‑KNN)推荐方法，该方法通过计算候选集中的物品和当前会话中物品的相似度，来给用户推荐最相似的物品。近些年来，更多的会话推荐系统中采用循环神经网络(RNN)，来学习会话中的物品序列信息。而基于循环神经网络的方法只能学习到会话中紧邻着的上一个物品到下一个物品的转移关系，而忽视了在同一个会话中物品的上下文关系。因此中科院的学者在2019年提出把当前会话建立为一个图(Graph)，来捕捉当前会话中更丰富的物品转移关系，该方法名为用图神经网络进行会话推荐(SR‑GNN)。但是该方法的图只是基于当前会话建立的，一个会话中物品的个数以及同一物品重复出现的次数都极大地限制了该方法的效果。

[0003] 本方法同样试图挖掘会话中物品之间更丰富的关系。和方法SR‑GNN不同的是，我们从所有会话中挖掘出物品之间更丰富的关系，而不是单单从当前会话中挖掘物品之间关系。本方法认为系统中所有的物品可以构建成一个物品图(item graph)，物品图的节点是物品，当两个节点之间存在有向边(vi,vj)，表示购买物品vi之后可能会购买vj。而一个会话可以看做是物品图中的一个会话路径。把任意一个会话s＝{v1,v2,…,vj,…,v|s|}放到构建好的物品图中，会发现会话中物品vj除了可以由物品v1按照当前会话路径访问到，在物品图中还可能存在物品v1到物品vj的更短捷径。在做会话表征时，把该会话中物品之间存在的所有捷径都考虑进来，对会话路径进行扩充，得到扩充之后的会话路径。最后对扩充之后的会话路径进行建模，得到用户的兴趣表征。

发明内容

[0004] 本发明所要解决的技术问题是给定用户的当前会话，对用户当前兴趣进行建模，给用户推荐下一步最可能感兴趣的物品。本方法认为系统中所有的物品可以构建成一个物品图(item graph)，物品图的节点是物品，当两个节点之间存在有向边(vi,vj)，表示购买物品vi之后可能会购买vj。而一个会话可以看做是物品图中的一个会话路径。把任意一个会话s＝{v1,v2,…,vj,…,v|s|}放到构建好的物品图中，会发现会话中物品vj除了可以由物品v1按照当前会话路径访问到，在物品图中还可能存在物品v1到物品vj的捷径。在做会话表征时，把该会话中物品之间存在的所有捷径都考虑进来，对会话路径进行扩充，得到扩充之后的会话路径。最后对扩充之后的会话路径进行建模，得到用户的兴趣表征。

[0005] 一种基于物品图网络中路径表征的会话推荐方法，包括以下步骤：

[0006] 基于所有会话集合构建物品图T＝(V，E)。V是平台中物品的集合，E是边，表示物品和物品之间的转移关系。物品图中的边来源于会话，对于任意一个会话s＝{v1，v2，…，v|s|}，(vj‑1，vj)表示一个用户点击物品vj‑1之后点击物品vj，将(vj‑1，vj)作为为图网络T的有向边。且图的边数值属性为边(vj‑1，vj)出现的次数。将出现次数少于ε的边过滤掉。最后，本发明采用离线文件存储每个节点所有时间下在图网络T中的1‑hop和2‑hop邻居节点。也就是，对于任意一个物品vj，存储所有时间下的B1‑hop(j)邻居集合和B2‑hop(j)邻居集合。本方法中只考虑节点的1‑hop和2‑hop邻居节点，此时可以在算法复杂度和算法精度之间达到平衡。

[0007] 根据当前会话和物品图网络，对当前会话进行扩充，得到扩充之后的会话路径。当前会话为s＝{v1,v2,…,v|s|}，如果仅仅利用当前会话信息对匿名用户兴趣进行表征，数据较为稀疏。因此，采用图网络T对当前会话进行扩充，将当前会话s＝{v1,v2,…,v|s|}映射到图网络中的路径，挖掘该路径是否存在捷径。这里的捷径指会话{v1,v2,…,v|s|}中任意两个不相邻物品之间是否存在距离为1或者2的路径。具体做法根据当前会话的时间t,读取出当前会话中任一物品vj的上一时刻的B+‑hop(j)邻居集合和B2‑hop(j)邻居集合，查看会话中的其他物品是否在B1‑hop(j)或者B2‑hop(j)内，且确保捷径连接的两个物品在会话中不相邻。若当前会话s＝{v1，v2，…，v|s|}中存在两个物品vi和vj之间存在捷径，那么在vi和vj之间添加一条边。在后续兴趣表征过程中，不对捷径中的距离为1和距离为2的路径不做区分，都统一认作为捷径，表示点击物品vi之后可能点击物品vj。

[0008] 采用分层门控循环单元网络对扩充之后的会话路径进行表征，得到用户兴趣表征。扩充之后的会话路径仍是有序的，且会话中的一个物品的数据输入来源有两种，一种是原始会话中的上一个物品，一个是捷径中的上一个物品。本方法采用分层门控循环单元网络(Hierarchical Gated Recurrent Unit)对扩充之后的会话路径进行表征。当前会话{v1，v2，…，v|s|}，对应向量表征为{x1，x2，…，x|s|}，采用分层门控循环单元网络获得用户兴趣表征的具体公式如下：

[0009] gτ＝σ(Wxg·xτ+Whg·hτ‑1+Wcg·hcut_idx(τ))

[0010]

[0011]

[0012]

[0013]

[0014]

[0015] 其中，gτ是决定原始会话上一层的信息和捷径上一层的信息输入下一层的门控单元。Wxg、Whg和Wcg是控制门控单元gτ的参数。是融合了原始会话上一层的信息hτ‑1和捷径上一层的信息hcut_idx(τ)的上文信息，cvt_idx(τ)表示xτ的最近捷径的下标，xτ的捷径可能会出现多个，只取距离最近的捷径。rτ是重置门(resetgate)，zτ为更新门(updategate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xτ是当前层的节点输入。Wxz、Whz、Wxr和Whr分别是控制更新门zτ和重置门rτ的参数。Wxh和Whh是控制当前记忆内容hτ的参数。⊙是元素级别的矩阵相乘，σ是sigmoid函数，tanh是tanh激活函数。门控循环单元网络GRU的输入序列为{v1，v2，…，v|s|}，门控循环单元网络输出为h|s|，也就是用户兴趣表征为p＝h|s|。

[0016] 根据用户兴趣表征，推荐物品。将物品vj的向量xj乘以用户兴趣向量p，再应用softmax函数计算出物品vj的分数：

[0017]

[0018] 其中，p代表用户的兴趣向量，代表物品vj成为下一个交互物品的可能性。同时根据的对数似然函数值，计算损失函数：

[0019]

[0020] 其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

[0021] 本发明的有益技术效果如下：

[0022] (1)本发明针对匿名用户会话推荐中信息过于稀疏的问题，提出利用当前会话前发生的会话构建物品图，然后将当前会话看做物品图中的路径，挖掘当前会话的物品之间在物品图中的捷径，对会话进行扩充。

[0023] (2)本发明提出分层门控循环单元网络结构，对扩充之后的会话路径进行表征。扩充之后的会话路径本质上是一种图结构，因此传统的所有序列模型都不再适用于本场景，且图模型方法，如GCN也不适用于本场景，因为图模型会忽视扩充后的会话路径内物品的有序性。因而本方法创新性地提出分层门控循环单元网络。

实施方案

[0027] 为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于物品图网络中路径表征的会话推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

[0028] 首先，需要对用到的变量和公式给出相关定义。

[0029] 定义1.V：物品集合，且V＝{v1，v2，…，v|V|}，|V|代表物品集合中物品的数量。

[0030] 定义2.s：当前会话，会话是当前时间段里的所有交互物品集合s＝{v1，v2，…，v|s|}，|s|代表会话中物品的数量。

[0031] 定义3.S：系统中的会话集合，S＝{s1，s2，…，s|S|}，|S|代表会话集合中会话的数量。

[0032] 定义4.T：基于所有用户会话中交互的物品集合构建的物品图T。

[0033] 定义4.Bn‑hop(j)：物品图T中物品vj的距离为n的邻居集合，距离为n表示物品之间间隔n个边。

[0034] 定义5. 物品vj的向量表征。

[0035] 定义6.p：当前会话的向量表征，也代表着用户当前兴趣向量表征。

[0036] 结合以上变量定义，将最终的问题定义为：给定用户的当前会话s，会话推荐方法对用户的兴趣进行建模，来推荐用户在下一步最可能感兴趣的物品，物品是物品集合V的子集。

[0037] 为此，本发明提出了一种基于物品图网络中路径表征的会话推荐方法，如图2所示，方法的向前传播(forward propagation)部分主要由四个部分组成。第一部分是基于所有会话集合构建物品图。第二部分是根据当前会话和物品图网络，对当前会话进行扩充，得到扩充之后的会话路径。第三部分是采用分层门控循环单元网络对扩充之后的会话路径进行表征，得到用户兴趣表征。最后，根据用户兴趣表征，推荐物品。

[0038] 如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

[0039] S100，基于所有会话集合构建物品图T＝(V，E)。V是平台中物品的集合，E是边，表示物品和物品之间的转移关系。物品图中的边来源于会话，对于任意一个会话s＝{v1，v2，…，v|s|}，(vj‑1，vj)表示一个用户点击物品vj‑1之后点击物品vj，将(vj‑1，vj)作为为图网络T的有向边。且图的边数值属性为边(vj‑1，vj)出现的次数。将出现次数少于ε的边过滤掉，在本实验中令ε＝4。最后，本发明采用离线文件存储每个节点所有时间下在图网络T中的1‑hop和2‑hop邻居节点。也就是，对于任意一个物品vj，存储所有时间下的B1‑hop(j)邻居集合和B2‑hop(j)邻居集合。本方法中只考虑节点的1‑hop和2‑hop邻居节点，此时可以在算法复杂度和算法精度之间达到平衡。

[0040] S200，根据当前会话和物品图网络，对当前会话进行扩充，得到扩充之后的会话路径。当前会话为s＝{v1，v2，…，v|s|}，如果仅仅利用当前会话信息对匿名用户兴趣进行表征，数据较为稀疏。因此，采用图网络T对当前会话进行扩充，将当前会话s＝{v1，v2，…，v|s|}映射到图网络中的路径，挖掘该路径是否存在捷径。这里的捷径指会话{v1，v2，…，v|s|}中任意两个不相邻物品之间是否存在距离为1或者2的路径。具体做法根据当前会话的时间t，读取出当前会话中任一物品vj的上一时刻的B1‑hop(j)邻居集合和B2‑hop(j)邻居集合，查看会话中的其他物品是否在B1‑hop(j)或者B2‑hop(j)内，且确保捷径连接的两个物品在会话中不相邻。若当前会话s＝{v1，v2，…，v|s|}中存在两个物品vi和vj之间存在捷径，那么在vi和vj之间添加一条边。在后续兴趣表征过程中，不对捷径中的距离为1和距离为2的路径不做区分，都统一认作为捷径，表示点击物品vi之后可能点击物品vj。如图3所示，当前会话为s＝{v1，v2，v3，v4，v5，v6}，用图网络T对其进行扩充。在图网络中存在v1→v4这样的路径，因此，节点v4是节点v1的1‑hop邻居；在图网络中存在v1→v7→v3这样的路径，因此节点v3是节点v1的2‑hop邻居。在当前会话中的v1和v4之间增加边，以及同时在v1和v3之间增加边。

[0041] S300，采用分层门控循环单元网络对扩充之后的会话路径进行表征，得到用户兴趣表征。扩充之后的会话路径仍是有序的，且会话中的一个物品的数据输入来源有两种，一种是原始会话中的上一个物品，一个是捷径中的上一个物品。因此，传统的门控循环单元网络(Gated Recurrent Unit)不再适用，本方法采用分层门控循环单元网络(Hierarchical Gated Recurrent Unit)对扩充之后的会话路径进行表征。当前会话{v1，v2，…，v|s|}对应向量表征为{x1，x2，…，x|s|}，采用分层门控循环单元网络获得用户兴趣表征的具体公式如下：

[0042] gτ＝σ(Wxg·xτ+Whg·hτ‑1+Wcg·hcut_idx(τ))

[0043]

[0044]

[0045]

[0046]

[0047]

[0048] 其中，gτ是决定原始会话上一层的信息和捷径上一层的信息输入下一层的门控单元。Wxg、Whg和Wcg是控制门控单元gτ的参数。是融合了原始会话上一层的信息hτ‑1和捷径上一层的信息hcut_idx(τ)的上文信息，cut_idx(τ)表示xτ的最近捷径的下标，xτ的捷径可能会出现多个，只取距离最近的捷径。rτ是重置门(reset gate)，zτ为更新门(update gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xτ是当前层的节点输入。Wxz、Whz、Wxr和Whr分别是控制更新门zτ和重置门rτ的参数。Wxh和Whh是控制当前记忆内容的参数。⊙是元素级别的矩阵相乘，σ是sigmoid函数，tanh是tanh激活函数。门控循环单元网络GRU的输入序列为{v1，v2，…，v|s|}，门控循环单元网络输出为h|s|，也就是用户兴趣表征为p＝h|s|。

[0049] S400，根据用户兴趣表征，推荐物品。将物品vj的向量xj乘以用户兴趣向量p，再应用softmax函数计算出物品vj的分数：

[0050]

[0051] 其中，p代表用户的兴趣向量，代表物品vj成为下一个交互物品的可能性。同时根据的对数似然函数值，计算损失函数：

[0052]

[0053] 其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

[0054] 上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0024] 图1为本发明一种基于物品图网络中路径表征的会话推荐方法的流程示意图；

[0025] 图2为本发明一种基于物品图网络中路径表征的会话推荐方法的模型框架图；

[0026] 图3为本发明一种基于物品图网络中路径表征的会话推荐方法的会话扩充示意图。

1基于互联网和数字技术的信息优化处理方法及服务器 2基于人工智能的互联网用户整合方法及大数据服务系统