首页 > 专利 > 中国计量大学 > 一种基于多模态交叉融合图网络的会话社交推荐方法专利详情

一种基于多模态交叉融合图网络的会话社交推荐方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-01-06

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-05-07

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-03-04

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-01-06

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202110011226.1	申请日	2021-01-06
公开/公告号	CN112685657B	公开/公告日	2022-03-04
授权日	2022-03-04	预估到期日	2041-01-06
申请年	2021年	公开/公告年	2022年
缴费截止日
分类号	G06F16/9536 、G06Q50/00 、G06K9/62 、G06N3/04	主分类号	G06F16/9536
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	1
权利要求数量	2	非专利引证数量	0
引用专利数量	5	被引证专利数量	0
非专利引证
引用专利	CN110119467A、CN110008408A、CN111222054A、CN112115243A、US2013124437A1	被引证专利
专利权维持	2	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	中国计量大学	第一申请人	中国计量大学
专利权人	中国计量大学	当前专利权人	中国计量大学
发明人	顾盼	第一发明人	顾盼
地址	浙江省杭州市下沙高教园区学源街258号	邮编	310018
申请人数量	1	发明人数量	1
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明公开了一种基于多模态交叉融合图网络的会话社交推荐方法。该方法基于用户历史交互序列和社交网络关系，对用户的兴趣和社交影响进行建模，来推荐用户在下一步最可能感兴趣的物品。本方法主要由三个部分组成：第一部分采用长短期记忆网络生成不同模态空间下的当前会话向量表征，目标用户在不同模态空间下的当前会话向量表征即是不同模态空间下的用户兴趣向量表征。第二部分是采用基于动态路由的多模态图网络从社交网络中得到朋友对目标用户的社交影响。第三部分是综合考虑用户兴趣和社交影响，预测用户下一个点击的物品。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-03-04	授权
2	2021-05-07	实质审查的生效	IPC(主分类): G06F 16/9536 专利申请号: 202110011226.1 申请日: 2021.01.06
3	2021-04-20	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于多模态交叉融合图网络的会话社交推荐方法，其特征在于：
构建目标用户ui的社交网络G，令：
G＝{U，E}
其中，U表示社交网络中目标用户ui的朋友集合，E是目标用户的社交连接；
使用长短期记忆网络生成不同模态空间下的会话向量表征，目标用户当前会话向量表征即是用户兴趣向量表征；构建用户会话向量表征，任一会话表示为S＝{v1，v2，…，vn}；其中vj是会话中第j个物品；构建用户会话向量表征采用长短期记忆网络(LSTM)：
zS＝LSTM(Q(：，S))
其中，Q是物品的向量矩阵，Q(：，S)代表出现在会话S中所有的物品向量；分别用长短期记忆网络对会话模态a的表示和模态b的表示进行
特征建模，得到目标用户在不同模态下的兴趣向量表征
他的第l个朋友的表征为最近会话的向量表征为
根据社交网络G，采用基于动态路由的多模态图网络计算朋友对目标用户的社交影响；
以下是多模态社交图网络中目标用户的朋友兴趣特征对目标用户模态a的社交影响的计算过程：
其中，是模态m，m∈{a，b}到模态a的转换矩阵；是目标用户第l个朋友在模态m下的兴趣向量表征，是目标用户第l个朋友经过转换后的兴趣向量表征，是目标用户ui在模态a下的兴趣向量表征；是目标用户第l个朋友的模态m到目标用户ui模态a的连接参数，是参数归一化后的连接参数，归一化方式是softmaxl函数，具体为AGGREGATEl函数表示将目标用户的所有朋友信息聚合，采用求和(SUM)计算方法；squash是胶囊网络中常用的squash向量激活函数；即为迭代一次的朋友对目标用户模态a的社交影响；公式中表示不同朋友的不同模态对目标用户模态a的重要程度，最终的值需采用动态路由算法迭代r次，即再重复循环以下过程r‑1次：
其中，得到迭代r次的值为最终朋友对目标用户模态特征a的社交影响，表示为 N(i)是目标用户ui的朋友集合；以上是朋友对目标用户模态a的社交影响计算过程，朋友对目标用户模态b的社交影响计算过程相同；
结合目标用户兴趣和社交影响，获得用户最终向量表征；用户的兴趣由他当前会话行为和社交影响共同决定，用户的最终表示就由全连接层合并两者得到，令：
其中，是线性转化矩阵，为目标用户ui行为表现出的多模态空
间下的兴趣向量表征，是多模态空间下的朋友对目标用户ui的社交影响，为向量拼接操作；
根据用户最终向量表征和物品向量表征，推荐物品；将物品vj的向量乘以用户兴趣向量再应用softmax函数计算出物品vj的分数：
其中，和代表用户在模态空间a和b下的兴趣向量，和是物品vj在模态空间a和b下的向量表征；代表物品vj成为下一个交互的可能性；同时根据的对数似然函数值，计算损失函数：
其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

2.根据权利要求1所述的一种基于多模态交叉融合图网络的会话社交推荐方法，其特征在于：所述长短期记忆网络(LSTM)结构为：
ij＝σ(Wixj+Uihj‑1+bi)
fj＝σ(Wfxj+Ufhj‑1+bf)
oj＝σ(Woxj+Uohj‑1+bo)
cj＝ijtanh(Wcxj+Uchj‑1+bc)+fjcj‑1
hj＝ojcj
其中，不同模态的公式相同且参数不共享，因此公式中省略了模态参数m∈{a，b}；xj是会话序列中第j个物品的向量表征；长短期记忆网络的最后一层的隐藏状态hj的输出就是会话向量表征zs；
和分别是控制输入门ij、遗忘门fj和输出门oj的参数，d代表物品向量的维度；
和是控制单元状态cj更新的参数；σ为sigmoid函数；所有这些
参数和输入：隐层状态hj‑1、当前输入xj共同参与计算，来输出结果hj。

说明书

技术领域

[0001] 本发明属于互联网服务技术领域，尤其是涉及一种基于多模态交叉融合图网络的会话社交推荐方法。

背景技术

[0002] 很多在线平台，例如Yelp、Epinions等，允许用户在平台上分享自己的兴趣和经历，以及和其他用户进行互动。用户在平台上的行为信息非常丰富，通常来说用户的兴趣是多样和多变的。很多社交推荐方法在推荐物品的时候，同时考虑用户的兴趣和社交影响，可以降低数据的稀疏度。将用户交互行为数据和用户的社交网络进行互补地结合，提高个性化推荐方法准确度是本发明的出发点。

[0003] 大多数社交推荐方法采用矩阵分解模型，将用户的社交网络和用户的交互网络结合起来建模。近几年，随着图卷积网络(GCN)的发展，有些学者开始使用图卷积网络来学习朋友对目标用户的社交影响。如song等人采用GraphSAGE得到朋友对目标用户的社交影响，GraphSAGE是Hamilton等人提出的一种图卷积网络方法，它不需要输入整个用户的社交网络矩阵，是一种时间复杂度换空间复杂度的图方法。

[0004] 以上方法虽然取得不错的效果，但是没有考虑到物品特征的多模态性。Chen等人在物品表征阶段采用注意力机制对多种模态进行选择，并生成物品向量表征。该方法只能算是将多模态特征向量相连接组成物品向量这种方法的进阶版本，没有充分利用物品多模态的丰富信息。本方法先基于序列表征方法得到所有用户在不同模态下的兴趣向量表征，然后采用基于动态路由的多模态图网络进行模态融合。多模态社交图网络中用户兴趣特征信息非常丰富，朋友不同模态下的兴趣表征同时对目标用户的兴趣表征产生社交影响，且不同模态产生的社交影响之间是有联系的。本方法受到胶囊网络启发，采用动态路由来学习和更新这种联系。同时，通过改进原始胶囊网络中动态路由的归一化方式，学习不同朋友的不同模态对目标用户模态的重要度。

发明内容

[0005] 本发明所要解决的技术问题是基于用户历史交互序列和社交网络关系，对用户的兴趣和社交影响进行建模，来推荐用户在下一步最可能感兴趣的物品。本方法通过对用户兴趣和社交影响进行建模，来预测用户下一个点击的物品。为此，本发明采用以下技术方案：

[0006] 一种基于多模态交叉融合图网络的会话社交推荐方法，包括以下步骤：

[0007] 构建目标用户ui的社交网络G，令：

[0008] G＝{U,E}

[0009] 其中，U表示社交网络中目标用户ui的朋友集合，E是目标用户的社交连接。

[0010] 使用长短期记忆网络生成不同模态空间下的会话向量表征，目标用户当前会话向量表征即是用户兴趣向量表征。构建用户会话向量表征，任一会话表示为S＝{v1,v2,…,v0}。其中vj是会话中第j个物品。构建用户会话向量表征采用长短期记忆网络(LSTM)：

[0011] zS＝LSTM(Q(:,S))

[0012] 其中，Q是物品的向量矩阵，Q(:,S)代表出现在会话S中所有的物品向量。LSTM具体公式为：

[0013] ij＝σ(Wixj+Uihj‑1+bi)

[0014] fj＝σ(Wfxj+Ufhj‑1+bf)

[0015] oj＝σ(Woxj+Uohj‑1+bo)

[0016] cj＝ijtanh(Wcxj+Uchj‑1+bc)+fjcj‑1

[0017] hj＝ojcj

[0018] 其中，不同模态的公式相同且参数不共享，因此公式中省略了模态参数m∈{a,b}。xj是会话序列中第j个物品的向量表征。长短期记忆网络的最后一层的隐藏状态hj的输出就是会话向量表征zS。和分
别是控制输入门ij、遗忘门fj和输出门oj的参数，d代表物品向量的维度；σ为sigmoid函数；
所有这些参数和输入：隐层状态hj‑1、当前输入xj共同参与计算，来输出结果hj。分别用长短期记忆网络对会话模态a的表示和模态b的表示进
行特征建模，得到目标用户的兴趣向量表征 m∈{a,b}。他的第l个朋友的表征为最近会话的向量表征为

[0019] 根据社交网络G，采用基于动态路由的多模态图网络计算朋友对目标用户的社交影响。以下是多模态社交图网络中目标用户的朋友兴趣特征对目标用户模态a的社交影响的计算过程：

[0020]

[0021] 其中，是模态m，m∈{a,b}到模态a的转换矩阵。是目标用户第l个朋友在模态m下的兴趣向量表征, 是目标用户ui在模态a下的兴趣向量表征。r代表动态路由的迭代次数。是目标用户第l个朋友的模态m到目标用户ui模态a的连接参数，是参数归一化后的连接参数。softmaxl为softmax函数，可以得到不同朋友的不同模态对目标用户模态a的重要程度。AGGREGATEl函数表示将目标用户的所有朋友信息聚合，采用求和(SUM)计算方法。squash是胶囊网络中常用的squash向量激活函数。N(i)是目标用户ui的朋友集合，图网络节点信息更新后的即是朋友对目标用户模态特征a的社交影响。以上是朋友对目标用户模态a的社交影响计算过程，朋友对目标用户模态b的社交影响计算过程相同。而本方法借鉴于注意力机制中的归一化方式。具体公式如下：

[0022]

[0023] 结合目标用户兴趣和社交影响，获得用户最终向量表征。用户的兴趣由他当前会话行为和社交影响共同决定，用户的最终表示就由全连接层合并两者得到，令：

[0024]

[0025] 其中，是线性转化矩阵， m∈{a,b}为目标用户ui行为表现出的多模态空间下的兴趣向量表征，是多模态空间下的朋友对目标用户ui的社交影响，为向量拼接操作。

[0026] 根据用户最终向量表征和物品向量表征，推荐物品。将物品vj的向量乘以用户兴趣向量再应用softmax函数计算出物品vj的分数：

[0027]

[0028] 其中，和代表用户在模态空间a和b下的兴趣向量，和是物品vj在模态空间a和b下的向量表征。代表物品vj成为下一个交互的可能性。同时根据的对数似然函数值，计算损失函数：

[0029]

[0030] 其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

[0031] 本发明的有益技术效果如下：

[0032] (1)本发明采用基于动态路由的多模态图网络来解决多模态信息在多模态图网络的传递问题，源节点的不同模态向目标节点的信息传递过程是互相影响的。

[0033] (2)本发明同时也是一种基于注意力机制的图网络，通过改进原始胶囊网络中动态路由的连接系数的归一化方式，可以得到不同朋友的不同模态对目标用户的重要度。

[0034] (3)本发明是一种多模态的会话推荐方法。生成用户兴趣表征时，考虑物品模态内的转换关系，用长短期记忆网络分别对用户当前会话序列的多种模态进行建模。

实施方案

[0038] 为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于多模态交叉融合图网络的会话社交推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

[0039] 会话社交推荐任务是给定用户历史交互序列和社交网络关系，对用户的兴趣和社交影响进行建模，来推荐用户在下一步最可能感兴趣的物品。为了描述清楚，对用到的变量和公式给出相关定义。

[0040] 定义1.U：用户集合。

[0041] 定义2.V：物品集合。

[0042] 定义3.G：关于用户和用户关系的社交网络。

[0043] 定义4.N(i)：社交网络G中用户ui的邻居集合。

[0044] 定义6. 物品vj的多模态向量表征，m∈{a,b}。物品模态a是主图，物品模态b是标题文字描述。

[0045] 定义7. 物品vj模态a的向量表征。

[0046] 定义8. 物品vj模态b的向量表征。

[0047] 定义5. 用户ui在当前时间会话的多模态表示，会话是一个时间段里的物品集合，且m∈{a,b}。会话在模态a下的表示是会话在模态b下的表示是

[0048] 定义9. 从用户行为得到的用户ui的多模态下的兴趣向量表征，且m∈{a,b}。

[0049] 定义10. 用户ui的朋友们的兴趣对用户ui不同模态兴趣的社交影响。

[0050] 定义11. 用户ui的在不同模态空间下总的兴趣向量表征，通过综合考虑和得到。

[0051] 为了给用户推荐下一步最可能感兴趣的物品，本发明提出了一种基于多模态交叉融合图网络的会话社交推荐方法。本方法中物品的特征是多模态(multi‑modal)的，特征包括物品主图和物品标题文字描述这两种模态。如何在社交网络中将两种模态进行有效融合是本方法的重点。本方法先基于序列表征方法得到所有用户在不同模态下的兴趣向量表征，然后采用基于动态路由的多模态图网络进行模态融合。基于动态路由的多模态图网络是本方法的新颖之处。如图3所示，图3是多模态图网络中节点v1向节点v2的信息传递示意图。(a)、(b)和(c)子图是介绍其他已有的方法，(d)子图是本发明中提出的方法。(a)子图是将同一节点的两个模态进行连接，当做一个整体来进行信息传递。(b)子图是单独对两个模态建图，只有相同模态之间才有信息传递，且相同模态之间的信息传递不受其他模态的影响。(c)子图既考虑节点间相同模态之间的信息传递，又考虑不同模态之间的信息传递。但是没有考虑到同一节点的不同模态信息向邻居节点传递信息过程的联系。(d)子图是本方法提出的基于动态路由的多模态图网络。节点v,的不同模态在向节点v2的传递信息的过程是互相影响的。连接系数c控制节点v1模态特征向节点v2传递信息的多少，代表节点v1模态特征的重要程度。节点v1的a模态特征和b模态特征向节点v2传递信息的动态路由参数aa ba aa bac 和c 由节点v1的a模态特征和b模态特征共同决定，且动态路由参数c 和c 互相影响。也就是节点v1的a模态特征向节点v2传递信息过程受到节点v1的b模态特征影响，同样，节点v1的b模态特征向节点v2传递信息过程也受到节点v1的a模态特征影响。

[0052] 本方法主要由三个部分组成，如图2所示。第一部分采用长短期记忆网络生成不同模态空间下的当前会话向量表征，目标用户在不同模态空间下的当前会话向量表征即是不同模态空间下的用户兴趣向量表征。第二部分是采用基于动态路由的多模态图网络从社交网络中得到朋友对目标用户的社交影响。第三部分是综合考虑用户兴趣和社交影响，预测用户下一个点击的物品。

[0053] 如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

[0054] S100，构建目标用户ui的社交网络G，令：

[0055] G＝{U,E}

[0056] 其中，U表示社交网络中目标用户ui的朋友集合，E是目标用户的社交连接。

[0057] S200，使用长短期记忆网络生成不同模态空间下的会话向量表征，目标用户当前会话向量表征即是用户兴趣向量表征。构建用户会话向量表征，任一会话表示为S＝{v1,v2,…,v0}。其中vj是会话中第j个物品。构建用户会话向量表征采用长短期记忆网络(LSTM)：

[0058] zS＝LSTM(Q(:,S))

[0059] 其中，Q是物品的向量矩阵，Q(:,S)代表出现在会话S中所有的物品向量。LSTM具体公式为：

[0060] ij＝σ(Wixj+Uihj‑1+bi)

[0061] fj＝σ(Wfxj+Ufhj‑1+bf)

[0062] oj＝σ(Woxj+Uohj‑1+bo)

[0063] cj＝ijtanh(Wcxj+Uchj‑1+bc)+fjcj‑1

[0064] hj＝ojcj

[0065] 其中，不同模态的公式相同且参数不共享，因此公式中省略了模态参数m∈{a,b}。xj是会话序列中第j个物品的向量表征。长短期记忆网络的最后一层的隐藏状态hj的输出就是会话向量表征zS。和分
别是控制输入门ij、遗忘门fj和输出门oj的参数，d代表物品向量的维度；σ为sigmoid函数；
所有这些参数和输入：隐层状态hj‑1、当前输入xj共同参与计算，来输出结果hj。分别用长短期记忆网络对会话模态a的表示和模态b的表示进
行特征建模，得到目标用户的兴趣向量表征 m∈{a,b}。他的第l个朋友的表征为最近会话的向量表征为 m∈{a,b}。

[0066] S300，根据社交网络G，采用基于动态路由的多模态图网络计算朋友对目标用户的社交影响。以下是多模态社交图网络中目标用户的朋友兴趣特征对目标用户模态a的社交影响的计算过程：

[0067]

[0068] 其中，是模态m，m∈{a,b}到模态a的转换矩阵。是目标用户第l个朋友在模态m下的兴趣向量表征, 是目标用户ui在模态a下的兴趣向量表征。r代表动态路由的迭代次数。是目标用户第l个朋友的模态m到目标用户ui模态a的连接参数，是参数归一化后的连接参数。softmaxl为softmax函数，可以得到不同朋友的不同模态对目标用户模态a的重要程度。AGGREGATEl函数表示将目标用户的所有朋友信息聚合，采用求和(SUM)计算方法。squash是胶囊网络中常用的squash向量激活函数。N(i)是目标用户ui的朋友集合，图网络节点信息更新后的即是朋友对目标用户模态特征a的社交影响。以上是朋友对目标用户模态a的社交影响计算过程，朋友对目标用户模态b的社交影响计算过程相同。而本方法借鉴于注意力机制中的归一化方式。具体公式如下：

[0069]

[0070] S400，结合目标用户兴趣和社交影响，获得用户最终向量表征。用户的兴趣由他当前会话行为和社交影响共同决定，用户的最终表示就由全连接层合并两者得到，令：

[0071]

[0072] 其中，是线性转化矩阵，为目标用户ui行为表现出的多模态空间下的兴趣向量表征，是多模态空间下的朋友对目标用户ui的社交影响，为向量拼接操作。

[0073] S500，根据用户最终向量表征和物品向量表征，推荐物品。将物品vj的向量乘以用户兴趣向量再应用softmax函数计算出物品vj的分数：

[0074]

[0075] 其中，和代表用户在模态空间a和b下的兴趣向量，和是物品vj在模态空间a和b下的向量表征。代表物品vj成为下一个交互的可能性。同时根据的对数似然函数值，计算损失函数：

[0076]

[0077] 其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

[0078] 上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0035] 图1为本发明一种基于多模态交叉融合图网络的会话社交推荐方法的流程示意图；

[0036] 图2为本发明一种基于多模态交叉融合图网络的会话社交推荐方法的模型框架图；

[0037] 图3为本发明一种基于多模态交叉融合图网络的会话社交推荐方法的图网络节点的信息传递示意图。

1基于互联网和数字技术的信息优化处理方法及服务器 2基于人工智能的互联网用户整合方法及大数据服务系统