首页 > 专利 > 中国计量大学 > 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法专利详情

一种基于用户长期兴趣和短期兴趣建模的会话推荐方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-09-06

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-12-17

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-05-17

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-09-06

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202111035960.8	申请日	2021-09-06
公开/公告号	CN113722599B	公开/公告日	2022-05-17
授权日	2022-05-17	预估到期日	2041-09-06
申请年	2021年	公开/公告年	2022年
缴费截止日
分类号	G06F16/9535 、G06Q30/06 、G06N3/04 、G06N3/08	主分类号	G06F16/9535
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	1
权利要求数量	2	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	0	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	中国计量大学	第一申请人	中国计量大学
专利权人	中国计量大学	当前专利权人	中国计量大学
发明人	顾盼、顾建锦	第一发明人	顾盼
地址	浙江省杭州市下沙高教园区学源街258号	邮编	310018
申请人数量	1	发明人数量	2
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明公开了一种基于用户长期兴趣和短期兴趣建模的会话推荐方法。该方法根据给定用户的当前会话和用户历史偏好序列，挖掘出用户的短期兴趣和长期兴趣，进而给用户推荐下一步最可能感兴趣的物品。主要由三个部分组成：第一部分是根据户当前会话序列，采用门控循环单元网络(GRU)抽取用户当前的短期兴趣。第二部分是抽取用户的长期兴趣，具体的做法是基于用户的短期兴趣，同时采用原始注意力机制和时间注意力机制得到时间无关的长期兴趣表征以及时间有关的长期兴趣表征，然后融合两种长期兴趣表征，得到用户的最终长期兴趣表征。第三部分是根据得到的用户长期兴趣表征和短期兴趣表征进行物品推荐。

摘要附图
说明书附图：图1
说明书附图：图2

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-05-17	授权
2	2021-12-17	实质审查的生效	IPC(主分类): G06F 16/9535 专利申请号: 202111035960.8 申请日: 2021.09.06
3	2021-11-30	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于用户长期兴趣和短期兴趣建模的会话推荐方法，其特征在于：
根据用户当前会话中的物品序列，采用门控制循环神经网络获得用户短期兴趣；本方法采用门控循环单元网络(GRU)对用户当前会话中的物品序列
进行建模，当前会话中的物品序列对应的向量表征为门控循环单元网络short
输出为用户短期兴趣表征p ；
根据用户短期兴趣和用户历史偏好序列，采用时间注意力机制得到用户时间相关的长期兴趣；原始的注意力机制是不考虑时间因素的，本方法采用时间注意力机制，将原始注意history
力机制计算得到的注意力值和时间权重结合；使得最终用户历史偏好序列s 中每个物品的权重同时取决于两个因素：物品和用户短期兴趣的相关性以及该物品交互时间和当前time‑relevent
会话交互时间之间的时间间隔；具体和时间相关的长期兴趣p 计算公式如下：
current
δj＝σ(wtlog[t(s )‑t(vj)]+bt)
αj＝softmaxj(ej·δj)
history
其中，xj是历史偏好序列中物品vj的向量表征，且vj∈s ；We和qe分别是转换矩阵和转换向量，σ是sigmoid激活函数；ej是用户短期兴趣和历史偏好序列中物品vj的注意力值，代表了物品vj的重要程度和短期兴趣的相关度；系数ej是只考虑到物品vj和用户短期兴趣的语义相关性，而时间注意力值αj是综合了语义相关性系数ej和时间相关性系数δj，且经过了softmax归一化处理；这里，时间相关性系数δj是关于当前会话时间和物品vj交互时间间current
隔的函数，参数为标量wt和标量bt；注意，这里的时间函数t(s )表示当前会话发生在当time‑relevent
年的第几天；最后用户时间相关的长期兴趣p 为历史偏好序列中所有物品的向量表征乘以对应时间注意力值αj的和；
根据用户短期兴趣和和用户历史偏好序列，采用原始注意力机制得到用户时间无关的长期兴趣；本方法采用注意力机制从用户历史偏好序列中抽取出和用户当前的短期兴趣相time‑irrelevent
关的用户长期兴趣p ；注意力机制会给用户历史偏好序列中的每个物品分配一个权重，表示该物品和用户短期兴趣的相关性，具体公式为：
αj＝softmaxj(ej)
history
其中，xj是历史偏好序列中物品vj的向量表征，且vj∈s ；W1和q1分别是转换矩阵和转换向量；ej是用户短期兴趣和历史偏好序列中物品vj的注意力值，代表了物品vj的重要程度；得到历史偏好序列中所有物品的注意力值之后，对其进行softmax归一化，将注意力值归一化到[0，1]范围内，得到αj；最后历史偏好序列中所有物品的向量表征乘以对应的归一time‑irrelevent
化后的注意力值的和，就是用户时间无关的长期兴趣p ；
long
融合用户的两种长期兴趣，获得用户长期兴趣表征；用户的长期兴趣表征p 融合了用time‑irrelevent time‑relevent
户时间无关的长期兴趣p 以及时间相关的长期兴趣p ；而时间无关的
time‑irrelevent time‑relevent
长期兴趣p 以及时间相关的长期兴趣p 两者的重要性或者系数取决于
time‑irrelevent time‑relevent short long
三个变量，分别为：p 、p 和p ；用户长期兴趣p 具体计算公式如
下：
long time‑relevent time‑irrelevent
p ＝βp +(1‑β)p
其中，和是转换矩阵，qp是转换向量，tanh是tanh激活函数，σ是sigmoid激活time‑relevent
函数；系数β表示用户时间相关的长期兴趣p 的重要程度，系数1‑β表示用户时间time‑irrelevent
无关的长期兴趣p 的重要程度；
根据用户短期兴趣和用户长期兴趣表征，获得用户最终兴趣表征；用户最终兴趣表征p公式如下：
short long
其中，p 和p 分别为用户的短期和长期兴趣，为向量拼接操作，W是线性转化矩阵；
根据用户最终兴趣表征，推荐物品；将物品vj的向量xj乘以用户兴趣向量p，再应用softmax函数计算出物品vj的分数：
其中，p代表用户的兴趣向量，代表物品vj成为下一个交互物品的可能性；同时根据的对数似然函数值，计算损失函数：
其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

2.根据权利要求1所述的一种基于用户长期兴趣和短期兴趣建模的会话推荐方法，其特征在于：所述门控循环单元网络(GRU)为：
zτ＝σ(Wxz·xτ+Whz·hτ‑1)
rτ＝σ(Wxr·xτ+Whr·hτ‑1)
其中，rτ是重置门(resetgate)，zτ为更新门(updategate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出；是当前记忆内容；xτ是当前层的节点输入；
和分别是控制更新门zτ和重置门rτ的参数；
和是控制当前记忆内容的参数；⊙是元素级别的矩阵相乘，σ是
sigmoid函数，tanh是tanh激活函数；门控循环单元网络GRU的输入序列为门控循环单元网络输出为也就是用户短期兴趣
(short‑terminterest)表征为

说明书

技术领域

[0001] 本发明属于互联网服务技术领域，尤其是涉及一种基于用户长期兴趣和短期兴趣建模的会话推荐方法。

背景技术

[0002] 推荐系统是基于用户的偏好，给用户推荐合适的物品或者服务。随着电商的发展，用户在平台上丰富的交互行为被记录下来，这里的交互行为包括:浏览、点击、加购、收藏和购买。这些记录可以帮助推荐系统去理解用户当前的动态兴趣和过去丰富且相对稳定静止的兴趣。

[0003] 传统的推荐方法，例如基于内容的推荐方法和协同过滤方法，仅仅捕捉到用户的静态交互信息。实际上，用户交互活动是不断地更新的，而这种序列数据反映出用户兴趣的变化性。因此，基于序列数据的推荐方法吸引了越来越多的关注，会话推荐方法正是一种基于序列数据的推荐方法。会话是一段时间内的用户交互序列，会话推荐方法可以及时捕捉到用户兴趣的动态变化。很多方法只对用户当前会话进行建模，得到用户的兴趣表征，这样是远远不够的。仅仅从用户当前会话挖掘出用户的动态短期兴趣，数据极为稀疏，还应从历史数据中挖掘出用户的长期兴趣，共同得到用户的偏好。用户在当前会话中的兴趣较为单一，而用户的长期兴趣是多样的。如果从历史交互序列中抽取用户所有兴趣，而不考虑用户当前兴趣，会导致推荐的结果不符合用户当前的兴趣。如：用户当前对外套感兴趣，而用户历史上多次加购外套、水果和家具类的商品，此时推荐方法给用户推荐水果会降低用户的满意度。因此，推荐方法应该抽取出和当前兴趣有关系的长期兴趣，再结合用户当前兴趣，进行物品推荐。

[0004] 电商平台中的物品品类极其丰富，不同品类对时间的敏感度不同。装修、家居、小家电、数码产品和母婴用品等和时间相关性不大，而水果、服饰和绿植等的时间周期规律极其明显。对于时间敏感度不高的兴趣，推荐方法应采用和时间无关的推荐方法；对于时间敏感度极高的兴趣，时间因素应考虑到其中。本推荐方法同时采用原始注意力机制(Vanilla Attention)和时间注意力机制(Time Attention)从用户历史序列中抽取出时间无关的用户长期兴趣以及时间有关的用户长期兴趣，这里抽取出的用户长期兴趣都是和当前短期兴趣相一致的兴趣。然后再根据用户当前兴趣对这两种长期兴趣进行选择和融合，得到用户最终的长期兴趣之后，结合用户当前的短期兴趣，给用户推荐合适的物品。

发明内容

[0005] 本发明所要解决的技术问题是给定用户的当前会话和用户历史偏好序列，挖掘出用户的短期兴趣和长期兴趣，进而给用户推荐下一步最可能感兴趣的物品。其中，用户当前兴趣是单一的且动态变化的，而用户的长期兴趣是多样的且较为稳定的。想要针对用户当前的兴趣点进行推荐，既要从当前会话中抽取出用户的短期兴趣，又要从用户的历史偏好序列中抽取和当前兴趣一致的长期兴趣。同时，应考虑到用户当前感兴趣的物品可能是属于季节周期性明显的品类，如：水果和服饰；也可能是属于和季节无关的品类，如：家居和彩妆。为此，本发明采用以下技术方案：

[0006] 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法，包括以下步骤：

[0007] 根据用户当前会话中的物品序列，采用门控制循环神经网络获得用户短期兴趣。本方法采用门控循环单元网络(GRU)对用户当前会话中的物品序列
进行建模，当前会话中的物品序列对应的向量表征为
公式为：

[0008] zτ＝σ(Wxz·xτ+Whz·hτ‑1)

[0009] rτ＝σ(Wxr·xτ+Whr·hτ‑1)

[0010]

[0011]

[0012] 其中，rτ是重置门(reset gate)，zτ为更新门(update gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xτ是当前层的节点输入。和分别是控制更新门zτ和重置门rτ的参数。
和是控制当前记忆内容的参数。⊙是元素级别的矩阵相乘，σ是
sigmoid函数，tanh是tanh激活函数。门控循环单元网络GRU的输入序列为
门控循环单元网络输出为也就是用户短期兴趣
(short‑term interest)表征为

[0013] 根据用户短期兴趣和用户历史偏好序列，采用时间注意力机制得到用户时间相关的长期兴趣。注意力机制(attention mechanism)的作用是使得抽取的用户长期兴趣是和用户当前的短期兴趣相关的。原始的注意力机制是不考虑时间因素的，本方法采用时间注意力机制(time attention mechanism)，将原始注意力机制计算得到的注意力值和时间权history重结合。使得最终用户历史偏好序列s 中每个物品的权重同时取决于两个因素：物品和用户短期兴趣的相关性以及该物品交互时间和当前会话交互时间之间的时间间隔。具体time‑relevent
和时间相关的长期兴趣p 计算公式如下：

[0014]

[0015] δj＝σ(wtlog[t(scurrent)‑t(vj)]+bt)

[0016] αj＝softmaxj(ej·δj)

[0017]

[0018] 其中，xj是历史偏好序列中物品vj的向量表征，且vj∈shistory。We和qe分别是转换矩阵和转换向量,σ是sigmoid函数。ej是用户短期兴趣和历史偏好序列中物品vj的注意力值(attention value)，代表了物品vj的重要程度和短期兴趣的相关度。系数ej是只考虑到物品vj和用户短期兴趣的语义相关性，而时间注意力值αj是综合了语义相关性系数ej和时间相关性系数δj，且经过了softmax归一化处理。这里，时间相关性系数δj是关于当前会话时间current和物品vj交互时间间隔的函数，参数为标量wt和标量bt。注意，这里的时间函数t(s )表current
示当前会话发生在当年的第几天。如：当前会话发生在时间2021年8月1日，那么t(s )＝213，表示发生在当年的第213天。该时间函数充分表现了物品的季节周期性。最后用户时time‑relevent
间相关的长期兴趣p 为历史偏好序列中所有物品的向量表征乘以对应时间注意力值αj的和。

[0019] 根据用户短期兴趣和和用户历史偏好序列，采用原始注意力机制得到用户时间无关的长期兴趣。本方法采用注意力机制(attention mechanism)从用户历史偏好序列中抽time‑irrelevent取出和用户当前的短期兴趣相关的用户长期兴趣p 。注意力机制会给用户历史偏好序列中的每个物品分配一个权重(注意力值)，表示该物品和用户短期兴趣的相关性，具体公式为：

[0020]

[0021] αj＝softmaxj(ej)

[0022]

[0023] 其中，xj是历史偏好序列中物品vj的向量表征，且vj∈shistory。W1和q1分别是转换矩阵和转换向量。ej是用户短期兴趣和历史偏好序列中物品vj的注意力值，代表了物品vj的重要程度。得到历史偏好序列中所有物品的注意力值之后，对其进行softmax归一化，将注意力值归一化到[0,1]范围内，得到αj。最后历史偏好序列中所有物品的向量表征乘以对应的time‑irrelevent归一化后的注意力值的和，就是用户时间无关的长期兴趣p 。

[0024] 融合用户的两种长期兴趣，获得用户长期兴趣表征。用户的长期兴趣表征plong融time‑irrelevent time‑relevent合了用户时间无关的长期兴趣p 以及时间相关的长期兴趣p 。而时间
time‑irrelevent time‑relevent
无关的长期兴趣p 以及时间相关的长期兴趣p 两者的重要性或者系数
time‑irrelevent time‑relevent short
取决于三个变量，分别为：p 、p 和p 。原因是品类是否具有时间周期
short
性，取决于用户的当前兴趣p ，且抽取的用户时间无关的长期兴趣以及时间相关的长期兴趣都是和当前短期兴趣相一致的兴趣。因此，同时把这三个向量作为输入，得到两种长期long
兴趣的重要性。用户长期兴趣p 具体计算公式如下：

[0025]

[0026] plong＝βptime‑relevent+(1‑β)ptime‑irrelevent

[0027] 其中，和是转换矩阵，qp是转换向量，tanh是tanh激活函数，σ是sigmoidtime‑relevent激活函数。系数β表示用户时间相关的长期兴趣p 的重要程度，系数1‑β表示用户time‑irrelevent
时间无关的长期兴趣p 的重要程度。

[0028] 根据用户短期兴趣和用户长期兴趣表征，获得用户最终兴趣表征。用户最终兴趣表征p公式如下：

[0029]

[0030] 其中，pshort和plong分别为用户的短期和长期兴趣，为向量拼接操作，W是线性转化矩阵。

[0031] 根据用户最终兴趣表征，推荐物品。将物品vj的向量xj乘以用户兴趣向量p，再应用softmax函数计算出物品vj的分数：

[0032]

[0033] 其中，p代表用户的兴趣向量，代表物品vj成为下一个交互物品的可能性。同时根据的对数似然函数值，计算损失函数：

[0034]

[0035] 其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

[0036] 本发明的有益技术效果如下：

[0037] (1)本发明综合考虑用户短期兴趣和用户长期兴趣。用户短期兴趣是单一的，而用户长期兴趣是多样的，为了对用户当前兴趣进行更准确地把握，本发明从用户历史偏好序列中抽取出和用户当前兴趣相关的用户长期兴趣。

[0038] (2)本发明考虑到用户当前感兴趣的品类既可能是季节周期敏感型，也可能是和时间无关型。因此，同时用原始注意力机制和时间注意力机制挖掘出用户时间无关的长期兴趣以及用户时间相关的长期兴趣，并进行选择和融合，得到用户的长期兴趣。进而再和用户短期兴趣融合，得到用户的最终兴趣表征。

实施方案

[0041] 为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于用户长期兴趣和短期兴趣建模的会话推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

[0042] 首先，需要对用到的变量和公式给出相关定义。

[0043] 定义1.V：物品集合，且V＝{v1,v2,…,v|V|}，|V|代表物品集合中物品的数量。

[0044] 定义2.scurrent：当前会话，会话是当前时间段里的所有交互物品集合current|s |代表会话中物品的数量。

[0045] 定义3.shistory：历史偏好序列，历史偏好序列是用户历史上加购、收藏和购买的物history品集合 |s |代表历史偏好序列中物品的数量。

[0046] 定义4.S：系统中的会话集合，S＝{s1,s2,…,s|S|}，|S|代表会话集合中会话的数量。

[0047] 定义5. 物品vj的向量表征。

[0048] 定义6.pshort：当前会话的向量表征，也代表着用户短期兴趣向量表征。

[0049] 定义7.ptime‑relevent：用户和时间相关的长期兴趣向量表征。

[0050] 定义8.ptime‑irrelevent：用户和时间无关的长期兴趣向量表征。

[0051] 定义9.plong：用户长期兴趣向量表征,结合了用户时间相关的长期兴趣向量表征以及用户时间无关的长期兴趣向量表征。

[0052] 结合以上变量定义，将最终的问题定义为：给定用户的当前会话scurrent和用户历history史偏好序列s ，会话推荐方法对用户的短期兴趣和长期兴趣进行建模，来推荐用户在下一步最可能感兴趣的物品，物品是物品集合V的子集。

[0053] 电商平台中用户的交互行为包括浏览、点击、加购、收藏和购买行为。对于当前会话，本方法将所有的交互行为都纳入当前会话中，所有的交互行为都能代表用户当前的需求和兴趣。而抽取用户长期稳定的兴趣，本方法只考虑用户的加购、收藏和购买行为，这些行为体现了用户明确的喜好。因此，在本方法中，当前会话序列中包含了用户的当前所有交互行为，而历史偏好序列仅仅包含用户的历史加购、收藏和购买行为。

[0054] 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法的向前传播(forward propagation)部分主要由三个部分组成，如图2所示。第一部分是根据户当前会话序列，采用门控循环单元网络(GRU)抽取用户当前的短期兴趣(short‑term interest)。第二部分是抽取用户的长期兴趣(long‑term interest)，具体的做法是基于用户的短期兴趣，同时采用原始注意力机制和时间注意力机制得到时间无关的长期兴趣表征以及时间有关的长期兴趣表征，然后融合两种长期兴趣表征，得到用户的最终长期兴趣表征。第三部分是根据得到的用户长期兴趣表征和短期兴趣表征进行物品推荐。

[0055] 如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

[0056] S100，根据用户当前会话中的物品序列，采用门控制循环神经网络获得用户短期兴趣。本方法采用门控循环单元网络(GRU)对用户当前会话中的物品序列进行建模，当前会话中的物品序列对应的向量表征为
公式为：

[0057] zτ＝σ(Wxz·xτ+Whz·hτ‑1)

[0058] rτ＝σ(Wxr·xτ+Whr·hτ‑1)

[0059]

[0060]

[0061] 其中，rτ是重置门(reset gate)，zτ为更新门(update gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xτ是当前层的节点输入。和分别是控制更新门zτ和重置门rτ的参数。
和是控制当前记忆内容的参数。⊙是元素级别的矩阵相乘，σ是
sigmoid函数，tanh是tanh激活函数。门控循环单元网络GRU的输入序列为
门控循环单元网络输出为也就是用户短期兴趣
(short‑term interest)表征为

[0062] S200,根据用户短期兴趣和用户历史偏好序列，采用时间注意力机制得到用户时间相关的长期兴趣。注意力机制(attention mechanism)的作用是使得抽取的用户长期兴趣是和用户当前的短期兴趣相关的。原始的注意力机制是不考虑时间因素的，本方法采用时间注意力机制(time attention mechanism)，将原始注意力机制计算得到的注意力值和history时间权重结合。使得最终用户历史偏好序列s 中每个物品的权重同时取决于两个因素：物品和用户短期兴趣的相关性以及该物品交互时间和当前会话交互时间之间的时间间time‑relevent
隔。具体和时间相关的长期兴趣p 计算公式如下：

[0063]

[0064] δj＝σ(wtlog[t(scurrent)‑t(vj)]+bt)

[0065] αj＝softmaxj(ej·δj)

[0066]

[0067] 其中，xj是历史偏好序列中物品vj的向量表征，且vj∈shistory。We和qe分别是转换矩阵和转换向量,σ是sigmoid函数。ej是用户短期兴趣和历史偏好序列中物品vj的注意力值(attention value)，代表了物品vj的重要程度和短期兴趣的相关度。系数ej是只考虑到物品vj和用户短期兴趣的语义相关性，而时间注意力值αj是综合了语义相关性系数ej和时间相关性系数δj，且经过了softmax归一化处理。这里，时间相关性系数δj是关于当前会话时间current和物品vj交互时间间隔的函数，参数为标量wt和标量bt。注意，这里的时间函数t(s )表current
示当前会话发生在当年的第几天。如：当前会话发生在时间2021年8月1日，那么t(s )＝213，表示发生在当年的第213天。该时间函数充分表现了物品的季节周期性。最后用户时time‑relevent
间相关的长期兴趣p 为历史偏好序列中所有物品的向量表征乘以对应时间注意力值αj的和。

[0068] S300,根据用户短期兴趣和和用户历史偏好序列，采用原始注意力机制得到用户时间无关的长期兴趣。本方法采用注意力机制(attention mechanism)从用户历史偏好序time‑irrelevent列中抽取出和用户当前的短期兴趣相关的用户长期兴趣p 。注意力机制会给用户历史偏好序列中的每个物品分配一个权重(注意力值)，表示该物品和用户短期兴趣的相关性，具体公式为：

[0069]

[0070] αj＝softmaxj(ej)

[0071]

[0072] 其中，xj是历史偏好序列中物品vj的向量表征，且vj∈shistory。W1和q1分别是转换矩阵和转换向量。ej是用户短期兴趣和历史偏好序列中物品vj的注意力值，代表了物品vj的重要程度。得到历史偏好序列中所有物品的注意力值之后，对其进行softmax归一化，将注意力值归一化到[0,1]范围内，得到αj。最后历史偏好序列中所有物品的向量表征乘以对应的time‑irrelevent归一化后的注意力值的和，就是用户时间无关的长期兴趣p 。

[0073] S400,融合用户的两种长期兴趣，获得用户长期兴趣表征。用户的长期兴趣表征long time‑irrelevent time‑releventp 融合了用户时间无关的长期兴趣p 以及时间相关的长期兴趣p 。而
time‑irrelevent time‑relevent
时间无关的长期兴趣p 以及时间相关的长期兴趣p 两者的重要性或者
time‑irrelevent time‑relevent short
系数取决于三个变量，分别为：p 、p 和p 。原因是品类是否具有时间
short
周期性，取决于用户的当前兴趣p ，且抽取的用户时间无关的长期兴趣以及时间相关的长期兴趣都是和当前短期兴趣相一致的兴趣。因此，同时把这三个向量作为输入，得到两种long
长期兴趣的重要性。用户长期兴趣p 具体计算公式如下：

[0074]

[0075] plong＝βptime‑relevent+(1‑β)ptime‑irrelevent

[0076] 其中，和是转换矩阵，qp是转换向量，tanh是tanh激活函数，σ是sigmoidtime‑relevent激活函数。系数β表示用户时间相关的长期兴趣p 的重要程度，系数1‑β表示用户time‑irrelevent
时间无关的长期兴趣p 的重要程度。

[0077] S500,根据用户短期兴趣和用户长期兴趣表征，获得用户最终兴趣表征。用户最终兴趣表征p公式如下：

[0078]short long

[0079] 其中，p 和p 分别为用户的短期和长期兴趣，为向量拼接操作，W是线性转化矩阵。

[0080] S600，根据用户最终兴趣表征，推荐物品。将物品vj的向量xj乘以用户兴趣向量p，再应用softmax函数计算出物品vj的分数：

[0081]

[0082] 其中，p代表用户的兴趣向量，代表物品vj成为下一个交互物品的可能性。同时根据的对数似然函数值，计算损失函数：

[0083]

[0084] 其中，yj代表vj的one‑hot编码，函数用梯度下降法来最优化。

[0085] 上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0039] 图1为本发明一种基于用户长期兴趣和短期兴趣建模的会话推荐方法的流程示意图；

[0040] 图2为本发明一种基于用户长期兴趣和短期兴趣建模的会话推荐方法的模型框架图。

1基于互联网和数字技术的信息优化处理方法及服务器 2基于人工智能的互联网用户整合方法及大数据服务系统