首页 > 专利 > 中国计量大学 > 一种基于细粒度的多方面分析的短视频点击率预测方法专利详情

一种基于细粒度的多方面分析的短视频点击率预测方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2020-12-08
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2021-03-30
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-11-16
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2040-12-08
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN202011443387.X 申请日 2020-12-08
公开/公告号 CN112492396B 公开/公告日 2021-11-16
授权日 2021-11-16 预估到期日 2040-12-08
申请年 2020年 公开/公告年 2021年
缴费截止日
分类号 H04N21/466G06N3/04 主分类号 H04N21/466
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 1
权利要求数量 2 非专利引证数量 0
引用专利数量 0 被引证专利数量 0
非专利引证
引用专利 被引证专利
专利权维持 2 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 中国计量大学 当前专利权人 中国计量大学
发明人 顾盼 第一发明人 顾盼
地址 浙江省杭州市下沙高教园区学源街258 邮编 310018
申请人数量 1 发明人数量 1
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
摘要
本发明公开了一种基于细粒度的多方面分析的短视频点击率预测方法。该方法根据用户对短视频的点击和未点击序列,预测用户对目标短视频的点击率。本方法主要由五个部分组成:第一部分是将用户行为序列分割成块(block)序列,并在块内采用自注意力机制得到块向量表征。第二部分是采用长短期记忆网络从块向量表征抽取用户动态兴趣表征。第三部分是利用门机制从用户兴趣表征和目标短视频中抽取多方面(multi‑aspect)特征。第四部分是利用交互注意力机制(interactive attention),得到多方面的重要性,并更新多方面特征。第五部分是利用基于目标短视频的注意力机制,从多方面特征中抽取和目标短视频相关的兴趣向量表征,并预测用户对目标短视频的点击率。
  • 摘要附图
    一种基于细粒度的多方面分析的短视频点击率预测方法
  • 说明书附图:图1
    一种基于细粒度的多方面分析的短视频点击率预测方法
  • 说明书附图:图2
    一种基于细粒度的多方面分析的短视频点击率预测方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-11-16 授权
2 2021-03-30 实质审查的生效 IPC(主分类): H04N 21/466 专利申请号: 202011443387.X 申请日: 2020.12.08
3 2021-03-12 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于细粒度的多方面分析的短视频点击率预测方法,其特征在于:
将用户正负反馈信息分块,块内采用自注意力机制得到块向量表征;对于一个用户的点击行为序列 可以表示为 其中 是短视频的封面图特征向量,d是
特征向量长度;未点击序列可以表示为 本方法用一个长度为w的窗口将序
+ ‑
列X以及X分割成m个块;每个块特征表征sj的计算方式如下:
sj=tanh(W4mj+bs)
其中,用户的正负反馈序列分块计算方法一致且参数不共享,并且所有的公式略去表示正负反馈的上标+和‑;xji代表序列中第j个块中的第i个短视频向量表征, 是采用平均法得到的第j个块向量表征,mj是采用自注意力机制得到的第j个块向量表征,sj表示最终的第j个块向量表征,且S={s1,s2,...,sm}表示块序列;attnji代表xji的重要程度;sj=tanh(W4mj+bs)表示在自注意力机制上再加一层MLP,增强模型的非线性;
是模型需要训练的参数;σ
为sigmoid函数,tanh代表tanh激活函数;
采用长短期记忆网络从块向量表征抽取用户动态兴趣表征hj;其中用户的正负反馈序列计算方法一致且参数不共享,并且所有的公式略去表示正负反馈的上标+和‑,抽取所述用户动态兴趣表征hj的公式如下:
hj=LSTM(sj)
其中,sj表示第j个块向量表征;LSTM(sj)表示长短时记忆网络对序列s={s1,s2,...,sm}进行建模;
利用门机制从从用户兴趣表征和目标短视频中抽取多方面特征;短视频由更细粒度的方面组成;本方法采用门机制抽取方面特征,下面公式是抽取第j个用户兴趣表征的第k个方面,其中用户的正负反馈序列计算方法一致且参数共享,并且所有的公式略去表示正负反馈的上标+和‑:
pk,j=hj⊙σ(Wk,1hj+Wk,2qk+bk)
其中, 和 是第k个方面的转移矩阵, 是第k个方面的偏置向
量;σ是sigmoid激活函数,⊙是元素级别的乘法;hj是从块向量表征抽取的第j个用户兴趣表征,qk是第k个方面表征且qk为所有用户共享;短视频的方面个数M是超参数;得到用户兴趣的每个方面向量表征之后,本方法采用平均池将所有用户兴趣中同一个方面信息聚合:
其中,m是用户兴趣的个数;最后可以从正反馈和负反馈序列中得到M个方面特征 和同样,采用相同参数的门机制 从目标短视频向量
new
表征x 中得到M个方面特征
利用交互注意力机制,得到多方面的重要性,并更新多方面特征;交互指代由正反馈和负反馈序列中抽取的方面特征共同决定多方面的重要性,具体公式如下:
attnk=softmax(attnk)
其中, 和 分别是从正反馈和负反馈序列中抽取的方面特征;cos三角函数是计算向量相似度的基本公式;且‑cos表示正负反馈相同方面的特征越接近,attnk越小,也就是该方面的重要性越低;反之,正负反馈相同方面的特征差异越大,attnk越大,也就是该方面的重要性越高;softmax是一种正则化方式;用 和 分别得到正反馈和负反馈序列的考虑了方面重要性的方面特征 和
利用基于目标短视频的注意力机制,从多方面特征中抽取和目标短视频相关的兴趣向量表征;基于目标短视频指代序列的方面特征的重要性取决于目标短视频:
其中, 和 为正反馈和负反馈序列的第k个方面特征, 为目标短视频第k个方面特征;参数 和参数W5, 控制每个方面特征的权重,参数b是偏置参数;σ是sigmoid激活函数; 和 分别代表是正反馈和负反馈序列的第k个方面特征基于目标短视‑ +
频的重要性;v和v分别为用户在正反馈序列和负反馈序列下的兴趣表征;
根据用户兴趣表征,预测用户对目标短视频的点击率:
+ ‑
其中,v 和v 分别为用户在正反馈序列和负反馈序列下的兴趣表征, 为向量拼接操作;v是结合了用户正反馈和负反馈信息的最终的兴趣表征; 和 是转移
矩阵, 是偏置向量,b2是偏置标量;σ是sigmoid激活函数;
根据模型特性,设计损失函数;通过用户对目标短视频的点击率预测值 计算预测值和真实值y之间的误差,进而使用误差来更新模型参数;其中采用交叉熵损失函数来指导模型参数的更新过程:
其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频;σ是sigmoid函数;最后采用Adam优化器更新模型参数。

2.根据权利要求1所述的一种基于细粒度的多方面分析的短视频点击率预测方法,其特征在于:所述长短时记忆网络结构为:
ij=σ(Wisj+Uihj‑1+bi)
fj=σ(Wfsj+Ufhj‑1+bf)
oj=σ(Wosj+Uohj‑1+bo)
cj=iktanh(Wcsj+Uchj‑1+bc)+fjcj‑1
hj=ojcj
其中,长短期记忆网络每一层的隐藏状态hj的输出就是用户兴趣表征;sj是第j个块向量表征,为当前层的节点输入;
和 分别是控制输入门ij、遗忘门fj和输出门oj的参数;cj‑1是上一层单元状态,Wc、Uc和bc是控制单元状态cj更新的参数;σ为sigmoid函数;所有这些参数和隐层状态hj‑1以及当前输入sj共同参与计算,来输出结果hj。
说明书

技术领域

[0001] 本发明属于互联网服务技术领域,尤其是涉及一种基于细粒度的多方面分析的短视频点击率预测方法。

背景技术

[0002] 短视频是一种新型的且时间较短的视频。短视频的拍摄不需要使用专业设备,也不需要专业技巧。用户直接通过手机就可以很方便地进行拍摄和上传到短视频平台,因此短视频平台的短视频数量增长得非常快。这使得对有效短视频推荐系统的需求非常迫切,有效的短视频推荐系统可以提升用户体验和用户黏性,从而给平台带来巨大的商业价值。
[0003] 近些年,很多研究者提出了基于视频的个性化推荐方法。这些方法可以分为三类:协同过滤、基于内容的推荐和混合推荐方法。但是相比于视频,短视频有着不同的特点:描述文本质量较低、时长较短且用户在一段时间内的交互序列较长。因此,短视频推荐是一个更具有挑战性的任务,并且有研究者提出了一些方法。例如,Chen等人利用分层的注意力机制去计算物品和类目这两种级别的重要性,得到更准确的预测结果。Li等人结合正负反馈数据,并使用基于图的循环神经网络去建模,最后得到用户的偏好。
[0004] Chen等人的方法只采用了用户的正反馈信息,没有考虑用户的负反馈信息对推荐的影响。Li等人的方法没有更细粒度地分析用户的正反馈信息和负反馈信息之间的相同点和差异点,采用相同的模型结构来处理正反馈和负反馈信息。通常来讲,结合用户的正反馈和负反馈信息来预测用户对目标短视频的点击率,需要判断正反馈和负反馈的相同特征和不同特征。如果是正反馈和负反馈信息中都普遍出现的特征,那么代表用户不看重该特征,也就是特征的重要性较低。如果是正反馈和负反馈信息中的不同特征,那么代表这个特征比较重要,决定了用户是否点击该短视频。本方法利用门机制从正反馈和负反馈信息中抽取多方面(multi‑aspect)特征,并利用交互注意力机制(interactive attention)细粒度地对用户的正负反馈信息的多方面特征进行分析,来提高推荐的准确性。

发明内容

[0005] 本发明所要解决的技术问题是根据用户对短视频的点击和未点击序列,预测用户对目标短视频的点击率。本方法分析正反馈和负反馈的相同特征和不同特征。如果是正反馈和负反馈信息中都普遍出现的特征,那么代表用户不看重该特征,也就是特征的重要性较低。如果是正反馈和负反馈信息中的不同特征,那么代表这个特征比较重要,决定了用户是否点击该短视频。为此,本发明采用以下技术方案:
[0006] 一种基于细粒度的多方面分析的短视频点击率预测方法,包括以下步骤:
[0007] 将用户正负反馈信息分块(block),块内采用自注意力机制得到块向量表征。对于一个用户的点击行为序列 可以表示为 其中 是短视频的封面图特征向量,d是特征向量长度。未点击序列可以表示为 因为短视频时长较
+ ‑
短,造成用户的行为序列比较长。所以,本方法用一个长度为w的窗口将序列X以及X分割成m个块,用户在一个块里的交互的短视频往往比较相似。每个块特征表征sj的计算方式如下:
[0008]
[0009] attnji=W0σ(W1xji+W2mj+ba)
[0010]
[0011] sj=ranh(W4mj+bs)
[0012] 其中,用户的正负反馈序列计算方法一致且参数不共享,为了表达简单,以上所有的公式略去表示正负反馈的上标+和‑。xji代表序列中第j个块中的第i个短视频向量表征,sj表示第j个块向量表征,且S={s1,s2,…,sm}表示块序列。attnji代表xji的重要程度。sj=tanh(W4mj+bs)表示在自注意力机制上再加一层MLP,增强模型的非线性。和 是模型需要训练的参数。σ
为sigmoid函数,tanh代表tanh激活函数。
[0013] 采用长短期记忆网络从块(block)向量表征抽取用户动态兴趣表征hj。同样,用户的正负反馈序列计算方法一致且参数不共享,为了表达简单,以下所有的公式略去上标+和‑:
[0014] hj=LSTM(sj)
[0015] 其中,sj表示第j个块向量表征。LSTM(sj)表示长短时记忆网络(LSTM)对序列S={s1,s2,...,sm}进行建模,如下:
[0016] ij=σ(Wisj+uihj‑1+bi)
[0017] fj=σ(Wfsj+ufhj‑1+bf)
[0018] oj=σ(Wosj+uohj‑1+bo)
[0019] cj=iktanh(Wcsj+uchj‑1+bc)+fjcj‑1
[0020] hj=ojcj
[0021] 其中,长短期记忆网络每一层的隐藏状态hj的输出就是用户兴趣表征。sj是当前层的节点输入, 和 分别是控制输入门ij、遗忘门fj和输出门oj的参数。σ为sigmoid函数。所有这些参数和输入:隐层状态hj‑1、当前输入sj共同参与计算,来输出结果hj。
[0022] 利用门机制从从用户兴趣表征和目标短视频中抽取多方面(multi‑aspect)特征。短视频由更细粒度的方面(比如,视频场景、视频主题、视频情绪)组成。本方法采用门机制抽取方面特征,下面公式是抽取第j个用户兴趣表征的第k个方面。用户的正负反馈序列计算方法一致且参数共享,为了表达简单,以下所有的公式略去上标+和‑:
[0023] pk,j=hj⊙σ(Wk,1hj+Wk,2qk+bk)
[0024] 其中, 和 是第k个方面的转移矩阵, 是第k个方面的偏置向量。σ是sigmoid激活函数,⊙是元素级别的乘法。hj是从块(block)向量表征抽取的第j个用户兴趣表征,qk是第k个方面表征且qk为所有用户共享。短视频的方面个数M是超参数。
得到每个块的每个方面向量表征之后,本方法采用平均池(average pooling)将所有用户兴趣中同一个方面信息聚合:
[0025]
[0026] 其中,m是用户兴趣的个数。最后我们可以从正反馈和负反馈序列中得到M个方面特征 和 采用相同的办法,可以从目标短视频中得到M个方面特征
[0027] 利用交互注意力机制(interactive attention),得到多方面(multi‑aspect)的重要性,并更新多方面特征。分析正反馈和负反馈的相同特征和不同特征。如果是正反馈和负反馈信息中都普遍出现的特征,那么代表用户不看重该特征,也就是特征的重要性较低。如果是正反馈和负反馈信息中的不同特征,那么代表这个特征比较重要,决定了用户是否点击该短视频。多方面(multi‑aspect)的重要性计算公式如下:
[0028]
[0029] attnk=softmax(attnk)
[0030] pk=attnkpk
[0031] 其中, 和 分别是从正反馈和负反馈序列中抽取的方面特征。cos三角函数是计算向量相似度的基本公式。且‑cos表示正负反馈相同方面的特征越接近,attnk越小,也就是该方面的重要性越低。反之,正负反馈相同方面的特征差异越大,attnk越大,也就是该方面的重要性越高。softmax是一种正则化方式。
[0032] 利用基于目标短视频的注意力机制,从多方面(multi‑aspect)特征中抽取和目标短视频相关的兴趣向量表征。用户的正负反馈序列计算方法一致且参数不共享,为了表达简单,以下所有的公式略去上标+和‑:
[0033]
[0034]
[0035] 其中,pk为序列第k个方面特征, 为目标短视频第k个方面特征。参数 和参数 控制每个方面特征的权重,参数b是偏置参数。σ是sigmoid激活函数。
[0036] 根据用户兴趣表征,预测用户对目标短视频的点击率:
[0037]
[0038]+ ‑
[0039] 其中,v 和v 分别为用户在正反馈序列和负反馈序列下的兴趣表征,为向量拼接操作。 和 是转移矩阵, 是偏置向量,b2是偏置标量。σ是sigmoid激活函数。
[0040] 根据模型特性,设计损失函数。通过用户对目标短视频的点击率预测值 计算预测值 和真实值y之间的误差,进而使用误差来更新模型参数。我们采用交叉熵损失函数来指导模型参数的更新过程:
[0041]
[0042] 其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频。σ是sigmoid函数。最后采用Adam优化器更新模型参数。
[0043] 本发明的有益技术效果如下:
[0044] (1)本发明提出了一种基于细粒度的多方面分析的短视频点击率预测方法。采用基于方面(aspect)的门机制将用户的正反馈和负反馈序列转换到相同的方面(aspect)空间下,并一一对应进行比较和分析。
[0045] (2)本发明提出了一种基于细粒度的多方面分析的短视频点击率预测方法。采用交互注意力机制(interactive attention)计算不同方面的重要性。方面的重要性取决于正反馈和负反馈信息中一一对应的方面(aspect)特征的相似度。
[0046] (3)本发明将用户行为序列分割成块(block)序列,且因块内的短视频间隔时间太短,而不考虑块内的序列性,只考虑块间的序列性。所以,在块内采用自注意力(self‑attention)机制得到块向量表征,再采用长短期记忆网络从块(block)向量表征抽取用户动态兴趣表征。

实施方案

[0049] 为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种基于细粒度的多方面分析的短视频点击率预测方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
[0050] 短视频点击率预测任务是建立一个模型去预测用户点击短视频的概率。用户的历史序列表示为 其中p∈{+,‑}分别代表点击和未点击行为,xj代表第j个短视频,l是序列的长度。整个序列可以进一步细分为点击序列 和未点击序列也就是正反馈和负反馈信息。因此,短视频点击率预测问题可以表示成:输
入用户点击序列 未点击的序列 以及目标短视频xnew,来预测用户对目标短视频xnew的点击率。
[0051] 为此,本发明提出了一种基于细粒度的多方面分析的短视频点击率预测方法。它根据用户对短视频的点击和未点击序列,预测用户对目标短视频的点击率。这里的用户短视频序列输入的是短视频的封面图向量表征。通常来讲,结合用户的正反馈和负反馈信息来预测用户对目标短视频的点击率,需要判断正反馈和负反馈的相同特征和不同特征。如果是正反馈和负反馈信息中都普遍出现的特征,那么代表用户不看重该特征,也就是特征的重要性较低。如果是正反馈和负反馈信息中的不同特征,那么代表这个特征比较重要,决定了用户是否点击该短视频。本方法细粒度地对用户的正负反馈信息的多方面进行分析,来提高推荐的准确性。
[0052] 本方法主要由五个部分组成,如图2所示。第一部分是将用户行为序列分割成块(block)序列,并在块内采用自注意力机制得到块(block)向量表征。短视频平台中,短视频时间较短且用户的短视频观看行为非常频繁,可以认为序列中连续的短视频具有相近的特征。第二部分是采用长短期记忆网络从块(block)向量表征抽取用户动态兴趣表征。第三部分是利用门机制从用户兴趣表征和目标短视频中抽取多方面(multi‑aspect)特征。第四部分是利用交互注意力机制(interactive attention),得到多方面(multi‑aspect)的重要性,并更新多方面特征。第五部分是利用基于目标短视频的注意力机制,从多方面(multi‑aspect)特征中抽取和目标短视频相关的兴趣向量表征,并预测用户对目标短视频的点击率。
[0053] 如图1所示,按照本发明的一个实施例,本方法包括如下步骤:
[0054] S100,将用户正负反馈信息分块(block),块内采用自注意力机制得到块向量表征。对于一个用户的点击行为序列 可以表示为 其中 是短视频的封面图特征向量,d是特征向量长度。未点击序列可以表示为 因为短视频时
+ ‑
长较短,造成用户的行为序列比较长。所以,本方法用一个长度为w的窗口将序列X以及X分割成m个块,用户在一个块里的交互的短视频往往比较相似。每个块特征表征sj的计算方式如下:
[0055]
[0056] attnji=W0σ(W1xji+W2mj+ba)
[0057]
[0058] sj=tanh(W4mj+bs)
[0059] 其中,用户的正负反馈序列计算方法一致且参数不共享,为了表达简单,以上所有的公式略去表示正负反馈的上标+和‑。xji代表序列中第j个块中的第i个短视频向量表征,sj表示第j个块向量表征,且S={s1,s2,...,sm}表示块序列。attnji代表xji的重要程度。sj=tanh(W4mj+bs)表示在自注意力机制上再加一层MLP,增强模型的非线性。和 是模型需要训练的参数。σ
为sigmoid函数,tanh代表tanh激活函数。
[0060] S200,采用长短期记忆网络从块(block)向量表征抽取用户动态兴趣表征hj。同样,用户的正负反馈序列计算方法一致且参数不共享,为了表达简单,以下所有的公式略去上标+和‑:
[0061] hj=LSTM(sj)
[0062] 其中,sj表示第j个块向量表征。LSTM(sj)表示长短时记忆网络(LSTM)对序列S=(s1,s2,...,sm}进行建模,如下:
[0063] ij=σ(Wisj+uihj‑1+bi)
[0064] fj=σ(Wfsj+ufhj‑1+bf)
[0065] oj=σ(Wosj+uohj‑1+bo)
[0066] cj=iktanh(Wcsj+uchj‑1+bc)+fjcj‑1
[0067] hj=ojcj
[0068] 其中,长短期记忆网络每一层的隐藏状态hj的输出就是用户兴趣表征。sj是当前层的节点输入, 和 分别是控制输入门ij、遗忘门fj和输出门oj的参数。σ为sigmoid函数。所有这些参数和输入:隐层状态hj‑1、当前输入sj共同参与计算,来输出结果hj。
[0069] S300,利用门机制从从用户兴趣表征和目标短视频中抽取多方面(multi‑aspect)特征。短视频由更细粒度的方面(比如,视频场景、视频主题、视频情绪)组成。本方法采用门机制抽取方面特征,下面公式是抽取第j个用户兴趣表征的第k个方面。用户的正负反馈序列计算方法一致且参数共享,为了表达简单,以下所有的公式略去上标+和‑:
[0070] pk,j=hj⊙σ(Wk,1hj+Wk,2qk+bk)
[0071] 其中, 和 是第k个方面的转移矩阵, 是第k个方面的偏置向量。σ是sigmoid激活函数,⊙是元素级别的乘法。hj是从块(block)向量表征抽取的第j个用户兴趣表征,qk是第k个方面表征且qk为所有用户共享。短视频的方面个数M是超参数,本方法中通过实验验证设置为5。得到用户兴趣的每个方面向量表征之后,本方法采用平均池(average pooling)将所有用户兴趣中同一个方面信息聚合:
[0072]
[0073] 其中,m是用户兴趣的个数。最后我们可以从正反馈和负反馈序列中得到M个方面特征 和 采用相同的办法,可以从目标短视频中得到M个方面特征
[0074] S400,利用交互注意力机制(interactive attention),得到多方面(multi‑aspect)的重要性,并更新多方面特征。分析正反馈和负反馈的相同特征和不同特征。如果是正反馈和负反馈信息中都普遍出现的特征,那么代表用户不看重该特征,也就是特征的重要性较低。如果是正反馈和负反馈信息中的不同特征,那么代表这个特征比较重要,决定了用户是否点击该短视频。多方面(multi‑aspect)的重要性计算公式如下:
[0075]
[0076] attnk=softmax(attnk)
[0077] pk=attnkpk
[0078] 其中, 和 分别是从正反馈和负反馈序列中抽取的方面特征。cos三角函数是计算向量相似度的基本公式。且‑cos表示正负反馈相同方面的特征越接近,attnk越小,也就是该方面的重要性越低。反之,正负反馈相同方面的特征差异越大,attnk越大,也就是该方面的重要性越高。softmax是一种正则化方式。
[0079] S500,利用基于目标短视频的注意力机制,从多方面(multi‑aspect)特征中抽取和目标短视频相关的兴趣向量表征。用户的正负反馈序列计算方法一致且参数不共享,为了表达简单,以下所有的公式略去上标+和‑:
[0080]
[0081]
[0082] 其中,pk为序列第k个方面特征, 为目标短视频第k个方面特征。参数 和参数 控制每个方面特征的权重,参数b是偏置参数。σ是sigmoid激活函数。
[0083] S600,根据用户兴趣表征,预测用户对目标短视频的点击率:
[0084]
[0085]
[0086] 其中,v+和v‑分别为用户在正反馈序列和负反馈序列下的兴趣表征,为向量拼接操作。 和 是转移矩阵, 是偏置向量,b2是偏置标量。σ是sigmoid激活函数。
[0087] S700,根据模型特性,设计损失函数。通过用户对目标短视频的点击率预测值 计算预测值 和真实值y之间的误差,进而使用误差来更新模型参数。我们采用交叉熵损失函数来指导模型参数的更新过程:
[0088]
[0089] 其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频。σ是sigmoid函数。我们采用Adam优化器更新模型参数。
[0090] 上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0047] 图1为本发明一种基于细粒度的多方面分析的短视频点击率预测方法的流程示意图;
[0048] 图2为本发明一种基于细粒度的多方面分析的短视频点击率预测方法的模型框架图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号