首页 > 专利 > 中国计量大学 > 一种基于双层胶囊网络的短视频点击率预测方法专利详情

一种基于双层胶囊网络的短视频点击率预测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2020-11-25

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-02-23

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-07-20

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2040-11-25

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202011334084.4	申请日	2020-11-25
公开/公告号	CN112307258B	公开/公告日	2021-07-20
授权日	2021-07-20	预估到期日	2040-11-25
申请年	2020年	公开/公告年	2021年
缴费截止日
分类号	G06F16/735 、G06F16/78 、G06N3/04	主分类号	G06F16/735
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	0
权利要求数量	1	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2019.10.03顾盼.User2vec——线下店铺推荐的一种新方法《.万方数据库学位论文》.2018,机器之心《.Hinton老爷子CapsNet再升级,结合无监督,接近当前最佳效果》《.机器之心》.2019,;
引用专利	US2019303742A	被引证专利
专利权维持	2	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	中国计量大学	第一申请人	中国计量大学
专利权人	中国计量大学	当前专利权人	中国计量大学
发明人	顾盼	第一发明人	顾盼
地址	浙江省杭州市下沙高教园区学源街258号	邮编	310018
申请人数量	1	发明人数量	1
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明公开了一种基于双层胶囊网络的短视频点击率预测方法。该方法利用短视频平台中用户的正反馈和负反馈数据，判断用户对正面情感占主要部分的正反馈序列和负面情感占主要部分的负反馈序列中每个模块的情感，预测用户对目标短视频的点击率。本方法主要由四个部分组成：第一部分是利用第一层胶囊网络从用户正反馈和负反馈信息中抽取模块特征；第二部分是将两种模块特征和目标短视频进行一一配对，组合成逻辑单元；第三部分是利用第二层胶囊网络从逻辑单元中抽取用户对短视频的不同模块的情感；第四部分是基于用户对当前短视频的情感特征，进行短视频点击率的预测。

摘要附图
说明书附图：图1
说明书附图：图2

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-07-20	授权
2	2021-02-23	实质审查的生效	IPC(主分类): G06F 16/735 专利申请号: 202011334084.4 申请日: 2020.11.25
3	2021-02-02	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于双层胶囊网络的短视频点击率预测方法，其特征在于：
分别从用户点击序列和未点击序列抽取模块属性特征；用户的点击行为属于正反馈，用户的未点击属于负反馈；对于一个用户的点击行为序列可以表示为
而对于一个用户的未点击序列可以表示为其中分别是
用户点击了和未点击了的短视频封面图特征向量，d是特征向量长度；从点击序列和未点击序列中抽取相同模块的特征，因此点击序列和未点击序列的胶囊网络中的转换矩阵相同；
这里，从点击和未点击序列中抽取模块特征的胶囊网络为第一层胶囊网络；以下公式为了表达方便，使用p来代替{+,‑}；用户点击序列和未点击序列中的模块属性特征为：
其中，是用户点击或未点击序列中短视频特征向量，Wi是用户序列到模块胶囊i的转换矩阵，点击序列和未点击序列的转换矩阵相同，模块胶囊的个数是M；g是胶囊网络中常用的squash激活函数；是连接系数，代表的权重，参数采用如下动态路由算法更新：
其中，是输入胶囊j到输出胶囊i的连接系数且初始化为0；
将用户从点击序列和未点击序列中抽取的模块属性特征和目标短视频进行匹配，生成逻辑单元:
new
其中，是用户的模块属性特征，x 为目标短视频特征向量，为向量拼接操作；
根据从用户点击和未点击序列中抽取出的逻辑单元，生成用户的正面情感和负面情感；改进胶囊网络，从点击和未点击序列中抽取出的逻辑单元中抽取情感特征；这里，从逻辑单元中抽取情感特征的胶囊网络为第二层胶囊网络：
其中，是从点击序列和未点击序列中抽取的逻辑单元；是点击
序列的第i个激活单元到正面情感胶囊pos的转换矩阵，是点击序列的第i个激活单元到负面情感胶囊neg的转换矩阵，是未点击序列的第i个激活单元到正面情感胶囊pos的转换矩阵，是未点击序列的第i个激活单元到负面情感胶囊neg的转换矩阵；从公式中可以看出，点击序列和未点击序列都对正面情感产生影响,具体正面情感受正负反馈的影响程度由超参数α决定且α＜0.5；同样，负面情感受正负反馈的影响程度也由超参数α决定；正面情感胶囊spos通过和的加权和得到，同样负面情感胶囊sneg通过和的加权和得到；这里的g是胶囊网络中常用的squash激活函数；
是连接系数，代表的权重，参数采用如下动态路由算法更新,其中p∈
{+,‑},k∈{pos,neg}：
其中，p∈{+,‑}，表示和p相反；例如，如果p＝‑,那么且k∈{pos,neg}；是输入胶囊i到输出胶囊k的连接系数且初始化为0；
根据用户正面和负面情感，预测用户对目标短视频的点击率；给定情感胶囊sk，计算用户点击目标短视频的概率为：
其中，k∈{pos,neg}，和是转移矩阵，是偏置向量，bk,2是偏置
标量；σ是sigmoid激活函数，||sk||是向量的长度，代表情感的置信度；
根据模型特性，设计损失函数；通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数；采用交叉熵损失函数来指导模型参数的更新过程：
其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频；σ是sigmoid函数；最后采用Adam优化器更新模型参数。

说明书

技术领域

[0001] 本发明属于互联网服务技术领域，尤其是涉及一种基于双层胶囊网络的短视频点击率预测方法。

背景技术

[0002] 短视频是一种新型的且时间较短的视频。短视频的拍摄不需要使用专业设备，也不需要专业技巧。用户直接通过手机就可以很方便地进行拍摄和上传到短视频平台，因此短视频平台的短视频数量增长得非常快。这使得对有效短视频推荐系统的需求非常迫切，有效的短视频推荐系统可以提升用户体验和用户黏性，从而给平台带来巨大的商业价值。

[0003] 近些年，很多研究者提出了基于视频的个性化推荐方法。这些方法可以分为三类：协同过滤、基于内容的推荐和混合推荐方法。但是相比于视频，短视频有着不同的特点：描述文本质量较低、时长较短且用户在一段时间内的交互序列较长。因此，短视频推荐是一个更具有挑战性的任务，并且有研究者提出了一些方法。例如，Wei等人采用图卷积结构去融合短视频的多模态信息，进而更好地模拟用户的偏好；Chen等人利用分层的注意力机制去计算物品和类目这两种级别的重要性，得到更准确的预测结果；Li等人结合正负反馈数据，并使用基于图的循环神经网络去建模，最后得到用户的偏好。

[0004] 尽管这些方法取得不错的结果，但是这些结构很少结合用户的正反馈信息和负反馈信息共同来预测用户行为。负反馈信息指用户看了短视频的封面，却没有点击观看的行为。其中，Li等人的研究同时使用用户的正反馈序列和负反馈序列，但是他们计算的是用户对短视频整体的偏好，而没有细粒度地讨论正反馈和负反馈的具体作用。本方法利用短视频平台中用户的正反馈和负反馈数据，判断用户对序列每个模块的情感，预测用户对目标短视频的点击率。同时本方法认为用户正反馈和负反馈序列中都同时存在正面情感和负面情感，但是在用户正反馈序列中正面情感占主要部分，用户负反馈序列中负面情感占主要部分。通常来讲，同一用户对点击的短视频和未点击的短视频的同一种模块属性特征(如，短视频的主题)，不可能都同时出现强烈的同种情感。

发明内容

[0005] 本发明所要解决的技术问题是提供一种利用短视频平台中用户的正反馈和负反馈数据，判断用户对序列每个模块的情感，预测用户对目标短视频的点击率。本方法认为用户正反馈和负反馈序列中都同时存在正面情感和负面情感，但是在用户正反馈序列中正面情感占主要部分，用户负反馈序列中负面情感占主要部分。所以预测用户对目标短视频的点击率，应该分析用户正反馈和负反馈序列中对短视频不同模块的偏好。为此，本发明采用以下技术方案：

[0006] 一种基于双层胶囊网络的短视频点击率预测方法，包括以下步骤：

[0007] 分别从用户点击序列和未点击序列抽取模块属性特征。对于一个用户的点击行为序列可以表示为而对于一个用户的未点击序列可以表示为其中分别是用户点击了和未点击了的短视频封面图特征向
量，d是特征向量长度。本方法从点击序列和未点击序列中抽取相同模块的特征，因此点击序列和未点击序列的胶囊网络中的转换矩阵相同。以下公式为了表达方便，使用p来代替{+,‑}。用户点击序列和未点击序列中的模块属性特征为：

[0008]

[0009]

[0010] 其中，是用户正反馈或负反馈序列中短视频特征向量，Wi是用户序列到模块胶囊i的转换矩阵，点击序列和未点击序列的转换矩阵相同，模块胶囊的个数是M。g是胶囊网络中常用的squash激活函数。是连接系数，代表的权重，参数采用动态路由算法更新：

[0011]

[0012]

[0013] 其中，是输入胶囊j到出胶囊i的连接系数且初始化为0。相比于原来的动态路由更新算法，本方法更改了动态路由算法的归一化方式，使之更适合本法中的聚类场景。

[0014] 将用户从点击序列和未点击序列中抽取的模块属性特征和目标短视频进行匹配，生成逻辑单元:new

[0015] 其中，是用户的模块属性特征，x 为目标短视频特征，为向量拼接操作。

[0016] 根据从用户正反馈和负反馈序列中抽取出的逻辑单元，生成用户的正面情感和负面情感。本方法认为，用户正反馈和负反馈中都同时存在正面情感和负面情感，但是在用户正反馈序列中正面情感占主要部分，用户负反馈序列中负面情感占主要部分。所以本方法改进胶囊网络，从正反馈和负反馈序列中抽取出的逻辑单元中抽取情感特征：

[0017]

[0018]

[0019]

[0020]

[0021]

[0022]

[0023] 其中，是从点击序列和未点击序列中抽取的逻辑单元。是正反馈序列的第i个激活单元到正面情感胶囊pos的转换矩阵，是正反馈序列的第i个激活单元到负面情感胶囊neg的转换矩阵，是负反馈序列的第i个激活单元到正面情感胶囊pos的转换矩阵，是负反馈序列的第i个激活单元到负面情感胶囊neg的转换矩阵。从公式中可以看出，正反馈序列和负反馈序列都对正面情感产生影响,具体正面情感受正负反馈的影响程度由超参数α决定且α<0.5。同样，负面情感受正负反馈的影响程度也由超参数α决定。正面情感胶囊spos通过和的加权和得到，同样负面情感胶囊sneg通过和的加权和得到。这里的g是胶囊网络中常用的squash激活函数。是连接系数，代表的权重，参数采用动态路由算法更新,其中p∈{+,‑},k∈{pos,neg}：

[0024]

[0025]

[0026]

[0027]

[0028] 其中，p∈{+,‑}，表示和p相反。例如，如果p＝‑,那么且k∈{pos,neg}。是输入胶囊i到输出胶囊k的连接系数且初始化为0。本方法认为从正反馈和负反馈中抽取的相同模态的逻辑单元，不太可能同时出现强烈的正面情感或负面情感的情况。所以增加去修正原来的归一化方式。

[0029] 根据用户正面和负面情感，预测用户对目标短视频的点击率。给定情感胶囊sk，计算用户点击目标短视频的概率为：

[0030]

[0031]

[0032] 其中，k∈{pos,neg}，和是转移矩阵，是偏置向量，bk,2是偏置标量。σ是sigmoid激活函数，||sk||是向量的长度，代表情感的置信度。

[0033] 根据模型特性，设计损失函数。通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数。我们采用交叉熵损失函数(cross‑entropy loss)来指导模型参数的更新过程：

[0034]

[0035] 其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频。σ是sigmoid函数。最后采用Adam优化器更新模型参数。

[0036] 本发明的有益技术效果如下：

[0037] (1)本发明提出了一种基于双层胶囊网络的短视频点击率预测方法，从用户的正反馈和负反馈信息中分析用户对短视频不同模块的不同情感，进而得到更准确的预测。

[0038] (2)本发明从实际场景出发，同时从用户正反馈和负反馈序列中抽取正面情感和负面情感，丰富用户行为特征，从而使模型得到更好的效果。

[0039] (3)本发明从实际场景出发，考虑用户正反馈序列和负反馈中正面情感的主次地位，以及用户负反馈序列和正反馈序列中负面情感的主次地位。改进胶囊网络的框架和动态路由算法。

实施方案

[0042] 为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于双层胶囊网络的短视频点击率预测方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

[0043] 短视频点击率预测任务是建立一个模型去预测用户点击短视频的概率。用户的历史序列表示为其中p∈{+,‑}分别代表点击和未点击行为，xj代表第j个短视频，l是序列的长度。整个序列可以进一步细分为点击序列和未点击序列也就是正反馈和负反馈信息。因此，短视频点击率预测问题可以表示成：输入用户点击序列未点击的序列以及目标短视频xnew，来预测用户对目标短视频xnew的点击率。

[0044] 为此，本发明提出了一种基于双层胶囊网络的短视频点击率预测方法。它根据用户对短视频的正反馈和负反馈信息，挖掘出用户对短视频不同模块的情感，预测用户对目标短视频的点击率。这里的正反馈是指用户点击了短视频；负反馈是指平台展示了短视频的封面，但是用户没有点击短视频，说明用户对短视频没有兴趣。本方法认为用户对短视频的不同模块有不同的情感,且用户正反馈和负反馈序列中都同时存在正面情感和负面情感，但是在用户正反馈序列中正面情感占主要部分，用户负反馈序列中负面情感占主要部分。所以预测用户对目标短视频的点击率，应该分析用户正反馈和负反馈序列中对短视频不同模块的偏好。

[0045] 本方法主要由四个部分组成，如图2所示。第一个部分是利用第一层胶囊网络从用户正反馈和负反馈信息中抽取模块特征。第二个部分是将两种模块特征和目标短视频进行一一配对，组合成逻辑单元(logit unit)。第三个部分是利用第二层胶囊网络从逻辑单元中抽取用户对短视频的不同模块的情感。第四个部分是基于用户对当前短视频的情感特征，进行短视频点击率的预测。

[0046] 如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

[0047] S100，分别从用户点击序列和未点击序列抽取模块属性特征。对于一个用户的点击行为序列可以表示为而对于一个用户的未点击序列可以表示为其中分别是用户点击了和未点击了的短视频封面图特征向
量，d是特征向量长度。本方法从点击序列和未点击序列中抽取相同模块的特征，因此点击序列和未点击序列的胶囊网络中的转换矩阵相同。以下公式为了表达方便，使用p来代替{+,‑}。用户点击序列和未点击序列中的模块属性特征为：

[0048]

[0049]

[0050] 其中，是用户正反馈或负反馈序列中短视频特征向量，Wi是用户序列到模块胶囊i的转换矩阵，点击序列和未点击序列的转换矩阵相同，模块胶囊的个数是M，本方法M设置为5。g是胶囊网络中常用的squash激活函数。是连接系数，代表的权重，参数采用动态路由算法更新：

[0051]

[0052]

[0053] 其中，是输入胶囊j到输出胶囊i的连接系数且初始化为0。相比于原来的动态路由更新算法，本方法更改了动态路由算法的归一化方式，使之更适合本法中的聚类场景。

[0054] S200，将用户从点击序列和未点击序列中抽取的模块属性特征和目标短视频进行匹配，生成逻辑单元:new

[0055] 其中，是用户模块属性特征，x 为目标短视频特征，为向量拼接操作。

[0056] S300,根据从用户正反馈和负反馈序列中抽取出的逻辑单元，生成用户的正面情感和负面情感。本方法认为，用户正反馈和负反馈中都同时存在正面情感和负面情感，但是在用户正反馈序列中正面情感占主要部分，用户负反馈序列中负面情感占主要部分。所以本方法改进胶囊网络，从正反馈和负反馈序列中抽取出的逻辑单元中抽取情感特征：

[0057]

[0058]

[0059]

[0060]

[0061]

[0062]

[0063] 其中，是从点击序列和未点击序列中抽取的逻辑单元。是正反馈序列的第i个激活单元到正面情感胶囊pos的转换矩阵，是正反馈序列的第i个激活单元到负面情感胶囊neg的转换矩阵，是负反馈序列的第i个激活单元到正面情感胶囊pos的转换矩阵，是负反馈序列的第i个激活单元到负面情感胶囊neg的转换矩阵。从公式中可以看出，正反馈序列和负反馈序列都对正面情感产生影响,具体正面情感受正负反馈的影响程度由超参数α决定且α<0.5，本方法中α设置为0.4。
同样，负面情感受正负反馈的影响程度也由超参数α决定。正面情感胶囊spos通过和的加权和得到，同样负面情感胶囊sneg通过和的加权和得到。这里的g是胶囊网络中常用的squash激活函数。是连接系数，代表的权重，参数采用动态路由算法更新,其中p∈{+,‑},k∈{pos,neg}：

[0064]

[0065]

[0066]

[0067]

[0068] 其中，p∈{+,‑}，表示和p相反。例如，如果p＝‑,那么且k∈{pos,neg}。是输入胶囊i到输出胶k的连接系数且初始化为0。本方法认为从正反馈和负反馈中抽取的相同模态的逻辑单元，不太可能同时出现强烈的正面情感或负面情感的情况。所以增加去修正原来的归一化方式。

[0069] S400，根据用户正面和负面情感，预测用户对目标短视频的点击率。给定情感胶囊sk，计算用户点击目标短视频的概率为：

[0070]

[0071]

[0072] 其中，k∈{pos,neg}，和是转移矩阵，是偏置向量，bk,2是偏置标量。σ是sigmoid激活函数，||sk||是向量的长度，代表情感的置信度。

[0073] S500，根据模型特性，设计损失函数。通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数。我们采用交叉熵损失函数(cross‑entropy loss)来指导模型参数的更新过程：

[0074]

[0075] 其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频。σ是sigmoid函数。最后采用Adam优化器更新模型参数。

[0076] 上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0040] 图1为本发明一种基于双层胶囊网络的短视频点击率预测方法的流程示意图；

[0041] 图2为本发明一种基于双层胶囊网络的短视频点击率预测方法的模型框架图。

1基于互联网和数字技术的信息优化处理方法及服务器 2基于人工智能的互联网用户整合方法及大数据服务系统