首页 > 专利 > 杭州电子科技大学 > 一种空间距离自适应的下一个兴趣点推荐方法专利详情

一种空间距离自适应的下一个兴趣点推荐方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2021-01-18
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2021-05-28
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2022-04-15
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2041-01-18
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN202110062234.9 申请日 2021-01-18
公开/公告号 CN112784177B 公开/公告日 2022-04-15
授权日 2022-04-15 预估到期日 2041-01-18
申请年 2021年 公开/公告年 2022年
缴费截止日
分类号 G06F16/9537G06N7/00G06Q30/06 主分类号 G06F16/9537
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 2
权利要求数量 3 非专利引证数量 1
引用专利数量 0 被引证专利数量 0
非专利引证 1、CN 109492166 A,2019.03.19CN 104933595 A,2015.09.23CN 105740401 A,2016.07.06CN 106960256 A,2017.07.18李贵等.“基于个性化马尔科夫链的推荐算法”《.计算机科学》.2014,第40卷(第10期),Shenglin Zhao等“.Aggregated TemporalTensor Factorization Model for Point-of-Interest Recommendation”《.NeuralProcessing Letters》.2017,;
引用专利 被引证专利
专利权维持 1 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 俞东进、沈熠、俞婷、王东京 第一发明人 俞东进
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 4
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
杨舟涛
摘要
本发明公开了一种空间距离自适应的下一个兴趣点推荐方法。该方法结合马尔科夫链并且能够自适应用户个人偏好进行兴趣点推荐。使用马尔科夫链捕获用户签到序列的时序关系,并且为每个用户生成个性化的转移矩阵用于捕获用户个人偏好。引入张量分解模型解决数据集签到数据稀疏的问题,使每个转移矩阵都受到相似用户、相似兴趣点、用户潜在偏好的影响,生成更完善和高质量的用户转移矩阵,通过这个转移矩阵捕获完善的用户个人偏好和兴趣点之间的转移关系。通过用户签到序列学习用户的个性化潜在行为模式,从而捕获到有效的用户潜在个人偏好。通过融合空间距离的方法对用户长期潜在个人偏信息作出取舍,根据兴趣点间的距离自适应用户个人偏好。
  • 摘要附图
    一种空间距离自适应的下一个兴趣点推荐方法
  • 说明书附图:图1
    一种空间距离自适应的下一个兴趣点推荐方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2022-04-15 授权
2 2021-05-28 实质审查的生效 IPC(主分类): G06F 16/9537 专利申请号: 202110062234.9 申请日: 2021.01.18
3 2021-05-11 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:该方法具体包括以下步骤:
步骤一、数据获取与预处理
获取用户一系列历史签到记录,每条签到记录包含签到时间、用户名称、兴趣点,提取出所有用户和所有兴趣点,删除其中出现次数少于a次的个别兴趣点和个别用户,得到用户集合和兴趣点集合;
步骤二、构建签到序列
将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列;
步骤三、构建转移矩阵
u
根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩阵A ,其中元素 表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则为1,u
否则为0;合并所有用户的转移矩阵A得到一个转移张量A;
步骤四、估计用户签到概率
使用Tucker Decomposition线性分解模型对步骤三中得到转移张量A进行估计,得到估计张量
其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;然后根据张量模型成对之间的相互作用估计用户对兴趣点的签到概率,即估计张量中每个元素的估计值;
步骤五、计算用户标准化签到概率
定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
根据签到概率pu(i,l)计算用户的标准化签到概率
其中ρ和k为待估计参数,使用最小二乘回归法学习; 表示用户u当前所在兴趣点i和下一个兴趣点l之间的距离;Max(pu)表示用户u历史签到序列中当前所在兴趣点和下一个兴趣点之间最大的转移概率;
步骤六、计算用户转移概率
将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
其中σ表示sigmoid激活函数, e表示自然常数; 表示对
进行E(x)=wx+b的线性变换操作,w、b为常数;
然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
估计张量 中的元素,uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;
步骤七、学习签到概率
对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
其中m>u,in表示用户u从兴趣点i移动到兴趣点m的概率 大于移动到兴趣点n的概率 因此:
P(Θ|>u,i)∝P(>u,i|Θ)P(Θ)     (7)
其中Θ表示模型参数的集合,当每个用户的签到历史为独立的,且模型参数的先验概率服从正态分布 则通过最大化后验概率学习模型参数Θ,得到优化公式:
然后根据优化公式,采用随机梯度下降法对参数Θ进行优化:
其中ω表示梯度步长,对每个用户的签到序列进行采样,然后采用随机梯度下降法沿着负梯度方向更新参数Θ,迭代至收敛或迭代结束,学习每个用户下一个兴趣点的签到概率
步骤八、兴趣点推荐
根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。

2.如权利要求1所述一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:步骤一中a的取值为10。

3.如权利要求1所述一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:步骤七中使用的排序方法为贝叶斯个性化排序。
说明书

技术领域

[0001] 本发明属于推荐系统领域,具体涉及一种根据空间距离自适应用户兴趣和兴趣点转移关系的下一个兴趣点推荐方法。

背景技术

[0002] 近年来,随着网络技术的不断发展,人们在网上能够获取到的信息日益增加,从海量的数据中精确推荐用户所感兴趣的信息成了一个巨大的挑战。针对信息过载的问题,研究学者们提出了各式各样的推荐系统用于音乐、电影、广告、商品等领域。例如,在网易云音乐中会通过用户经常听的音乐推荐相似的音乐,在京东和淘宝上则会通过用户历史购买的商品以及用户曾经搜索过或者点击过的商品进行推荐商品。
[0003] 兴趣点推荐和上面提到电商、音乐、广告有所不同。兴趣点推荐的用户签到数据非常稀疏,一个用户通常只会访问兴趣点集合的很小一部分。除此之外,用户访问兴趣点会受到空间和时间上的限制,相比其他领域,兴趣点推荐中的上下文信息会更加重要。例如用户在工作日早上会前往工作地点,中午的时候会选择距离工作地点比较近的餐厅用餐;而在周末的时候,他们会选择娱乐场所或者旅游景点进行签到。
[0004] 目前推荐系统中常用的协同过滤可以通过签到数据预测用户对兴趣点的偏好,其中有一些是通过计算用户‑用户、兴趣点‑兴趣点之间的相似度来进行推荐,但是由于存在数据稀疏的问题而使得推荐精度较低。有一些则选择通过用户历史访问的兴趣点建立模型,从而推荐用户最可能访问的K个兴趣点,但其往往忽略了用户签到之间的连续关系,而这在兴趣点推荐上非常重要,因为用户的运动通常是连续,有效兴趣点推荐系统应该结合用户的签到序列、用户个人偏好以及空间上的距离。

发明内容

[0005] 针对现有技术的不足,本发明提出了一种空间距离自适应的下一个兴趣点推荐方法,结合用户签到序列、上下文信息和兴趣点之间的空间关系,采用马尔科夫链和矩阵分解方法解决签到兴趣点签到数据稀疏的问题,最后通过贝叶斯排序的方式对用户的预测结果进行排序,向用户推荐下一个兴趣点。
[0006] 一种空间距离自适应的下一个兴趣点推荐方法,具体包括以下步骤:
[0007] 步骤一、数据获取与预处理
[0008] 获取用户一系列历史签到记录,每条签到记录包含签到时间、用户名称、兴趣点,提取出所有用户和所有兴趣点,删除其中出现次数少于a次的个别兴趣点和个别用户,得到用户集合和兴趣点集合。
[0009] 作为优选,a的取值为10。
[0010] 步骤二、构建签到序列
[0011] 将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列。
[0012] 步骤三、构建转移矩阵
[0013] 根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩u阵A,其中元素 表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则u
为1,否则为0;合并所有用户的转移矩阵A得到一个转移张量A;
[0014] 步骤四、估计用户签到概率
[0015] 使用Tucker Decomposition线性分解模型对步骤三中得到转移张量A进行估计,得到估计张量
[0016]
[0017] 其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;然后根据张量模型成对之间的相互作用估计用户对兴趣点的签到概率,即估计张量 中每个元素的估计值。
[0018] 步骤五、计算用户标准化签到概率
[0019] 定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
[0020]
[0021] 根据签到概率pu(i,l)计算用户的标准化签到概率
[0022]
[0023] 其中ρ和k为待估计参数,使用最小二乘回归法学习; 表示用户u当前所在兴趣点i和下一个兴趣点l之间的距离;Max(pu)表示用户u历史签到序列中当前所在兴趣点和下一个兴趣点之间最大的转移概率。
[0024] 步骤六、计算用户转移概率
[0025] 将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
[0026]
[0027] 其中σ表示sigmoid激活函数, e表示自然常数; 表示对进行E(x)=wx+b的线性变换操作,w、b为常数;
[0028] 然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
[0029]
[0030] 估计张量 中的元素,uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;
[0031] 步骤七、学习签到概率
[0032] 对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
[0033]
[0034] 其中m>u,in表示用户u从兴趣点i移动到兴趣点m的概率 大于移动到兴趣点n的概率 因此:
[0035] P(Θ|>u,i)∝P(>u,i|Θ)P(Θ)   (7)
[0036] 其中Θ表示模型参数的集合,当每个用户的签到历史为独立的,且模型参数的先验概率服从正态分布 则通过最大化后验概率学习模型参数Θ,得到优化公式:
[0037]
[0038] 然后根据优化公式,采用随机梯度下降法对参数Θ进行优化:
[0039]
[0040] 其中ω表示梯度步长,对每个用户的签到序列进行采样,然后采用随机梯度下降法沿着负梯度方向更新参数Θ,迭代至收敛或迭代结束,学习每个用户下一个兴趣点的签到概率
[0041] 作为优选,排序方法使用贝叶斯个性化排序的方式。
[0042] 步骤八、兴趣点推荐
[0043] 根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。
[0044] 本发明具有以下有益效果:
[0045] 1、通过用户历史签到记录,学习用户的个性化潜在行为模式,从而捕获到有效的用户潜在的个人偏好和兴趣点之间的转移关系。通过对真实数据集的分析,当访问空间距离上接近的兴趣点的时候,相较于用户个人偏好,兴趣点之间的转移关系会对用户产生更加大的影响;而访问空间距离上相距较远的兴趣点的时候,用户个人偏好会对用户产生更大的影响。所以融合了空间距离的方法对自适应用户对不同距离的兴趣点的潜在偏好权重,实现为每个用户推荐更加准确的兴趣点。
[0046] 2、使用马尔科夫链捕获用户签到序列的时序关系,并且为每个用户生成个性化的转移矩阵用于捕获用户的个人偏好和兴趣点之间的转移关系。引入张量分解模型解决数据集签到数据稀疏的问题,使每个个性化转移矩阵都受到相似用户、相似兴趣点、用户潜在偏好的影响,生成更加完善和高质量的用户转移矩阵,通过这个转移矩阵捕获完善的用户个人偏好和兴趣点转移关系。

实施方案

[0048] 以下结合附图对本发明作进一步的解释说明;
[0049] 如图1所示,本方法具体包括以下步骤:
[0050] 步骤一、数据获取与预处理
[0051] 采用Foursquare等位置社交服务网站采集到的真实数据集,数据集中包含一系列历史签到记录,每条签到记录包含签到时间、用户、兴趣点。从数据集中提取出所有用户和所有兴趣点,因为出现次数过少的个别用户和兴趣点会对实验结果产生较大偏差,所以删除其中出现次数少于10次的个别兴趣点和个别用户,最终得到用户集合和兴趣点集合。
[0052] 步骤二、构建签到序列
[0053] 将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列。
[0054] 步骤三、构建转移矩阵
[0055] 为捕捉用户在不同兴趣点之间的转移关系,根据步骤二得到的用户签到序列,采u用马尔科夫链对每个用户u构建一个转移矩阵A ,其中元素 表示签到序列中是否存在用u
户u从兴趣点i出发到兴趣点l的记录,存在则为1,否则为0;合并所有用户的转移矩阵A 得到一个转移张量A;
[0056] 步骤四、估计用户签到概率
[0057] 使用Tucker Decomposition线性分解模型对步骤三中得到转移张量A进行估计,得到估计张量
[0058]
[0059] 其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;
[0060] 然后根据三个张量模型成对之间的相互作用估计用户对兴趣点的签到概率即估计张量 中每个元素的估计值:
[0061]
[0062] uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;
lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;uU,L、lL,I、uU,I这三个关系矩阵包含在转移张量A中。
[0063] 由于组合uU,I·iI,U不依赖于L并且对排名没有影响,因此可以忽略,所以 可以表示为:
[0064]
[0065] 步骤五、计算用户标准化签到概率
[0066] 定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
[0067]
[0068] 根据签到概率pu(i,l)计算用户的标准化签到概率
[0069]
[0070] 其中ρ和k为待估计参数,使用最小二乘回归法学习; 表示用户u当前所在兴趣点i和下一个兴趣点l之间的距离;Max(pu)表示用户u历史签到序列中当前所在兴趣点和下一个兴趣点之间最大的转移概率。
[0071] 步骤六、计算用户转移概率
[0072] 将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
[0073]
[0074] 其中σ表示sigmoid激活函数, e表示自然常数; 表示对进行E(x)=wx+b的线性变换操作,w、b为常数;
[0075] 然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
[0076]
[0077] 步骤七、学习签到概率
[0078] 在进行下一兴趣点推荐时,将给出K个概率不同的推荐点,这些推荐点按照用户当前位置之后可能访问的可能性进行排名,此时兴趣点之间的排名顺序比其准确概率值更具有关联性,因此采用贝叶斯个性化排序的方式对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
[0079]
[0080] 其中m>u,in表示用户u从兴趣点i移动到兴趣点m的概率 大于移动到兴趣点n的概率 因此:
[0081] P(Θ|>u,i)∝P(>u,i|Θ)P(Θ)   (9)
[0082] 其中Θ表示模型参数的集合,当每个用户的签到历史为独立的,通过最大化后验概率学习模型参数Θ:
[0083]
[0084] 定义两个兴趣点之间的排名关系:
[0085]
[0086] 将排名关系输入到sigmoid激活函数中进行排序:
[0087]
[0088] 假设模型参数的先验概率服从正态分布 通过最大化后验概率来学习模型参数Θ,得到最终的优化公式:
[0089]
[0090] 由于该优化公式可微,所以采用随机梯度下降法对参数Θ进行优化:
[0091]
[0092] 其中ω表示梯度步长,对每个用户的签到序列进行采样,然后采用随机梯度下降法沿着负梯度方向更新参数Θ,迭代至收敛或迭代结束,学习每个用户下一个兴趣点的签到概率
[0093] 步骤八、兴趣点推荐
[0094] 根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。

附图说明

[0047] 图1为一种空间距离自适应的下一个兴趣点推荐方法流程图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号