[0005] 针对现有技术的不足,本发明提出了一种空间距离自适应的下一个兴趣点推荐方法,结合用户签到序列、上下文信息和兴趣点之间的空间关系,采用马尔科夫链和矩阵分解方法解决签到兴趣点签到数据稀疏的问题,最后通过贝叶斯排序的方式对用户的预测结果进行排序,向用户推荐下一个兴趣点。
[0006] 一种空间距离自适应的下一个兴趣点推荐方法,具体包括以下步骤:
[0007] 步骤一、数据获取与预处理
[0008] 获取用户一系列历史签到记录,每条签到记录包含签到时间、用户名称、兴趣点,提取出所有用户和所有兴趣点,删除其中出现次数少于a次的个别兴趣点和个别用户,得到用户集合和兴趣点集合。
[0009] 作为优选,a的取值为10。
[0010] 步骤二、构建签到序列
[0011] 将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列。
[0012] 步骤三、构建转移矩阵
[0013] 根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩u阵A,其中元素 表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则u
为1,否则为0;合并所有用户的转移矩阵A得到一个转移张量A;
[0014] 步骤四、估计用户签到概率
[0015] 使用Tucker Decomposition线性分解模型对步骤三中得到转移张量A进行估计,得到估计张量
[0016]
[0017] 其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;然后根据张量模型成对之间的相互作用估计用户对兴趣点的签到概率,即估计张量 中每个元素的估计值。
[0018] 步骤五、计算用户标准化签到概率
[0019] 定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
[0020]
[0021] 根据签到概率pu(i,l)计算用户的标准化签到概率
[0022]
[0023] 其中ρ和k为待估计参数,使用最小二乘回归法学习; 表示用户u当前所在兴趣点i和下一个兴趣点l之间的距离;Max(pu)表示用户u历史签到序列中当前所在兴趣点和下一个兴趣点之间最大的转移概率。
[0024] 步骤六、计算用户转移概率
[0025] 将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
[0026]
[0027] 其中σ表示sigmoid激活函数, e表示自然常数; 表示对进行E(x)=wx+b的线性变换操作,w、b为常数;
[0028] 然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
[0029]
[0030] 估计张量 中的元素,uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;
[0031] 步骤七、学习签到概率
[0032] 对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
[0033]
[0034] 其中m>u,in表示用户u从兴趣点i移动到兴趣点m的概率 大于移动到兴趣点n的概率 因此:
[0035] P(Θ|>u,i)∝P(>u,i|Θ)P(Θ) (7)
[0036] 其中Θ表示模型参数的集合,当每个用户的签到历史为独立的,且模型参数的先验概率服从正态分布 则通过最大化后验概率学习模型参数Θ,得到优化公式:
[0037]
[0038] 然后根据优化公式,采用随机梯度下降法对参数Θ进行优化:
[0039]
[0040] 其中ω表示梯度步长,对每个用户的签到序列进行采样,然后采用随机梯度下降法沿着负梯度方向更新参数Θ,迭代至收敛或迭代结束,学习每个用户下一个兴趣点的签到概率
[0041] 作为优选,排序方法使用贝叶斯个性化排序的方式。
[0042] 步骤八、兴趣点推荐
[0043] 根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。
[0044] 本发明具有以下有益效果:
[0045] 1、通过用户历史签到记录,学习用户的个性化潜在行为模式,从而捕获到有效的用户潜在的个人偏好和兴趣点之间的转移关系。通过对真实数据集的分析,当访问空间距离上接近的兴趣点的时候,相较于用户个人偏好,兴趣点之间的转移关系会对用户产生更加大的影响;而访问空间距离上相距较远的兴趣点的时候,用户个人偏好会对用户产生更大的影响。所以融合了空间距离的方法对自适应用户对不同距离的兴趣点的潜在偏好权重,实现为每个用户推荐更加准确的兴趣点。
[0046] 2、使用马尔科夫链捕获用户签到序列的时序关系,并且为每个用户生成个性化的转移矩阵用于捕获用户的个人偏好和兴趣点之间的转移关系。引入张量分解模型解决数据集签到数据稀疏的问题,使每个个性化转移矩阵都受到相似用户、相似兴趣点、用户潜在偏好的影响,生成更加完善和高质量的用户转移矩阵,通过这个转移矩阵捕获完善的用户个人偏好和兴趣点转移关系。