[0018] 下面介绍本发明一种实施例提供的服务于个性化推送服务的大数据挖掘系统10的架构,该服务于个性化推送服务的大数据挖掘系统10可以包括AI推荐系统100以及与AI推荐系统100通信连接的用户终端200。其中,服务于个性化推送服务的大数据挖掘系统10中的AI推荐系统100和用户终端200可以结合配合执行以下方法实施例所描述的服务于个性化推送服务的大数据挖掘方法,具体AI推荐系统100和用户终端200的执行步骤部分可以参照以下方法实施例的详细描述。
[0019] 本实施例提供的服务于个性化推送服务的大数据挖掘方法可以由AI推荐系统100执行,下面结合图1对该服务于个性化推送服务的大数据挖掘方法进行详细介绍。
[0020] 步骤S100,对任意订阅个性化推送服务的目标用户的用户行为大数据进行大数据挖掘,获得对应的用户兴趣特征数据。
[0021] 本实施例中,个性化推送服务可以部署到云服务中,当任意目标用户订阅个性化推送服务时,即表示该目标用户允许当前AI推荐系统搜集其用户行为大数据进行大数据挖掘。用户兴趣特征数据可以表示兴趣意图数据分布,兴趣意图数据分布可以由多个兴趣意图数据构成,每个兴趣意图数据可以表示该目标用户产生的每个兴趣点所相关的操作意图数据,如针对某个商品A的兴趣点,其操作意图数据可以包括针对该商品A的操作意图数据,如在下单该商品A之前的操作跳转流程中该目标用户的操作意图数据。
[0022] 步骤S200,基于预先训练的用户需求决策模型对所述用户兴趣特征数据进行基于AI的用户需求决策,获得对应的用户需求分布以及所述用户需求分布中每个用户需求对应于所述用户兴趣特征数据的兴趣连通路径。
[0023] 本实施例中,用户需求决策模型可以通过AI训练获得,进而可以具有用户需求决策的能力,从而进一步获得对应的用户需求分布以及所述用户需求分布中每个用户需求对应于所述用户兴趣特征数据的兴趣连通路径。例如,在确定用户需求分布后,可以从所述用户兴趣特征数据中提取用户需求分布中每个用户需求对应的需求字段相关的操作意图数据构成的路径,作为所述兴趣连通路径。
[0024] 步骤S300,基于用户需求分布以及所述用户需求分布中每个用户需求对应于所述用户兴趣特征数据的兴趣连通路径构建对应的个性化推送知识网络,并基于所述个性化推送知识网络进行个性化推送处理。
[0025] 本实施例中,可以根据每个用户需求对应于所述用户兴趣特征数据的兴趣连通路径,构建一个个性化推送知识网络,该个性化推送知识网络由多个用户需求作为知识实体构成,不同用户需求之间存在连接关系,该连接关系用于表示不同用户需求的兴趣连通路径中的相关联操作意图数据。由此,可以从云端推送数据源中获取各个用户需求所对应的个性化推送数据,并根据不同用户需求之间的连接关系从各个用户需求所对应的个性化推送数据中筛选对应的目标个性化推送数据,从而将目标个性化推送数据推送给该目标用户的用户终端。
[0026] 基于以上步骤,本实施例通过对任意订阅个性化推送服务的目标用户的用户行为大数据进行大数据挖掘,获得对应的用户兴趣特征数据,基于预先训练的用户需求决策模型对用户兴趣特征数据进行基于AI的用户需求决策,获得对应的用户需求分布以及用户需求分布中每个用户需求对应于用户兴趣特征数据的兴趣连通路径,基于用户需求分布以及用户需求分布中每个用户需求对应于用户兴趣特征数据的兴趣连通路径构建对应的个性化推送知识网络,并基于个性化推送知识网络进行个性化推送处理,从而在用户需求挖掘的基础上进一步考虑兴趣连通路径,进而提高后续个性化推送可靠性。
[0027] 一些示例性的设计思路中,针对步骤S100,可以通过下述实施例实现。
[0028] 步骤S101,获取标的服务操作事件的第一服务操作轨迹数据,该第一服务操作轨迹数据是基于操作节点对标的服务操作事件进行数据采集获得的,第一服务操作轨迹数据中的操作轨迹特征点具有操作持续指标。
[0029] 其中,标的服务操作事件为互联网服务进程上任一可基于操作节点进行记录的服务事件。操作持续指标表示在标的服务操作事件中操作轨迹特征点对操作节点的持续参数值。
[0030] 步骤S102,从第一服务操作轨迹数据中分别解析第二服务操作轨迹数据和第三服务操作轨迹数据,第二服务操作轨迹数据中的操作轨迹特征点的操作持续指标位于第一指标区间,第三服务操作轨迹数据中的操作轨迹特征点的操作持续指标位于第二指标区间。
[0031] 其中,第一指标区间表示兴趣点的操作持续指标所对应的区间,第二指标区间表示第一兴趣类别维度的兴趣点的操作持续指标所对应的区间,该第一指标区间包含第二指标区间,即兴趣点包含第一兴趣类别维度的兴趣点。
[0032] 一些可能的设计思路中,基于兴趣点的操作持续指标所对应的区间,能够从第一服务操作轨迹数据中解析出包含该兴趣点的第二服务操作轨迹数据,同理,能够提取出第三服务操作轨迹数据,在提取第二服务操作轨迹数据和第三服务操作轨迹数据的过程中,清洗了第一服务操作轨迹数据中与兴趣点无关的一些轨迹数据,便于后续针对兴趣点进行兴趣特征挖掘图。
[0033] 步骤S103,对目标服务操作轨迹数据进行兴趣特征挖掘,获得待兴趣预测特征,该目标服务操作轨迹数据依据第二服务操作轨迹数据和第三服务操作轨迹数据融合。
[0034] 通过将第二服务操作轨迹数据和第三服务操作轨迹数据融合为目标服务操作轨迹数据,使目标服务操作轨迹数据中包含整个兴趣点,且能够突出第一兴趣类别维度的兴趣点,因此通过对目标服务操作轨迹数据进行兴趣特征挖掘,使提取到的待兴趣预测特征能够更加准确地表示兴趣意图数据分布。
[0035] 步骤S104,依据待兴趣预测特征,对目标服务操作轨迹数据进行用户兴趣特征预测,获得用户兴趣特征数据。
[0036] 其中,用户兴趣特征数据中携带有第一兴趣类别维度的兴趣意图数据分布和第二兴趣类别维度的兴趣意图数据分布,第二兴趣类别维度表示除第一兴趣类别维度之外的其它兴趣类别维度。
[0037] 基于以上步骤,利用标的服务操作事件的不同兴趣点对应的操作持续指标具有区别的特点,能够基于标的服务操作事件中兴趣点对应的第一指标区间和第一兴趣类别维度的兴趣点对应的第二指标区间,从第一服务操作轨迹数据中解析出第二服务操作轨迹数据和第三服务操作轨迹数据,通过提取服务操作轨迹数据能够将第一服务操作轨迹数据中与兴趣点无关的特征数据清洗,然后依据提取的服务操作轨迹数据进行兴趣特征挖掘,进而可以使得在进行兴趣特征挖掘时避免受到与兴趣点无关的特征数据的影响,由此使得待兴趣预测特征能够更加准确地表示兴趣意图数据分布,从而依据待兴趣预测特征进行用户兴趣特征预测时,提高不同兴趣类别维度的兴趣意图数据分布的输出精度,提高用户兴趣特征预测准确性。
[0038] 下面介绍本申请实施例的基于人工智能的用户兴趣特征预测方法,包括以下步骤:步骤S201,获取标的服务操作事件的第一服务操作轨迹数据。
[0039] 步骤S202,分别依据第一指标区间和第二指标区间,从第一服务操作轨迹数据中解析第二服务操作轨迹数据和第三服务操作轨迹数据。
[0040] 其中,第一指标区间为第二服务操作轨迹数据中的操作轨迹特征点的操作持续指标所对应的区间,该第一指标区间表示兴趣点的操作持续指标所对应的区间,第二指标区间为第三服务操作轨迹数据中的操作轨迹特征点的操作持续指标所对应的区间,第二指标区间表示第一兴趣类别维度的兴趣点的操作持续指标所对应的区间。其中,兴趣点为标的服务操作事件中发生兴趣要素的数据节点,该兴趣点包括第一兴趣类别维度的兴趣点,即第一指标区间包含该第二指标区间。
[0041] 其中,兴趣类别维度包括第一兴趣类别维度和第二兴趣类别维度,该第二兴趣类别维度是指除第一兴趣类别维度之外的其它兴趣类别维度。
[0042] 一些可能的设计思路中,由于第一服务操作轨迹数据中不同操作轨迹特征点对应的操作持续指标不同,通过调整操作轨迹特征点的操作持续指标,能够从第一服务操作轨迹数据中解析出需要的服务操作轨迹数据。在第一指标区间的最低数值为第一操作持续指标、最高数值为第二操作持续指标时,AI推荐系统依据第一指标区间,从第一服务操作轨迹数据中解析第二服务操作轨迹数据包括:AI推荐系统将第一服务操作轨迹数据对应的多个操作持续指标中小于第一操作持续指标的操作持续指标更改为第一操作持续指标,将多个操作持续指标中大于第二操作持续指标的操作持续指标更改为第二操作持续指标,获得第二服务操作轨迹数据。例如,第一操作持续指标为0,第二操作持续指标为80。
[0043] 一些可能的设计思路中,在第二指标区间的最低数值为第三操作持续指标、最高数值为第四操作持续指标时,AI推荐系统依据第二指标区间,从第一服务操作轨迹数据中解析第三服务操作轨迹数据包括:AI推荐系统将第一服务操作轨迹数据对应的多个操作持续指标中小于第三操作持续指标的操作持续指标更改为第三操作持续指标,将多个操作持续指标中大于第四操作持续指标的操作持续指标更改为第四操作持续指标,获得第三服务操作轨迹数据。例如,第三操作持续指标为5,第二操作持续指标为35。
[0044] 步骤S203,分别对第二服务操作轨迹数据中的操作轨迹特征点和第三服务操作轨迹数据中的操作轨迹特征点的操作持续指标进行规则化转换。
[0045] 一些可能的设计思路中,由于第二服务操作轨迹数据和第三服务操作轨迹数据对应的操作持续指标的区间不同,后续直接对第二服务操作轨迹数据和第三服务操作轨迹数据融合时效果较差,通过对第二服务操作轨迹数据和第三服务操作轨迹数据进行规则化转换,使规则化转换之后第二服务操作轨迹数据和第三服务操作轨迹数据中的操作轨迹特征点的操作持续指标均调整到了0‑1范围内,从而对规则化转换后的第二服务操作轨迹数据和第三服务操作轨迹数据在进行融合时,能够提高融合效果。
[0046] 步骤S204,依据规则化转换后的第二服务操作轨迹数据和规则化转换后的第三服务操作轨迹数据,融合目标服务操作轨迹数据。
[0047] 步骤S205,对目标服务操作轨迹数据进行兴趣特征挖掘,获得待兴趣预测特征。
[0048] 其中,待兴趣预测特征用于表示目标服务操作轨迹数据中的操作轨迹特征点所对应的兴趣类别维度。
[0049] 一些可能的设计思路中,对目标服务操作轨迹数据进行编码,获得编码特征,然后再对该编码特征进行解码,获得待兴趣预测特征,本申请实施例对提取待兴趣预测特征的实施方式不做限制。
[0050] 步骤S206,依据待兴趣预测特征,对目标服务操作轨迹数据进行用户兴趣特征预测,获得用户兴趣特征数据。
[0051] 其中,该待兴趣预测特征表示目标服务操作轨迹数据中的操作轨迹特征点所对应的兴趣类别维度。
[0052] 一些可能的设计思路中,依据待兴趣预测特征,确定目标服务操作轨迹数据中的操作轨迹特征点对应的第一置信度和第二置信度,该第一置信度表示操作轨迹特征点对应于第一兴趣类别维度的支撑度,第二置信度表示操作轨迹特征点对应于第二兴趣类别维度的支撑度。其中,操作轨迹特征点的第一置信度越大表示该操作轨迹特征点对应于第一兴趣类别维度的支撑度越大,操作轨迹特征点的第一置信度越小表示该操作轨迹特征点对应于第一兴趣类别维度的支撑度越小,操作轨迹特征点的第二置信度越大表示该操作轨迹特征点对应于第二兴趣类别维度的支撑度越大,操作轨迹特征点的第二置信度越小表示该操作轨迹特征点对应于第二兴趣类别维度的支撑度越小。
[0053] 然后确定该目标服务操作轨迹数据中的操作轨迹特征点对应的第一置信度和第二置信度中最大的置信度,将最大的置信度所指示的兴趣类别维度确定为该操作轨迹特征点所对应的兴趣类别维度。即在操作轨迹特征点对应的第一置信度大于第二置信度时,确定该操作轨迹特征点所对应的兴趣类别维度为第一兴趣类别维度;在操作轨迹特征点对应的第二置信度大于第一置信度时,确定该操作轨迹特征点所对应的兴趣类别维度为第二兴趣类别维度。其中,操作轨迹特征点所对应的兴趣类别维度与该操作轨迹特征点在标的服务操作事件中对应的位置的类别维度一致。
[0054] 再依据目标服务操作轨迹数据中的操作轨迹特征点所对应的兴趣类别维度,分析目标服务操作轨迹数据中的操作轨迹特征点,获得用户兴趣特征数据,该用户兴趣特征数据中携带有第一兴趣类别维度的兴趣意图数据分布和第二兴趣类别维度的兴趣意图数据分布。
[0055] 另一些可能的设计思路中,AI推荐系统除了在用户兴趣特征数据中标记第一兴趣类别维度的兴趣意图数据分布和第二兴趣类别维度的兴趣意图数据分布之外,还会标记不属于任何兴趣类别维度的扩展特征数据。即AI推荐系统依据待兴趣预测特征,确定目标服务操作轨迹数据中的操作轨迹特征点对应的第一置信度、第二置信度和第三置信度。其中,该第三置信度表示操作轨迹特征点对应于非兴趣类别维度的支撑度,操作轨迹特征点的第三置信度越大表示该操作轨迹特征点对应于非兴趣类别维度的支撑度越大,操作轨迹特征点的第三置信度越小表示该操作轨迹特征点对应于非兴趣类别维度的支撑度越小。
[0056] 然后确定目标服务操作轨迹数据中的操作轨迹特征点对应的第一置信度、第二置信度和第三置信度中最大的置信度,将最大的置信度所指示的兴趣类别维度确定为该操作轨迹特征点所对应的兴趣类别维度。即在操作轨迹特征点对应的第一置信度大于第二置信度和第三置信度时,确定该操作轨迹特征点所对应的兴趣类别维度为第一兴趣类别维度;在操作轨迹特征点对应的第二置信度大于第一置信度和第三置信度时,确定该操作轨迹特征点所对应的兴趣类别维度为第二兴趣类别维度;在操作轨迹特征点对应的第三置信度大于第一置信度和第二置信度时,确定该操作轨迹特征点所对应的兴趣类别维度为非兴趣类别维度。
[0057] 再依据目标服务操作轨迹数据中的操作轨迹特征点所对应的兴趣类别维度,分析目标服务操作轨迹数据中的操作轨迹特征点,获得用户兴趣特征数据,该用户兴趣特征数据中携带有第一兴趣类别维度的兴趣意图数据分布、第二兴趣类别维度的兴趣意图数据分布和非兴趣类别维度的特征数据。
[0058] 对于目标服务操作轨迹数据中的多个操作轨迹特征点来说,可以基于以上实施方式,分别确定每个操作轨迹特征点所对应的兴趣类别维度。
[0059] 基于以上步骤,利用标的服务操作事件的不同兴趣点对应的操作持续指标具有区别的特点,能够基于标的服务操作事件中兴趣点对应的第一指标区间和第一兴趣类别维度的兴趣点对应的第二指标区间,从第一服务操作轨迹数据中解析出第二服务操作轨迹数据和第三服务操作轨迹数据,通过提取服务操作轨迹数据能够将第一服务操作轨迹数据中与兴趣点无关的特征数据清洗,然后依据提取的服务操作轨迹数据进行兴趣特征挖掘,进而可以使得在进行兴趣特征挖掘时避免受到与兴趣点无关的特征数据的影响,由此使得待兴趣预测特征能够更加准确地表示兴趣意图数据分布,从而依据待兴趣预测特征进行用户兴趣特征预测时,提高不同兴趣类别维度的兴趣意图数据分布的输出精度,提高用户兴趣特征预测准确性。
[0060] 并且,一些可能的设计思路中,实现了同时对第一兴趣类别维度的兴趣意图数据分布和第二兴趣类别维度的兴趣意图数据分布的输出,即在输出第一兴趣类别维度的兴趣意图数据分布的时候,会考虑第二兴趣类别维度的兴趣意图数据分布,在输出第二兴趣类别维度的兴趣意图数据分布的时候,也会考虑第一兴趣类别维度的兴趣意图数据分布,从而使用户兴趣特征预测过程中,两个兴趣类别维度的兴趣意图数据分布相互约束,进一步提高了用户兴趣特征预测效果。
[0061] 一些可能的设计思路中,对于上述步骤S204‑步骤S205,还能够基于用户兴趣特征预测模型,提取目标服务操作轨迹数据对应的待兴趣预测特征,以及对目标服务操作轨迹数据进行用户兴趣特征预测。
[0062] 下面继续介绍进一步的实施方式,包括以下步骤:步骤S401,基于第二编码分支,对目标服务操作轨迹数据进行编码,获得第二编码特征向量。
[0063] 步骤S402,基于第二解码分支,对第二编码特征向量进行解码,获得待兴趣预测特征。
[0064] 一些可能的设计思路中,第二编码分支包括k1个第二提取节点,第二解码分支包括k1个第二解码节点。AI推荐系统基于第1个第二提取节点,对目标服务操作轨迹数据进行编码,获得第1个第二编码特征向量;基于第m1个第二提取节点,对第m1‑1个第二提取节点生成的第m1‑1个第二编码特征向量进行编码,获得第m1个第二编码特征向量,直至得到第k1个第二提取节点生成的第k1个第二编码特征向量;基于第1个第二解码节点,对第k1个第二编码特征向量进行解码,获得第1个目标解码特征;基于第m1个第二解码节点,对第m1‑1个第二解码节点生成的第m1‑1个目标解码特征进行解码,获得第m1个目标解码特征,直至得到第k1个第二解码节点生成的第k1个目标解码特征,该第k1个目标解码特征即为待兴趣预测特征。
[0065] 步骤S403,基于用户兴趣特征预测分支,依据待兴趣预测特征,对目标服务操作轨迹数据进行用户兴趣特征预测,获得用户兴趣特征数据。
[0066] 基于以上步骤,基于用户兴趣特征预测模型,依据提取的服务操作轨迹数据进行兴趣特征挖掘,进而可以使得在进行兴趣特征挖掘时避免受到与兴趣点无关的特征数据的影响,由此使得待兴趣预测特征能够更加准确地表示兴趣意图数据分布,从而依据待兴趣预测特征进行用户兴趣特征预测时,提高不同兴趣类别维度的兴趣意图数据分布的输出精度,提高用户兴趣特征预测准确性,且端到端的用户兴趣特征预测模型还提高了用户兴趣特征预测效率。
[0067] 对于上述用户兴趣特征预测模型,在使用该用户兴趣特征预测模型对目标服务操作轨迹数据进行用户兴趣特征预测之前,需要先训练该用户兴趣特征预测模型,接下来对该用户兴趣特征预测模型的单轮训练流程进行说明。
[0068] 下面继续介绍进一步的实施方式,包括以下步骤:步骤S601,获取标定服务操作轨迹数据和该标定服务操作轨迹数据对应的标定用户兴趣特征数据,标定用户兴趣特征数据中携带有第一兴趣类别维度的标定兴趣意图数据分布和第二兴趣类别维度的标定兴趣意图数据分布。
[0069] 其中,标定服务操作轨迹数据为目标部位对应的服务操作轨迹数据,该标定服务操作轨迹数据的获取方式与上述步骤S201中第一服务操作轨迹数据的获取方式同理,在此不再赘述。
[0070] 步骤S602,基于用户兴趣特征预测模型,对标定服务操作轨迹数据进行处理,获得预测用户兴趣特征数据,预测用户兴趣特征数据中携带有第一兴趣类别维度的预测兴趣意图数据分布和第二兴趣类别维度的预测兴趣意图数据分布。
[0071] 步骤S602的实施方式与上述步骤S401‑步骤S403的实施方式同理,在此不再赘述。
[0072] 步骤S603,依据模型训练代价函数,对预测用户兴趣特征数据和标定用户兴趣特征数据进行处理,获得训练代价参数值,依据训练代价参数值,训练所述用户兴趣特征预测模型。
[0073] 其中,训练代价参数值越小,表示用户兴趣特征预测模型越准确。
[0074] 一些可能的设计思路中,模型训练代价函数包括以下第一模型训练代价函数、第二模型训练代价函数和第三模型训练代价函数中的至少一个:(1)第一模型训练代价函数。
[0075] 第一模型训练代价函数表示标定用户兴趣特征数据中的操作轨迹特征点所对应的实际兴趣类别维度和预测用户兴趣特征数据中的操作轨迹特征点所对应的预测兴趣类别维度,与第一训练代价参数值之间的关系,实际兴趣类别维度是指包含操作轨迹特征点的标定兴趣意图数据分布所对应的兴趣类别维度,预测兴趣类别维度是指包含操作轨迹特征点的预测兴趣意图数据分布所对应的兴趣类别维度。
[0076] (2)第二模型训练代价函数。
[0077] 第二模型训练代价函数表示标定用户兴趣特征数据中第一兴趣类别维度的标定兴趣意图数据分布和预测用户兴趣特征数据中第一兴趣类别维度的预测兴趣意图数据分布,与第二训练代价参数值之间的关系。
[0078] (3)第三模型训练代价函数。
[0079] 第三模型训练代价函数表示标定用户兴趣特征数据中第二兴趣类别维度的标定兴趣意图数据分布和预测用户兴趣特征数据中第二兴趣类别维度的预测兴趣意图数据分布,与第三训练代价参数值之间的关系。
[0080] 另一些可能的设计思路中,在采用上述第一模型训练代价函数、第二模型训练代价函数和第三模型训练代价函数中的至少两个模型训练代价函数得到对应的训练代价参数值之后,对至少两个训练代价参数值进行加权求和,获得模型训练代价函数对应的训练代价参数值。
[0081] 需要说明的是,上述步骤S601‑步骤S603是以一次单轮训练流程为例进行说明,在实际实施过程中,可以对用户兴趣特征预测模型进行多次迭代训练,直至得到训练完成的用户兴趣特征预测模型。
[0082] 基于以上步骤,在训练用户兴趣特征预测模型时,采用了三种模型训练代价函数,其中第一模型训练代价函数能够准确约束用户兴趣特征数据中每个操作轨迹特征点的输出准确性,第二模型训练代价函数和第三模型训练代价函数能够分别约束用户兴趣特征数据中第一兴趣类别维度的兴趣意图数据分布和第二兴趣类别维度的兴趣意图数据分布的输出准确性,从不同方向对用户兴趣特征预测模型进行训练,从而提高用户兴趣特征预测模型的训练有效性。
[0083] 在标的服务操作事件为电商服务操作事件时,标的服务操作事件的第一服务操作轨迹数据还包含噪声特征数据,噪声特征数据的存在会影响上述步骤S202‑步骤S205所示的用户兴趣特征预测过程,因此为了能够实现更加准确的用户兴趣特征预测,在进行用户兴趣特征预测之前先对第一服务操作轨迹数据进行电商订单清洗处理。一些可能的设计思路中,基于电商订单清洗模型对第一服务操作轨迹数据电商订单清洗,下面通过进一步的实施例,对基于电商订单清洗模型对第一服务操作轨迹数据电商订单清洗的过程进行说明。
[0084] 下面继续介绍进一步的实施方式,包括以下步骤:步骤S801、基于第一编码分支,对第一服务操作轨迹数据进行编码,获得第一编码特征向量。
[0085] 步骤S802、基于第一解码分支,对第一编码特征向量进行解码,获得解码特征向量。
[0086] 其中,解码特征向量表示第一服务操作轨迹数据中的操作轨迹特征点对应的第四置信度,第四置信度表示操作轨迹特征点对应于电商订单清洗类别的支撑度。该第四置信度越大表示操作轨迹特征点对应于电商订单清洗类别的支撑度越大,第四置信度越小表示操作轨迹特征点对应于电商订单清洗类别的支撑度越小。
[0087] 一些可能的设计思路中,第一编码分支包括k2个第一提取节点,第一解码分支包括k2个第一解码节点。AI推荐系统基于第1个第一提取节点,对目标服务操作轨迹数据进行编码,获得第1个第一编码特征向量;基于第m2个第一提取节点,对第m2‑1个第一提取节点生成的第m2‑1个第一编码特征向量进行编码,获得第m2个第一编码特征向量,直至得到第k2个第一提取节点生成的第k2个第一编码特征向量;基于第1个第一解码节点,对第k2个第一编码特征向量进行解码,获得第1个解码特征向量;基于第m2个第一解码节点,对第m2‑1个第一解码节点生成的第m2‑1个解码特征向量进行解码,获得第m2个解码特征向量,直至得到第k2个第一解码节点生成的第k2个解码特征向量。
[0088] 步骤S803、基于电商订单清洗分支,在第一服务操作轨迹数据中的操作轨迹特征点对应的第四置信度大于设定置信度时,将操作轨迹特征点确定为待清洗操作轨迹特征点,清洗第一服务操作轨迹数据中的待清洗操作轨迹特征点,获得电商订单清洗后的第一服务操作轨迹数据。
[0089] 其中,设定置信度为预先设置的置信度,例如设定置信度为0.5、0.6或其它小于1的数值。在操作轨迹特征点对应的第四置信度大于设定置信度时,即可确定该操作轨迹特征点为待清洗操作轨迹特征点。
[0090] 一些可能的设计思路中,在使用该电商订单清洗模型之前,先训练该电商订单清洗模型,即获取包含噪声特征数据的标定服务操作轨迹数据和电商订单清洗后的标定服务操作轨迹数据,基于电商订单清洗模型,对包含噪声特征数据的标定服务操作轨迹数据进行电商订单清洗处理,获得电商订单清洗后的预测服务操作轨迹数据,依据电商订单清洗后的标定服务操作轨迹数据和电商订单清洗后的预测服务操作轨迹数据之间的训练代价值函数值,训练电商订单清洗模型。
[0091] 一些示例性的设计思路中,针对步骤S200,可以通过下述实施例实现。
[0092] Process102,从所述用户兴趣特征数据中获取待进行多通道用户需求决策的目标用户兴趣特征。
[0093] Process104,基于预先训练的用户需求决策模型的特征提取分支,基于目标用户兴趣特征中每个兴趣意图数据的知识点变量进行特征提取,获得目标用户兴趣特征的知识点变量。
[0094] 其中,预先训练的用户需求决策模型是预先进行样本训练获得的可以对目标用户兴趣特征进行多通道用户需求决策的神经网络模型。关于该用户需求决策模型的单轮训练流程,可以参见下述的实施例。
[0095] 一些可能的设计思路中,用户需求决策模型的架构可以包括特征提取分支与用户需求决策分支,特征提取分支用于对目标用户兴趣特征进行特征提取,获得目标用户兴趣特征的知识点变量。用户需求决策分支用于特征提取分支生成的知识点变量进行用户需求决策,用户需求决策过程中按业务节点依次输出多个用户需求,使得依据该多个用户需求可以获得目标用户兴趣特征的用户需求分布。
[0096] 目标用户兴趣特征的知识点变量,可以表征整个目标用户兴趣特征的全局知识向量信息,该知识点变量,依据目标用户兴趣特征中每个兴趣意图数据的知识点变量进行特征提取得到,目标用户兴趣特征中每个兴趣意图数据的知识点变量仅能表征每个兴趣意图数据的知识向量信息,通过特征提取可以挖掘出目标用户兴趣特征中兴趣特征与兴趣特征的知识向量信息之间的依赖关系,获得的知识点变量能够更准确表征整个目标用户兴趣特征。目标用户兴趣特征中每个兴趣意图数据的知识点变量,是每个兴趣意图数据的向量化表示,也即知识点变量可以用于表征兴趣意图数据每个对应的兴趣意图的关键业务字段分布。
[0097] 一些可能的设计思路中,特征提取分支与用户需求决策分支可以采用递归神经网络、循环神经网络、卷积神经网络、长短时记忆神经网络等。
[0098] AI推荐系统获取目标用户兴趣特征后,在特征提取分支中基于目标用户兴趣特征中每个兴趣意图数据的知识点变量进行特征提取,获得目标用户兴趣特征的知识点变量。
[0099] Process106,通过用户需求决策模型的用户需求决策分支,基于知识点变量进行初始用户需求决策得到初始用户需求决策变量以及依据初始用户需求决策变量获得目标用户兴趣特征对应的初始用户需求之后,继续基于前向决策所得到的用户需求决策变量与用户需求进行当前决策,获得当前决策的用户需求决策变量与用户需求,直至终止决策流程。
[0100] AI推荐系统通过用户需求决策模型的特征提取分支,获得目标用户兴趣特征的知识点变量后,继续通过用户需求决策分支基于知识点变量进行多次用户需求决策。多次用户需求决策是迭代用户需求决策的过程,具体而言,每次用户需求决策,用户需求决策分支的输入层,获得前向决策输出得到的用户需求决策变量与用户需求,用户需求决策分支的特征维度空间转换子节点,依据前向决策输出得到的用户需求决策变量与用户需求进行当前决策,获得当前决策的用户需求决策变量,用户需求决策分支的输出层则依据当次的用户需求决策变量获得当前决策的用户需求,以此类推,用户需求决策多次,直至满足终止决策流程条件时终止决策流程,获得多次决策生成的多个用户需求。其中,初始用户需求决策的输入是目标用户兴趣特征的知识点变量,输出用户需求决策分支的初始用户需求决策变量,依据该初始用户需求决策变量可以获得目标用户兴趣特征的初始用户需求。
[0101] Process108,将决策生成的多个用户需求基于服务节点进行级联,获得目标用户兴趣特征对应的用户需求分布。
[0102] 基于以上步骤,基于知识点变量进行初始用户需求决策得到初始用户需求决策变量与对应的初始用户需求之后,继续基于前向决策所得到的用户需求决策变量与用户需求进行当前决策,由于每次用户需求决策考虑了前次决策生成的用户需求,那么当前决策所得到的用户需求与前向决策得到用户需求之间就可以更好地保证每个服务节点的关联性,使得将该多个用户需求基于服务节点进行级联得到的用户需求分布能够准确表征目标用户兴趣特征所对应的多服务节点层级的用户需求。
[0103] 一些可能的设计思路中,每个兴趣意图数据在目标用户兴趣特征中的知识点变量,通过以下方式得到:将目标用户兴趣特征加载至用户需求决策模型的特征提取分支;通过特征提取分支的单位提取节点,查询兴趣知识点数据库获得目标用户兴趣特征中每个兴趣意图数据的兴趣知识点,将兴趣标识以及每个兴趣意图数据的兴趣知识点解析为相应的知识点成员向量,每个兴趣意图数据的知识点成员向量表示对应兴趣意图数据的知识向量信息,兴趣标识对应的知识点成员向量表示目标用户兴趣特征的全局知识向量信息;以及将目标用户兴趣特征中每个兴趣意图数据的知识点成员向量分别与兴趣标识的知识点成员向量融合,获得每个兴趣意图数据在目标用户兴趣特征中的知识点变量。
[0104] 本实施例中,用户需求决策模型的特征提取分支包括单位提取节点,单位提取节点用于将每个兴趣意图数据转换为相应的知识点变量,单位提取节点可以采用预设特征提取网络将每个兴趣意图数据解析为相应的知识点成员向量。
[0105] 一些可能的设计思路中,Process104包括:将目标用户兴趣特征中每个兴趣意图数据的知识点变量,加载至特征提取分支的全连接提取节点;在全连接提取节点的特征维度空间转换子节点中,基于目标用户兴趣特征中每个兴趣意图数据的次序,对相应的知识点变量进行逐个处理,依次得到全连接提取节点对应每个兴趣意图数据的特征维度空间转换变量,直到遍历完目标用户兴趣特征中的终末兴趣意图数据时,将获得的全连接提取节点对应终末兴趣意图数据的特征维度空间转换变量作为目标用户兴趣特征的知识点变量。
[0106] 在得到目标用户兴趣特征中每个兴趣意图数据的知识点成员向量后,全连接提取节点进一步基于目标用户兴趣特征中每个兴趣意图数据的知识点成员向量生成目标用户兴趣特征的知识点变量。
[0107] 一些可能的设计思路中,在全连接提取节点为全局前向提取节点时,AI推荐系统可以在全局前向提取节点的特征维度空间转换子节点中,基于目标用户兴趣特征中每个兴趣意图数据的次序,依序对每个兴趣意图数据相应的知识点变量进行逐个处理,依次得到全局前向提取节点对应每个兴趣意图数据的前向特征维度空间转换变量,直到遍历完目标用户兴趣特征中的终末兴趣意图数据时,将获得的全局前向提取节点对应终末兴趣意图数据的前向特征维度空间转换变量作为目标用户兴趣特征的知识点变量。
[0108] 示例性地,AI推荐系统可以基于目标用户兴趣特征中每个兴趣意图数据的次序,依序将每个兴趣意图数据的知识点变量作为全局前向提取节点的特征维度空间转换子节点本次处理的知识点变量;在本次处理的知识点变量是目标用户兴趣特征中初始兴趣意图数据对应的知识点变量时,通过特征维度空间转换子节点基于初始的前向特征维度空间转换变量与初始兴趣意图数据对应的知识点变量,获得初始兴趣意图数据对应的前向特征维度空间转换变量;在本次处理的知识点变量不是目标用户兴趣特征中初始兴趣意图数据对应的知识点变量时,通过特征维度空间转换子节点基于前次处理得到的前向特征维度空间转换变量与本次处理的知识点变量,获得本次处理得到的前向特征维度空间转换变量。
[0109] 一些可能的设计思路中,在全连接提取节点为全局后向提取节点时,AI推荐系统可以在全局后向提取节点的特征维度空间转换子节点中,基于目标用户兴趣特征中每个兴趣意图数据的次序,反向对每个兴趣意图数据相应的知识点变量进行逐个处理,依次得到全局后向提取节点对应每个兴趣意图数据的后向特征维度空间转换变量,直到遍历完目标用户兴趣特征中的初始兴趣意图数据时,将获得的全局后向提取节点对应初始兴趣意图数据的后向特征维度空间转换变量作为目标用户兴趣特征的知识点变量。
[0110] 示例性地,AI推荐系统基于目标用户兴趣特征中每个兴趣意图数据的次序,反向将每个兴趣意图数据的知识点变量作为全局前后向提取节点的特征维度空间转换子节点本次处理的知识点变量;在本次处理的知识点变量是目标用户兴趣特征中终末兴趣意图数据对应的知识点变量时,通过特征维度空间转换子节点基于初始的后向特征维度空间转换变量与终末兴趣意图数据对应的知识点变量,获得终末兴趣意图数据对应的后向特征维度空间转换变量;在本次处理的知识点变量不是目标用户兴趣特征中终末兴趣意图数据对应的知识点变量时,通过特征维度空间转换子节点基于前次处理得到的后向特征维度空间转换变量与本次处理的知识点变量,获得本次处理得到的后向特征维度空间转换变量。
[0111] 一些可能的设计思路中,在全连接提取节点为全局前后向提取节点时,AI推荐系统可以在全局前后向提取节点的特征维度空间转换子节点中,基于目标用户兴趣特征中每个兴趣意图数据的次序,依序对每个兴趣意图数据相应的知识点变量进行逐个处理,依次得到全局前后向提取节点对应每个兴趣意图数据的前向特征维度空间转换变量,直到遍历完目标用户兴趣特征中的终末兴趣意图数据时,获得全局前后向提取节点对应终末兴趣意图数据的前向特征维度空间转换变量;在全局前后向提取节点的特征维度空间转换子节点中,基于目标用户兴趣特征中每个兴趣意图数据的次序,反向对每个兴趣意图数据相应的知识点变量进行逐个处理,依次得到全局前后向提取节点对应每个兴趣意图数据的后向特征维度空间转换变量,直到遍历完目标用户兴趣特征中的初始兴趣意图数据时,获得全局前后向提取节点对应初始兴趣意图数据的后向特征维度空间转换变量;基于终末兴趣意图数据的前向特征维度空间转换变量与初始兴趣意图数据的后向特征维度空间转换变量,获得目标用户兴趣特征的知识点变量。
[0112] 在全连接提取节点为全局前后向提取节点时,AI推荐系统基于前向运算方式得到终末兴趣意图数据对应的前向特征维度空间转换变量、基于后向运算方式得到初始兴趣意图数据对应的后向特征维度空间转换变量之后,将终末兴趣意图数据对应的前向特征维度空间转换变量与初始兴趣意图数据对应的后向特征维度空间转换变量相加或级联,获得目标用户兴趣特征的知识点变量。
[0113] 一些可能的设计思路中,提供了一种基于人工智能的用户需求决策训练方法,包括以下步骤:Process202,获取用户兴趣训练特征以及用户兴趣训练特征的先验用户需求分布。
[0114] Process204,通过用户需求决策模型的特征提取分支,基于用户兴趣训练特征中每个兴趣意图数据的知识点变量进行特征提取,获得用户兴趣训练特征的知识点变量。
[0115] Process206,通过用户需求决策模型的用户需求决策分支,基于知识点变量进行初始用户需求决策得到初始用户需求决策变量以及依据初始用户需求决策变量获得用户兴趣训练特征对应的初始用户需求之后,继续基于前向决策所得到的用户需求决策变量与用户需求进行当前决策,获得当前决策的用户需求决策变量与用户需求,直至终止决策流程。
[0116] Process208,基于多次决策生成的多个用户需求与先验用户需求分布所包括的多个用户需求之间的训练代价值函数值,优化用户需求决策模型。
[0117] 例如,一些可能的设计思路中,可以将用户兴趣训练特征加载至用户需求决策模型的特征提取分支;通过特征提取分支的单位提取节点,查询兴趣知识点数据库获得用户兴趣训练特征中每个兴趣意图数据的兴趣知识点,将兴趣标识以及每个兴趣意图数据的兴趣知识点解析为相应的知识点成员向量,每个兴趣意图数据的知识点成员向量表示对应兴趣意图数据的知识向量信息,兴趣标识对应的知识点成员向量表示用户兴趣训练特征的全局知识向量信息;以及将用户兴趣训练特征中每个兴趣意图数据的知识点成员向量分别与兴趣标识的知识点成员向量融合,获得每个兴趣意图数据在用户兴趣训练特征中的知识点变量。
[0118] 一些可能的设计思路中,可以将用户兴趣训练特征中每个兴趣意图数据的知识点变量,加载至特征提取分支的全连接提取节点;在全连接提取节点的特征维度空间转换子节点中,基于用户兴趣训练特征中每个兴趣意图数据的次序,对相应的知识点变量进行逐个处理,依次得到全连接提取节点对应每个兴趣意图数据的特征维度空间转换变量,直到遍历完用户兴趣训练特征中的终末兴趣意图数据时,将获得的全连接提取节点对应终末兴趣意图数据的特征维度空间转换变量作为用户兴趣训练特征的知识点变量。
[0119] 一些可能的设计思路中,全连接提取节点为全局前后向提取节点,可以在全局前后向提取节点的特征维度空间转换子节点中,基于用户兴趣训练特征中每个兴趣意图数据的次序,依序对每个兴趣意图数据相应的知识点变量进行逐个处理,依次得到全局前后向提取节点对应每个兴趣意图数据的前向特征维度空间转换变量,直到遍历完用户兴趣训练特征中的终末兴趣意图数据时,获得全局前后向提取节点对应终末兴趣意图数据的前向特征维度空间转换变量;在全局前后向提取节点的特征维度空间转换子节点中,基于用户兴趣训练特征中每个兴趣意图数据的次序,反向对每个兴趣意图数据相应的知识点变量进行逐个处理,依次得到全局前后向提取节点对应每个兴趣意图数据的后向特征维度空间转换变量,直到遍历完用户兴趣训练特征中的初始兴趣意图数据时,获得全局前后向提取节点对应初始兴趣意图数据的后向特征维度空间转换变量;基于终末兴趣意图数据的前向特征维度空间转换变量与初始兴趣意图数据的后向特征维度空间转换变量,获得用户兴趣训练特征的知识点变量。
[0120] 一些可能的设计思路中,基于多次决策生成的多个用户需求与先验用户需求分布所包括的多个用户需求之间的训练代价值函数值,优化用户需求决策模型的步骤,具体包括:Process208a,确定表征用户需求分布之间的相关关系的共现矩阵;
Process208b,基于共现矩阵所表征的用户需求分布之间的相关关系,确定与先验用户需求分布存在相关关系的用户需求分布,作为衍生用户需求分布;
Process208c,基于多次决策生成的多个用户需求、先验用户需求分布以及衍生用户需求分布,计算交叉熵训练代价值,基于交叉熵训练代价值优化用户需求决策模型。
[0121] 一些可能的设计思路中,基于多次决策生成的多个用户需求、先验用户需求分布以及衍生用户需求分布,计算交叉熵训练代价值,基于交叉熵训练代价值优化用户需求决策模型的步骤,具体包括:将先验用户需求分布与衍生用户需求分布进行噪声剔除后,获得用户兴趣训练特征对应的多个先验用户需求;基于多个先验用户需求与多次决策生成的多个用户需求,计算交叉熵训练代价值。
[0122] 一些可能的设计思路中,确定表征用户需求分布之间的相关关系的共现矩阵的步骤,具体包括:获取用户兴趣训练特征序列;通过预设特征提取网络将用户兴趣训练特征序列中的每个目标用户兴趣特征表征为兴趣知识点变量,将属于每个用户需求的用户兴趣训练特征的兴趣知识点变量进行平均化处理,获得每个用户需求的兴趣知识点特征;基于每两个用户需求的兴趣知识点特征之间的距离,确定每个用户需求的关联用户需求;基于每个用户需求的关联用户需求,生成表征用户需求分布之间的相关关系的共现矩阵。
[0123] 针对一些可能的实施方式而言,AI推荐系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
[0124] 处理器110可以通过存储在机器可读存储介质120中的程序而执行各种适当的动作和处理,例如前述实施例所描述的服务于个性化推送服务的大数据挖掘方法所相关的程序指令。处理器110、机器可读存储介质120以及通信单元140通过总线130进行信号传输。
[0125] 特别地,基于本发明的实施例,上文示例性流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信单元140从网络上被下载和安装,在该计算机程序被处理器110执行时,执行本发明实施例的方法中限定的上述功能。
[0126] 本发明又一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任意一个实施例所述的服务于个性化推送服务的大数据挖掘方法。
[0127] 本发明又一实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上述任意一个实施例所述的服务于个性化推送服务的大数据挖掘方法。
[0128] 以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其它类似实施手段,同样属于本申请实施例的保护范畴。