[0019] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0020] 因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0021] 如图1所示,本发明实施例提供了一种用户数据分析服务器。其中,所述用户数据分析服务器可以包括存储器和处理器。
[0022] 详细地,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例(如后文所述)提供的基于大数据的用户画像分析方法。
[0023] 举例来说,在一种可能的实施方式中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read‑Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read‑Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read‑Only Memory,EEPROM)等。
[0024] 举例来说,在一种可能的实施方式中,所述处理器可以是一种通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0025] 并且,图1所示的结构仅为示意,所述用户数据分析服务器还可包括比图1中所示更多或者更少的组件,或具有与图1所示不同的配置,例如,可以包括用于与其它设备(如用户终端设备等,其中,用户终端设备可以包括,但不限于手机、电脑等)进行信息交互的通信单元。
[0026] 结合图2,本发明实施例还提供一种基于大数据的用户画像分析方法,可应用于上述用户数据分析服务器。其中,所述基于大数据的用户画像分析方法有关的流程所定义的方法步骤,可以由所述用户数据分析服务器实现。下面将对图2所示的具体流程,进行详细阐述。
[0027] 步骤S110,针对通信连接的多个用户终端设备中的每一个用户终端设备,获取该用户终端设备对应的设备用户的用户画像信息。
[0028] 在本发明实施例中,所述用户数据分析服务器可以针对通信连接的多个用户终端设备中的每一个用户终端设备,获取该用户终端设备对应的设备用户的用户画像信息。其中,所述用户画像信息基于对对应的设备用户进行数据采集得到的用户特征信息(如性别、年龄、收入等)构建形成。
[0029] 步骤S120,针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,基于该设备用户对应的用户画像信息与预先确定的目标用户画像信息之间的匹配度,得到该设备用户对应的用户画像匹配度。
[0030] 在本发明实施例中,所述用户数据分析服务器可以针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,基于该设备用户对应的用户画像信息与预先确定的目标用户画像信息之间的匹配度,得到该设备用户对应的用户画像匹配度。其中,所述目标用户画像信息基于待构建形成的目标用户群体的用户特征信息构建形成。
[0031] 步骤S130,基于所述多个设备用户中的每一个设备用户对应的用户画像匹配度,在所述多个设备用户中确定出目标设备用户。
[0032] 在本发明实施例中,所述用户数据分析服务器可以基于所述多个设备用户中的每一个设备用户对应的用户画像匹配度,在所述多个设备用户中确定出目标设备用户。其中,确定出的每一个所述目标设备用户用于构建形成所述目标用户群体(如此,可以将所述目标用户画像信息对应的待推荐信息推送给所述目标用户群体中的每一个目标设备用户)。
[0033] 基于上述的基于大数据的用户画像分析方法,可以先针对每一个用户终端设备,获取该用户终端设备对应的设备用户的用户画像信息,然后,可以针对多个用户终端设备对应的多个设备用户中的每一个设备用户,基于该设备用户对应的用户画像信息与预先确定的目标用户画像信息之间的匹配度,得到该设备用户对应的用户画像匹配度,使得可以基于多个设备用户中的每一个设备用户对应的用户画像匹配度,在多个设备用户中确定出目标设备用户,如此,可以保障确定出的目标设备用户与表征应用需求的目标用户画像信息(即需要的用户的特征)之间具有较高的匹配度,从而保障基于确定出的目标设备用户构建的目标用户群体的可靠度,从而改善基于现有技术构建形成的用户群体的可靠度不佳的问题。
[0034] 举例来说,在一种可能的实施方式中,上述实施方式中的步骤S110可以进一步包括以下的各步骤:首先,判断是否获取到用户画像分析指令(如在接收到如上述的待推荐信息之后,可以认为获取到所述用户画像分析指令),并在获取到所述用户画像分析指令之后,生成用户画像分析通知信息;
其次,将所述用户画像分析通知信息发送给通信连接的多个用户终端设备中的每一个用户终端设备,其中,多个用户终端设备中的每一个用户终端设备用于在接收到所述用户画像分析通知信息之后,向所述用户终端设备对应的设备用户显示所述用户画像分析通知信息,并响应该设备用户基于所述用户画像分析通知信息同意进行用户画像分析的操作生成对应的用户画像分析确认信息,以及,将所述用户画像分析确认信息发送给所述用户数据分析服务器;
然后,在获取到所述多个用户终端设备中的每一个用户终端设备发送的所述用户画像分析确认信息之后,分别获取所述多个用户终端设备中的每一个用户终端设备对应的设备用户的用户画像信息。
[0035] 举例来说,在一种可能的实施方式中,上述实施方式中的步骤S120可以进一步包括以下的各步骤:首先,针对预先确定的目标用户画像信息包括的每一条用户特征信息,确定该用户特征信息对应的融合系数;
其次,针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,分别计算该设备用户对应的用户画像信息包括的每一条用户特征信息与所述目标用户画像信息包括的对应的用户特征信息之间的匹配度,得到该用户画像信息包括的每一条用户特征信息对应的特征匹配度;
然后,针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,基于每一条所述用户特征信息对应的融合系数,对该设备用户对应的用户画像信息包括的每一条用户特征信息对应的特征匹配度进行融合处理(如加权求和计算等),得到该设备用户对应的用户画像匹配度。
[0036] 举例来说,在一种可能的实施方式中,上述实施方式中的所述针对预先确定的目标用户画像信息包括的每一条用户特征信息,确定该用户特征信息对应的融合系数的步骤,可以进一步包括以下的各步骤:首先,获取在历史上构建形成的每一个历史目标用户群体,得到至少一个历史目标用户群体,其中,所述至少一个历史目标用户群体中的每一个所述历史目标用户群体包括至少一个历史设备用户;
其次,针对所述至少一个历史目标用户群体中的每一个历史目标用户群体,确定该历史目标用户群体对应的历史用户画像信息,并对所述至少一个历史目标用户群体中的每一个历史目标用户群体对应的历史用户画像信息包括的历史用户特征信息进行去重筛选(即相同的历史用户特征信息,仅保留其中一条),得到对应的历史特征信息集合;
然后,针对所述历史特征信息集合中的每一条历史用户特征信息,确定该历史用户特征信息在所述至少一个历史目标用户群体中对应的历史设备用户,作为该历史用户特征信息对应的第一历史设备用户,并基于该第一历史设备用户确定该历史用户特征信息对应的融合系数;
最后,针对预先确定的目标用户画像信息包括的每一条用户特征信息,确定该用户特征信息所属(如相同)的历史用户特征信息,并将该历史用户特征信息对应的融合系数确定为该用户特征信息对应的融合系数。
[0037] 举例来说,在一种可能的实施方式中,上述实施方式中的所述针对所述历史特征信息集合中的每一条历史用户特征信息,确定该历史用户特征信息在所述至少一个历史目标用户群体中对应的历史设备用户,作为该历史用户特征信息对应的第一历史设备用户,并基于该第一历史设备用户确定该历史用户特征信息对应的融合系数的步骤,进一步包括以下的各步骤:首先,针对所述历史特征信息集合中的每一条历史用户特征信息,确定该历史用户特征信息在所述至少一个历史目标用户群体中对应的历史设备用户,作为该历史用户特征信息对应的第一历史设备用户,并统计该历史用户特征信息对应的第一历史设备用户的数量,得到该历史用户特征信息对应的第一用户统计数量,以及,基于该历史用户特征信息对应的第一用户统计数量确定该历史用户特征信息对应的第一系数,其中,所述第一系数和所述第一用户统计数量之间具有正相关关系;
其次,针对所述至少一个历史目标用户群体中的每一个历史目标用户群体,分别确定该历史目标用户群体中的每一个历史设备用户对该历史目标用户群体对应的历史推荐信息的信息关注度,并基于每一个历史设备用户对应的信息关注度确定每一个历史设备用户在该历史目标用户群体中的群体贡献系数,其中,所述群体贡献系数与所述信息关注度之间具有正相关关系(如可以直接将所述信息关注度作为所述群体贡献系数);
然后,针对每一个所述群体贡献系数,确定该群体贡献系数对应的历史目标用户群体的历史形成时间,并基于该群体贡献系数和该历史形成时间构建形成对应的二维坐标,并确定该二维坐标对应的坐标向量;
之后,针对所述历史特征信息集合中的每一条历史用户特征信息,依次对该历史用户特征信息对应的每一个第一历史设备用户对应的一个坐标向量进行连接,得到该历史用户特征信息对应的一条连接路径,其中,所述针对所述历史特征信息集合中的每一条历史用户特征信息,依次对该历史用户特征信息对应的每一个第一历史设备用户对应的一个坐标向量进行连接,得到该历史用户特征信息对应的一条连接路径的步骤执行多次,得到对应的多条连接路径,所述多条连接路径中的每两条连接路径不同;
进一步,针对所述历史特征信息集合中的每一条历史用户特征信息,分别计算该历史用户特征信息对应的每一条连接路径中相邻两个坐标向量之间的向量距离,并分别计算每一条连接路径中相邻两个坐标向量之间的向量距离的和值,得到每一条连接路径对应的向量距离和值,以及,确定出具有最小值的向量距离和值对应的连接路径作为该历史用户特征信息对应的目标连接路径,在融合该目标连接路径对应的每一个群体贡献系数,得到该历史用户特征信息对应的贡献系数融合值;
最后,针对所述历史特征信息集合中的每一条历史用户特征信息,基于该历史用户特征系信息对应的所述贡献系数融合值和所述第一系数(如计算乘积或平均值等),确定该历史用户特征系信息对应的融合系数。
[0038] 举例来说,在一种可能的实施方式中,上述实施方式中的所述针对所述历史特征信息集合中的每一条历史用户特征信息,确定该历史用户特征信息在所述至少一个历史目标用户群体中对应的历史设备用户,作为该历史用户特征信息对应的第一历史设备用户,并基于该第一历史设备用户确定该历史用户特征信息对应的融合系数的步骤,进一步包括以下的各步骤:首先,针对所述历史特征信息集合中的每一条历史用户特征信息,确定该历史用户特征信息在所述至少一个历史目标用户群体中对应的历史设备用户,作为该历史用户特征信息对应的第一历史设备用户,并统计该历史用户特征信息对应的第一历史设备用户的数量,得到该历史用户特征信息对应的第一用户统计数量,以及,基于该历史用户特征信息对应的第一用户统计数量确定该历史用户特征信息对应的第一系数,其中,所述第一系数和所述第一用户统计数量之间具有正相关关系;
其次,针对所述至少一个历史目标用户群体中的每一个历史目标用户群体,分别确定该历史目标用户群体中的每一个历史设备用户对该历史目标用户群体对应的历史推荐信息的信息关注度,并基于每一个历史设备用户对应的信息关注度确定每一个历史设备用户在该历史目标用户群体中的群体贡献系数,其中,所述群体贡献系数与所述信息关注度之间具有正相关关系,所述历史目标用户群体为多个;
然后,针对每一个所述历史设备用户,统计该历史设备用户对应的群体贡献系数的数量,得到该历史设备用于对应的系数统计数量,并确定该系数统计数量与预先配置的统计数量阈值之间的相对大小关系,以及,在该系数统计数量大于所述统计数量阈值时,将该历史设备用户确定为第二历史设备用户,或者,在该系数统计数量小于或等于所述统计数量阈值时,将该历史设备用户确定为第三历史设备用户,其中,每一个所述历史设备用户对应的多个群体贡献系数基于每一个群体贡献系数对应的历史目标用户群体的历史形成时间进行依次排列;
之后,在每一个所述第二历史设备用户对应的系数统计数量中确定出具有最小值的系数统计数量,作为第一数量参考值,并针对每一个所述第三历史设备用户,计算该第三历史设备用户对应的群体贡献系数的平均值,以及,基于该平均值和每一个所述第二历史设备用户对应的群体贡献系数的平均值,确定出具有相关关系的一个第二历史设备用户,并基于该第二历史设备用户对应的群体贡献系数,对该第三历史设备用户对应的群体贡献系数进行插值处理,得到该第三历史设备用户对应的新的群体贡献系数,其中,每一个所述第三历史设备用户对应的新的群体贡献系数的数量与具有相关关系的一个第二历史设备用户对应的群体贡献系数的数量相同;
进一步,针对每一个所述历史设备用户,基于所述统计数量阈值,对该历史设备用户当前具有的多个群体贡献系数进行滑窗处理,得到该历史设备用户对应的多个系数滑窗序列,并计算该多个系数滑窗序列中的每两个系数滑窗序列之间的序列相似度(如分别计算对应序列位置的群体贡献系数的系数相似度,再计算系数相似度的平均值等),以及,针对该历史设备用户对应的每一个系数滑窗序列,计算该系数滑窗序列与每一个其它系数滑窗序列之间的序列相似度的平均值,得到该系数滑窗序列对应的相似度均值,再在该多个系数滑窗序列中确定出对应的相似度均值最大的一个系数滑窗序列,作为该历史设备用户对应的目标系数滑窗序列;
再进一步,针对每一个所述历史设备用户,基于该历史设备用户对应的所述目标系数滑窗序列包括的多个群体贡献系数,确定出该历史设备用户对应的目标群体贡献系数(如计算所述目标系数滑窗序列包括的多个群体贡献系数的平均值或中位值,再将该平均值或中位值作为目标群体贡献系数),并针对所述历史特征信息集合中的每一条历史用户特征信息,对该历史用户特征信息对应的每一个历史设备用户对应的目标群体贡献系数进行融合处理,得到历史用户特征系信息对应的贡献系数融合值;
最后,针对所述历史特征信息集合中的每一条历史用户特征信息,基于该历史用户特征系信息对应的所述贡献系数融合值和所述第一系数,确定该历史用户特征系信息对应的融合系数。
[0039] 举例来说,在一种可能的实施方式中,上述实施方式中的步骤S130可以进一步包括以下的各步骤:首先,针对所述多个设备用户中的每一个设备用户,确定该设备用户对应的用户画像匹配度与预先配置的画像匹配度阈值之间的相对大小关系(如所述用户画像匹配度是否大于或等于所述画像匹配度阈值);
其次,针对所述多个设备用户中的每一个设备用户,若该设备用户对应的用户画像匹配度大于或等于所述画像匹配度阈值,则将该设备用户确定为目标设备用户,若该设备用户对应的用户画像匹配度小于所述画像匹配度阈值,则将该设备用户确定为非目标设备用户。
[0040] 举例来说,在一种可能的实施方式中,上述实施方式中的步骤S130可以进一步包括以下的各步骤:首先,基于所述多个设备用户中的每一个设备用户对应的用户画像匹配度,对所述设备用户进行排序处理,得到所述多个设备用户对应的用户排序序列,其中,对所述设备用户进行排序处理时,按照所述设备用户对应的用户画像匹配度的先大后小或先小后大的顺序进行排序;
其次,获取预先针对所述目标用户群体配置的群体数量范围信息,并基于所述群体数量范围信息在所述用户排序序列中选择出用户画像匹配度最大的对应数量范围的设备用户作为目标设备用户。
[0041] 结合图3,本发明实施例还提供一种基于大数据的用户画像分析系统,可应用于上述用户数据分析服务器。其中,所述用户画像分析系统可以包括用户画像获取模块、画像匹配度确定模块和目标用户确定模块。
[0042] 所述用户画像获取模块,用于针对通信连接的多个用户终端设备中的每一个用户终端设备,获取该用户终端设备对应的设备用户的用户画像信息,其中,所述用户画像信息基于对对应的设备用户进行数据采集得到的用户特征信息构建形成。
[0043] 所述画像匹配度确定模块,用于针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,基于该设备用户对应的用户画像信息与预先确定的目标用户画像信息之间的匹配度,得到该设备用户对应的用户画像匹配度,其中,所述目标用户画像信息基于待构建形成的目标用户群体的用户特征信息构建形成。
[0044] 所述目标用户确定模块,用于基于所述多个设备用户中的每一个设备用户对应的用户画像匹配度,在所述多个设备用户中确定出目标设备用户,其中,确定出的每一个所述目标设备用户用于构建形成所述目标用户群体。
[0045] 举例来说,在一种可能的实施方式中,所述用户画像获取模块具体用于(可以参照上述的步骤S110的相关描述):判断是否获取到用户画像分析指令,并在获取到所述用户画像分析指令之后,生成用户画像分析通知信息;
将所述用户画像分析通知信息发送给通信连接的多个用户终端设备中的每一个用户终端设备,其中,每一个所述用户终端设备用于在接收到所述用户画像分析通知信息之后,向所述用户终端设备对应的设备用户显示所述用户画像分析通知信息,并响应该设备用户基于所述用户画像分析通知信息同意进行用户画像分析的操作生成对应的用户画像分析确认信息,以及,将所述用户画像分析确认信息发送给所述用户数据分析服务器;
在获取到所述多个用户终端设备中的每一个用户终端设备发送的所述用户画像分析确认信息之后,分别获取所述多个用户终端设备中的每一个用户终端设备对应的设备用户的用户画像信息。
[0046] 举例来说,在一种可能的实施方式中,所述画像匹配度确定模块具体用于(可以参照上述的步骤S120的相关描述):针对预先确定的目标用户画像信息包括的每一条用户特征信息,确定该用户特征信息对应的融合系数;
针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,分别计算该设备用户对应的用户画像信息包括的每一条用户特征信息与所述目标用户画像信息包括的对应的用户特征信息之间的匹配度,得到该用户画像信息包括的每一条用户特征信息对应的特征匹配度;
针对所述多个用户终端设备对应的多个设备用户中的每一个设备用户,基于每一条所述用户特征信息对应的融合系数,对该设备用户对应的用户画像信息包括的每一条用户特征信息对应的特征匹配度进行融合处理,得到该设备用户对应的用户画像匹配度。
[0047] 综上所述,本发明提供的基于大数据的用户画像分析方法及系统,可以先针对每一个用户终端设备,获取该用户终端设备对应的设备用户的用户画像信息,然后,可以针对多个用户终端设备对应的多个设备用户中的每一个设备用户,基于该设备用户对应的用户画像信息与预先确定的目标用户画像信息之间的匹配度,得到该设备用户对应的用户画像匹配度,使得可以基于每一个设备用户对应的用户画像匹配度,在多个设备用户中确定出目标设备用户,如此,可以保障确定出的目标设备用户与表征应用需求的目标用户画像信息(即需要的用户的特征)之间具有较高的匹配度,从而保障基于确定出的目标设备用户构建的目标用户群体的可靠度,从而改善基于现有技术构建形成的用户群体的可靠度不佳的问题。
[0048] 在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0049] 另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0050] 所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0051] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。