Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020192013 - PROCÉDÉ ET APPAREIL DE DISTRIBUTION DIRECTIONNELLE DE PUBLICITÉ, DISPOSITIF ET SUPPORT DE STOCKAGE

Document

说明书

发明名称 0001   0002   0003   0004   0005   0006   0007   0008   0009   0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098   0099   0100   0101   0102   0103   0104   0105   0106   0107   0108   0109   0110   0111   0112   0113   0114   0115   0116   0117   0118   0119   0120   0121   0122   0123   0124   0125   0126   0127   0128   0129   0130   0131   0132   0133   0134   0135   0136   0137   0138   0139   0140   0141   0142   0143   0144   0145   0146   0147   0148   0149   0150   0151   0152   0153   0154   0155   0156   0157   0158   0159   0160   0161   0162   0163   0164   0165   0166   0167   0168   0169   0170   0171   0172   0173   0174   0175   0176   0177   0178   0179   0180   0181   0182   0183   0184   0185   0186   0187   0188   0189   0190   0191   0192   0193   0194   0195   0196   0197   0198   0199   0200   0201   0202   0203   0204   0205   0206  

权利要求书

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20  

附图

1   2   3  

说明书

发明名称 : 定向广告投放方法和装置、设备及存储介质

[0001]
本申请要求于2019年3月27日提交的中国专利申请号201910238703.0的优先权益,上述案件全部内容以引用的方式并入本文中。

技术领域

[0002]
本申请涉及人工智能,具体地说,涉及一种定向广告投放方法和装置、设备及存储介质。

背景技术

[0003]
随着网络技术的发展,社交网络成为了重要的交流平台之一。消息推送得到了越来越多的应用。推送技术是指根据一定的发送规则,依据相关的标准和协议通过互联网向用户发送信息的技术。电子商务厂商纷纷向用户的智能移动终端上推送各类信息。然而目前定向广告基本上是根据用户的兴趣或者标签来进行人群定向;而目标客群是属于群体中绝大部分人都具备的行为,这会使得目标客群的覆盖率非常低。由于金融产品用户相对互联网用户,用户行为数据丰富度较低,从而导致挖掘用户的兴趣和标签的方法存在一定的挑战性。真实场景下,目标客群往往没有非常清晰的界限和区分性,很难利用用户的单个兴趣和标签圈定目标客群。
[0004]
发明内容
[0005]
为解决以上技术问题,本申请提供一种定向广告投放方法,应用于电子设备,包括:
[0006]
根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
[0007]
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score(分值)1;
[0008]
根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0009]
利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的 相似度,得到score3;
[0010]
对score1、score2、score3线性加权得到用户相似度score4,
[0011]
score4=W1*score1+W2*score2+W3*score3
[0012]
其中,W1、W2、W3是权重系数;
[0013]
将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,从而提升模型的精度,得到score5,计算公式如下:
[0014]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0015]
其中,T是激活函数;
[0016]
X是特征;
[0017]
X i*X j是二阶的特征交互;
[0018]
X i*X j*X K是三阶的特征交互;
[0019]
X i*X j*X K*X l是四阶的特征交互;
[0020]
V 1,V ij,V ijk,V ijkl是权重系数;
[0021]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0022]
score6=M1*score4+M2*score5
[0023]
其中,M1、M2是系数;
[0024]
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0025]
本申请还提供一种定向广告投放装置,其特征在于,包括:
[0026]
用户兴趣相似度获取模块,用于根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
[0027]
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
[0028]
用户行为向量相似度获取模块,用于根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0029]
用户向量的相似度获取模块,用于利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似 度计算任意两个用户的用户向量的相似度,得到score3;
[0030]
用户相似度获取模块,用于对score1、score2、score3线性加权得到用户相似度score4,
[0031]
score4=W1*score1+W2*score2+W3*score3
[0032]
其中,W1、W2、W3是权重系数;
[0033]
用户相似度获取模块,将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,得到score5,计算公式如下:
[0034]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0035]
其中,T是激活函数;
[0036]
X是特征;
[0037]
X i*X j是二阶的特征交互;
[0038]
X i*X j*X K是三阶的特征交互;
[0039]
X i*X j*X K*X l是四阶的特征交互;
[0040]
V 1,V ij,V ijk,V ijkl是权重系数;
[0041]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0042]
score6=M1*score4+M2*score5
[0043]
其中,M1、M2是系数;
[0044]
相似度阈值比较模块,用于将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0045]
本申请还提供一种电子设备,该电子设备包括:存储器和处理器,所述存储器中存储有定向广告投放程序,所述定向广告投放程序被所述处理器执行时实现如下步骤:
[0046]
(1)根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
[0047]
(2)根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0048]
(3)利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户 向量的相似度,得到score3;
[0049]
(4)对score1、score2、score3线性加权得到用户相似度score4,
[0050]
score4=W1*score1+W2*score2+W3*score3
[0051]
其中,W1、W2、W3是权重系数;
[0052]
(5)将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,得到score5,计算公式如下:
[0053]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0054]
其中,T是激活函数;
[0055]
X是特征;
[0056]
X i*X j是二阶的特征交互;
[0057]
X i*X j*X K是三阶的特征交互;
[0058]
X i*X j*X K*X l是四阶的特征交互;
[0059]
V 1,V ij,V ijk,V ijkl是权重系数;
[0060]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0061]
score6=M1*score4+M2*score5
[0062]
其中,M1、M2是系数;
[0063]
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0064]
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,实现以上所述的定向广告投放方法。
[0065]
本申请的定向广告投放方法和装置、设备及存储介质提升了目标客群的覆盖率,能带来更多有价值的目标客群。本申请不仅利用用户兴趣标签数据和用户行为数据,还能够挖掘用户和广告潜在的关联关系,从而提升了金融用户数据的丰富度,提高算法的精确度。采用多模型融合更加具有通用性。

附图说明

[0066]
通过结合下面附图对其实施例进行描述,本申请的上述特征和技术优点将会变得更加清楚和容易理解。
[0067]
图1是本申请实施例的定向广告投放方法的流程示意图;
[0068]
图2是本申请实施例的电子设备的硬件架构示意图;
[0069]
图3是本申请实施例的定向广告投放程序的模块构成图。

具体实施方式

[0070]
下面将参考附图来描述本申请所述的定向广告投放方法和装置、设备及存储介质的实施例。本领域的普通技术人员可以认识到,在不偏离本申请的精神和范围的情况下,可以用各种不同的方式或其组合对所描述的实施例进行修正。因此,附图和描述在本质上是说明性的,而不是用于限制权利要求的保护范围。此外,在本说明书中,附图未按比例画出,并且相同的附图标记表示相同的部分。
[0071]
图1为本申请实施例提供的定向广告投放方法的流程示意图。该方法包括以下步骤:
[0072]
步骤S10,根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量。其中用户兴趣可以是基于用户的基本信息获得的用户兴趣,例如根据用户注册时填写的职业、爱好、居住地等信息推算出的用户兴趣,当然还可以包括是针对用户历史浏览、点击等行为获得的用户兴趣。而针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量。例如,定投、保底、货币型基金对应的标签是稳健型。股票、外汇、期货对应着高风险型。那么针对每个用户,都可以根据用户兴趣和对应的标签数据,得到用户标签向量。
[0073]
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1。
[0074]
步骤S20,根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光。所述偏好就是指用户喜不喜欢该广告(即点击或不点击),并根据点击情况给出分值,通过这样评分得到用户对所有广告的评分矩阵。然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0075]
步骤S30,利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,从而挖掘用户、广告及其之间的潜在关联关系。其中,用户向量表示与广告特征相关的用户信息。例如,广告特征是电影,用户信息可能是喜欢言情、经常看电影等。大大提升了刻画用户和广告数据维度的丰富度。并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
[0076]
[0077]
其中,userA i表示得到用户A的用户向量的第i个分量;userB i表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
[0078]
步骤S40,对score1、score2、score3线性加权得到用户相似度score4,
[0079]
score4=W1*score1+W2*score2+W3*score3
[0080]
其中,W1、W2、W3是权重系数;
[0081]
步骤S50,将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST(极端梯度上升)、SVM(支持向量机)、GBDT(梯度提升树)得到相应的分数作为FM(因式分解机)的输入。其中,将GBDT的叶子节点,并作多项式变换之后,同样也作为FM的输入,FM输出score5,从而提升模型的精度,计算公式如下:
[0082]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0083]
其中,T是激活函数;
[0084]
X是特征;
[0085]
X i*X j是二阶的特征交互;
[0086]
X i*X j*X K是三阶的特征交互;
[0087]
X i*X j*X K*X l是四阶的特征交互;
[0088]
V 1,V ij,V ijk,V ijkl是权重系数;
[0089]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0090]
score6=M1*score4+M2*score5
[0091]
其中,M1、M2是系数;
[0092]
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0093]
进一步地,欧几里得距离计算公式如下:
[0094]
[0095]
其中,userA表示用户A的用户向量;
[0096]
userB表示用户B的用户向量;
[0097]
n表示用户向量的维度;
[0098]
i表示第i个维度;
[0099]
d(userA,userB)表示用户A与用户B之间的距离。
[0100]
进一步地,各用户行为向量经过XGBOOST得到相应的分数的过程是:
[0101]
根据预设的用户行为特征将各用户行为向量划分到多颗回归树的叶子节点,组成XGBOOST模型 其中预设的用户行为特征可以是例如用户浏览推送信息的特征,用户检索信息的特征,用户收藏信息的特征等。根据这些特征分别构建回归树,则多颗回归树组成XGBOOST模型
[0102]
F对应所有回归树组成的函数空间,x b表示一棵树中与第b个用户行为向量对应的所有节点的分值,
[0103]
构建目标函数Obj,利用梯度下降法使得目标函数最小化,获得XGBOOST模型,
[0104]
[0105]
其中,l()表示训练误差,y m为第m个样本的实际分数, 为第m个样本输入XGBOOST模型 的预测分数,K表示共K棵树,k表示第k棵树,p表示训练样本数量,m表示第m个样本, 表示正则化项,利用XGBOOST模型获得各用户行为向量所在的各分类树的叶子节点的值的和分别作为该用户行为向量对应的分数。
[0106]
进一步地,各用户标签向量经过GBDT得到相应的分数的过程是:
[0107]
构建分类树以及叶子节点,其中,把用户标签向量相近的作为同一叶子节点,并以叶子节点的平均值作为预测值,计算各叶子节点的实际分数与预测分数的残差,按照各残差的相近程度划分下一棵分类树的叶子节点,持续进行分类树的划分,直至残差小于预设的阈值,将各用户标签向量所在的各分类树的叶子节点的平均值的和分别作为该用户标签向量对应的分数。
[0108]
进一步地,使用preproccessing库的PolynomialFeatures类对叶子节点进行多项式变换,并将各用户向量所在的各分类树的叶子节点的平均值的和分别作为该用户向量对应的分数。例如,如果一个用户向量对应叶子节点Q1和叶子节点Q2,这两个叶子节点对应的平均值分别为0.4和1.2,则进行多项式变换后,得到Q12、Q22、Q1Q2、Q1、Q2五个叶子节点,其对应的值分别为0.16,1.44,0.48,0.4和1.2,则将这五个叶子节点的值相加,得到3.68,则以该3.68作为这个用户向量的分数。
[0109]
在一个可选实施例中,还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用 户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
[0110]
在一个可选实施例中,还设置有修正系数,所述修正系数根据用户点击广告后是否转发,是否删除来确定,其中,用户转发广告则加1分,用户删除广告则减1分。
[0111]
在一个可选实施例中,还检测用户的位置坐标,根据广告委托者所在的位置坐标与用户的位置坐标的距离远近来推送广告,以距离用户的广告委托者的距离由近及远的方式向用户推送广告。这里的广告委托者是指所有能够提供产品展示的供应商。例如,商场,虽然商场不生产沙发,但是商场却会做广告推销沙发,所以商场就是以上所述的广告委托者,当然沙发的生产商如果也提供产品展示,那么其也可以添加到广告委托者中。当然,具体说,广告可能涉及一些虚拟产品,例如理财基金、股票推荐等,也可能是一些实体产品,例如沙发、电视等。以商场为例,商场会通过推送平台向用户推送广告,然而,有些用户可能距离较远,并不会特意去这个商场。而用户却有可能经过这个商场并不知道商场的推荐广告。而通过定位捕捉到用户的位置坐标,并与电子地图中的各个商场、工厂等广告所关联的广告委托者的坐标进行比较,并依据距离用户的位置坐标由近及远的距离来推送广告,这使得用户能够更快的阅读到距离其最近的生产商的广告。由此,可以使得用户无论走到哪里,都有对应的最近的产品的广告推送。甚至在商场中也可以及时推送,例如,用户经常可能在商场中查找某些品牌的位置,而通过以上的推送方式,则可以在用户行走的过程中,不断的推送给距离其最近的产品。
[0112]
更进一步地,还可以设置距离阈值,当距离超过距离阈值,则不再推送超出该距离阈值的产品广告信息。例如,距离阈值为20米,则在20米内的广告推广按照距离远近逐个推送,20米外的则不推送。随着人员的行走,距离远近在变动,则推送的广告信息也逐渐变化。
[0113]
进一步地,采用GPS的方式来定位用户的位置坐标,并与标记有广告委托者的位置坐标的电子地图进行比较,来确定广告委托者所在的位置坐标与用户的位置坐标的距离。
[0114]
参阅图2所示,是本申请电子设备的实施例的硬件架构示意图。本实施例中,所述电子设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。例如,可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图2所示,所述电子设备2至少包括,但不限于,可通过系统总线相互通信连接的存储器21、处理器22、网络接口23。其中:所述存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器 (ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器21可以是所述电子设备2的内部存储单元,例如该电子设备2的硬盘或内存。在另一些实施例中,所述存储器21也可以是电子设备2的外部存储设备,例如该电子设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括所述电子设备2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器21通常用于存储安装于所述电子设备2的操作系统和各类应用软件,例如所述定向广告投放程序代码等。此外,所述存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0115]
所述处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制所述电子设备2的总体操作,例如执行与所述电子设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器22用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的定向广告投放程序等。
[0116]
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述电子设备2与其他电子设备之间建立通信连接。例如,所述网络接口23用于通过网络将所述电子设备2与推送平台相连,在所述电子设备2与推送平台之间建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
[0117]
可选地,该电子设备2还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)显示器等。显示器用于显示在电子设备2中处理的信息以及用于显示可视化的用户界面。
[0118]
需要指出的是,图2仅示出了具有组件21-23的电子设备2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
[0119]
包含可读存储介质的存储器21中可以包括操作系统、定向广告投放程序50等。处理器22执行存储器21中定向广告投放程序50时实现如下步骤:
[0120]
步骤S10,根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
[0121]
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴 趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
[0122]
步骤S20,根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0123]
步骤S30,利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
[0124]
[0125]
其中,userA i表示得到用户A的用户向量的第i个分量;userB i表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
[0126]
步骤S40,对score1、score2、score3线性加权得到用户相似度score4,
[0127]
score4=W1*score1+W2*score2+W3*score3
[0128]
其中,W1、W2、W3是权重系数;
[0129]
步骤S50,将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,从而提升模型的精度,得到score5,计算公式如下:
[0130]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0131]
其中,T是激活函数;
[0132]
X是特征;
[0133]
X i*X j是二阶的特征交互;
[0134]
X i*X j*X K是三阶的特征交互;
[0135]
X i*X j*X K*X l是四阶的特征交互;
[0136]
V 1,V ij,V ijk,V ijkl是权重系数;
[0137]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0138]
score6=M1*score4+M2*score5
[0139]
其中,M1、M2是系数;
[0140]
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0141]
在本实施例中,存储于存储器21中的所述定向广告投放程序可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并可由一个或多个处理器(本实施例为处理器22)所执行,以完成本申请。例如,图3示出了所述定向广告投放程序的程序模块示意图,该实施例中,所述定向广告投放程序50可以被分割为用户兴趣相似度获取模块501、用户行为向量相似度获取模块502、用户向量的相似度获取模块503、用户相似度获取模块504、相似度阈值比较模块505。其中,本申请所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述定向广告投放程序在所述电子设备2中的执行过程。以下描述将具体介绍所述程序模块的具体功能。
[0142]
其中,用户兴趣相似度获取模块501用于根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
[0143]
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
[0144]
用户行为向量相似度获取模块502用于根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,
[0145]
然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0146]
用户向量的相似度获取模块503用于利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
[0147]
[0148]
其中,userA i表示得到用户A的用户向量的第i个分量;userB i表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
[0149]
用户相似度获取模块504用于对score1、score2、score3线性加权得到用户相似度score4,
[0150]
score4=W1*score1+W2*score2+W3*score3
[0151]
其中,W1、W2、W3是权重系数;
[0152]
用户相似度获取模块504还将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用 户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,得到score5,计算公式如下:
[0153]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0154]
其中,T是激活函数;
[0155]
X是特征;
[0156]
X i*X j是二阶的特征交互;
[0157]
X i*X j*X K是三阶的特征交互;
[0158]
X i*X j*X K*X l是四阶的特征交互;
[0159]
V 1,V ij,V ijk,V ijkl是权重系数;
[0160]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0161]
score6=M1*score4+M2*score5
[0162]
其中,M1、M2是系数;
[0163]
相似度阈值比较模块505用于将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0164]
另外,本申请还提供一种定向广告投放装置,包括:
[0165]
用户兴趣相似度获取模块501,用于根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
[0166]
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
[0167]
用户行为向量相似度获取模块502,用于根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0168]
用户向量的相似度获取模块503,用于利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3;
[0169]
用户相似度获取模块504,用于对score1、score2、score3线性加权得到用户相似度score4,
[0170]
score4=W1*score1+W2*score2+W3*score3
[0171]
其中,W1、W2、W3是权重系数;
[0172]
用户相似度获取模块505,将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,从而提升模型的精度,得到score5,计算公式如下:
[0173]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0174]
其中,T是激活函数;
[0175]
X是特征;
[0176]
X i*X j是二阶的特征交互;
[0177]
X i*X j*X K是三阶的特征交互;
[0178]
X i*X j*X K*X l是四阶的特征交互;
[0179]
V 1,V ij,V ijk,V ijkl是权重系数;
[0180]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0181]
score6=M1*score4+M2*score5
[0182]
其中,M1、M2是系数;
[0183]
相似度阈值比较模块,用于将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0184]
此外,本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括定向广告投放程序等,所述定向广告投放程序50被处理器22执行时实现如下操作:
[0185]
步骤S10,根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
[0186]
步骤S20,根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
[0187]
步骤S30,利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算 法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
[0188]
[0189]
其中,userA i表示得到用户A的用户向量的第i个分量;userB i表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
[0190]
步骤S40,对score1、score2、score3线性加权得到用户相似度score4,
[0191]
score4=W1*score1+W2*score2+W3*score3
[0192]
其中,W1、W2、W3是权重系数;
[0193]
步骤S50,将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,从而提升模型的精度,得到score5,计算公式如下:
[0194]
score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l)
[0195]
其中,T是激活函数;
[0196]
X是特征;
[0197]
X i*X j是二阶的特征交互;
[0198]
X i*X j*X K是三阶的特征交互;
[0199]
X i*X j*X K*X l是四阶的特征交互;
[0200]
V 1,V ij,V ijk,V ijkl是权重系数;
[0201]
最后经过score4和score5进行加权组合,输出最终的用户相似度,
[0202]
score6=M1*score4+M2*score5
[0203]
其中,M1、M2是系数;
[0204]
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[0205]
本申请之计算机可读存储介质的具体实施方式与上述定向广告投放方法以及电子设备2的具体实施方式大致相同,在此不再赘述。
[0206]
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

权利要求书

[权利要求 1]
一种定向广告投放方法,应用于电子设备,其特征在于,包括: 根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量, 利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1; 根据用户曝光和点击行为评分得到用户对广告偏好的评分,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2; 利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3; 对score1、score2、score3线性加权得到用户相似度score4, score4=W1*score1+W2*score2+W3*score3 其中,W1、W2、W3是权重系数; 将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,得到score5,计算公式如下: score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l) 其中,T是激活函数; X是特征; X i*X j是二阶的特征交互; X i*X j*X K是三阶的特征交互; X i*X j*X K*X l是四阶的特征交互; V 1,V ij,V ijk,V ijkl是权重系数; 最后经过score4和score5进行加权组合,输出最终的用户相似度, score6=M1*score4+M2*score5 其中,M1、M2是系数; 将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[权利要求 2]
根据权利要求1所述的定向广告投放方法,其特征在于:所述score3通过公式 获得,其中,userA i表示得到用户A的用户向量的第i个分量;userB i表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
[权利要求 3]
根据权利要求1所述的定向广告投放方法,其特征在于: 欧几里得距离计算公式如下: 其中,userA表示用户A的用户向量; userB表示用户B的用户向量; n表示用户向量的维度; i表示用户向量的第i个维度; d(userA,userB)表示用户A与用户B之间的距离。
[权利要求 4]
根据权利要求1所述的定向广告投放方法,其特征在于: 还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
[权利要求 5]
根据权利要求4所述的定向广告投放方法,其特征在于:还设置有评分矩阵修正系数,所述修正系数根据用户点击广告后是否转发,是否删除来确定,其中,用户转发广告则加1分,用户删除广告则减1分。
[权利要求 6]
根据权利要求4所述的定向广告投放方法,其特征在于: 还检测用户的位置坐标,根据广告委托者所在的位置坐标与用户的位置坐标的距离远近来推送广告,以距离用户的所述广告委托者的距离由近及远的方式向用户推送广告。
[权利要求 7]
根据权利要求6所述的定向广告投放方法,其特征在于: 采用GPS的方式来定位用户的位置坐标,并与标记有广告委托者的位置坐标的电子地 图进行比较,来确定广告委托者所在的位置坐标与用户的位置坐标的距离。
[权利要求 8]
根据权利要求6所述的定向广告投放方法,其特征在于: 还设置有距离阈值,当距离超过距离阈值,则不再推送超出该距离阈值的产品广告信息。
[权利要求 9]
根据权利要求1所述的定向广告投放方法,其特征在于: 各用户行为向量经过XGBOOST得到相应的分数的过程是: 将各用户行为向量分别划分到多颗回归树的叶子节点,构成XGBOOST模型 F对应所有回归树组成的函数空间,x b表示一棵树中与第b个用户行为向量对应的所有节点的分值, 构建目标函数Obj,利用梯度下降法使得目标函数最小化,获得XGBOOST模型, 其中,l()表示训练误差,y m为第m个样本的实际分数, 为第m个样本输入XGBOOST模型 预测分数,K表示共K棵树,k表示第k棵树,p表示训练样本数量,m表示第m个样本, 表示正则化项,利用XGBOOST模型获得各用户行为向量所在的各分类树的叶子节点的值的和分别作为该用户行为向量对应的分数。
[权利要求 10]
根据权利要求1所述的定向广告投放方法,其特征在于: 各用户标签向量经过GBDT得到相应的分数的过程是: 构建分类树以及叶子节点,其中,把用户标签向量相近的作为同一叶子节点,并以叶子节点的平均值作为预测值,计算各叶子节点的实际分数与预测分数的残差,按照各残差的相近程度划分下一棵分类树的叶子节点,持续进行分类树的划分,直至残差小于预设的阈值,将各用户标签向量所在的各分类树的叶子节点的平均值的和分别作为该用户标签向量对应的分数。
[权利要求 11]
根据权利要求1所述的定向广告投放方法,其特征在于: 根据用户注册填写的职业、爱好、居住地信息以及用户历史浏览、点击行为获得用户兴趣。
[权利要求 12]
根据权利要求1所述的定向广告投放方法,其特征在于: 利用交替最小二乘算法对任一用户行为向量建模为 其中,R u*v为用户行为向量; u表示第u个广告; v表示第v个点击行为评分; 为广告向量; Y z*v为用户向量; z为对用户推送的广告的特征, 通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量。
[权利要求 13]
根据权利要求10所述的定向广告投放方法,其特征在于: 使用preproccessing库的PolynomialFeatures类对叶子节点进行多项式变换。
[权利要求 14]
一种定向广告投放装置,其特征在于,包括: 用户兴趣相似度获取模块,用于根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量, 利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1; 用户行为向量相似度获取模块,用于根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2; 用户向量的相似度获取模块,用于利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3; 用户相似度获取模块,用于对score1、score2、score3线性加权得到用户相似度score4, score4=W1*score1+W2*score2+W3*score3 其中,W1、W2、W3是权重系数; 用户相似度获取模块,将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,得到score5,计算公式如下: score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l) 其中,T是激活函数; X是特征; X i*X j是二阶的特征交互; X i*X j*X K是三阶的特征交互; X i*X j*X K*X l是四阶的特征交互; V 1,V ij,V ijk,V ijkl是权重系数; 最后经过score4和score5进行加权组合,输出最终的用户相似度, score6=M1*score4+M2*score5 其中,M1、M2是系数; 相似度阈值比较模块,用于将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[权利要求 15]
根据权利要求14所述的定向广告投放装置,其特征在于: 还包括用户行为向量修正模块,根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
[权利要求 16]
根据权利要求14所述的定向广告投放装置,其特征在于:还设置有评分矩阵修正系数,所述修正系数根据用户点击广告后是否转发,是否删除来确定,其中,用户转发广告则加1分,用户删除广告则减1分。
[权利要求 17]
根据权利要求14所述的定向广告投放装置,其特征在于: 还设置有距离判断推送模块,用于检测用户的位置坐标,根据广告委托者所在的位置坐标与用户的位置坐标的距离远近来推送广告,以距离用户的所述广告委托者的距离由近及远的方式向用户推送广告。
[权利要求 18]
一种电子设备,其特征在于,该电子设备包括:存储器和处理器,所述存储器中存储有定向广告投放程序,所述定向广告投放程序被所述处理器执行时实现如下步骤: 根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量, 利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1; 根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2; 利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用 户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3; 对score1、score2、score3线性加权得到用户相似度score4, score4=W1*score1+W2*score2+W3*score3 其中,W1、W2、W3是权重系数; 将得到的用户行为向量、用户标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,并且,将GBDT的同一用户向量对应的叶子节点作多项式变换扩展叶子节点数量,并将同一用户向量对应的扩展后的叶子节点的值的和作为分数也输入FM,得到score5,计算公式如下: score5=T(V 1*X+V ij*X i*X j+V ijk*X i*X j*X K+V ijkl*X i*X j*X K*X l) 其中,T是激活函数; X是特征; X i*X j是二阶的特征交互; X i*X j*X K是三阶的特征交互; X i*X j*X K*X l是四阶的特征交互; V 1,V ij,V ijk,V ijkl是权重系数; 最后经过score4和score5进行加权组合,输出最终的用户相似度, score6=M1*score4+M2*score5 其中,M1、M2是系数; 将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
[权利要求 19]
根据权利要求18所述的电子设备,其特征在于: 还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
[权利要求 20]
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,实现权利要求1至13中任一项所述的定向广告投放方法。

附图

[ 图 1]  
[ 图 2]  
[ 图 3]