Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020107762 - CTR ESTIMATION METHOD AND DEVICE, AND COMPUTER READABLE STORAGE MEDIUM

Document

说明书

发明名称 1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   41   42   43   44   45   46   47   48   49   50   51   52   53   54   55   56   57   58   59   60   61   62   63   64   65   66   67   68   69   70   71   72   73   74   75   76   77   78   79   80   81   82   83   84   85   86   87   88   89   90   91   92   93   94   95   96   97   98   99   100   101   102   103   104   105   106   107   108   109   110   111   112   113   114   115   116   117   118   119   120   121   122   123   124   125   126   127   128   129   130  

权利要求书

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20  

附图

页1 

说明书

发明名称 : CTR预估方法、装置及计算机可读存储介质

[1]
本申请要求于2018年11月27日提交中国专利局、申请号为201811432671.X、申请名称为“CTR预估方法、装置及计算机可读存储介质”的中国专利申请的优先权,其全部内容通过引用结合在申请中。
[2]
技术领域
[3]
本申请涉及互联网广告技术领域,尤其涉及一种CTR预估方法、装置及计算机可读存储介质。
[4]
背景技术
[5]
CTR(Click Through Rate,点击率)预估是计算广告点击率中最核心的算法之一,简单来说,CTR预估是对每次广告的点击情况做出预测,预测用户是点击还是不点击。当前的CTR预估方法大多利用同一领域的用户行为数据进行学习训练,这种方法受数据的质量和数量影响较大;另外,当前的CTR预估方法多基于超高维度的监督模型或深度模型,例如超高维度的逻辑回归、分解机模型以及宽度深度模型等,这些CTR预估方法专注于CTR预估的准确性,严重缺乏对CTR预估结果的合理分析和解释,因而,当前的CTR预估方法难以给出预测理由也难以进行优化调整。
[6]
发明内容
[7]
本申请的主要目的在于提供一种CTR预估方法、装置及计算机可读存储介质,旨在解决现有的CTR预估方法不够准确及缺乏对CTR预估结果的合理分析和解释的技术问题。
[8]
为实现上述目的,本申请提供一种CTR预估方法,所述CTR预估方法包括:
[9]
获取待训练的不同类型的广告数据样本;
[10]
基于所述广告数据样本对预设的神经网络模型进行训练;
[11]
获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[12]
可选地,所述广告数据样本包括无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,所述标注信息至少包括群体和点击率。
[13]
可选地,所述基于所述广告数据样本对预设的神经网络模型进行训练的步骤包括:
[14]
将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
[15]
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
[16]
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[17]
可选地,所述基于损失函数对所述同一特征空间中的特征进行学习的步骤包括:
[18]
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
[19]
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
[20]
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
[21]
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
[22]
可选地,所述基于所述广告数据样本对预设的神经网络模型进行训练的的步骤之后,还包括:
[23]
保存所述训练后的神经网络模型。
[24]
可选地,所述获取待预估的广告数据的步骤包括:
[25]
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
[26]
可选地,所述将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估的步骤包括:
[27]
基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
[28]
基于所述多次CTR预估的结果,确定所述广告数据的CTR。
[29]
可选地,所述获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估的步骤之后,还包括:
[30]
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
[31]
此外,为实现上述目的,本申请还提供一种CTR预估装置,所述CTR预估装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的CTR预估程序,所述CTR预估程序被所述处理器执行时实现如上所述的CTR预估方法的步骤。
[32]
此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有CTR预估程序,所述CTR预估程序被处理器执行时实现如上所述的CTR预估方法的步骤。
[33]
本申请提出的一种CTR预估方法,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本申请提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
[34]
附图说明
[35]
图1为本申请实施例方案涉及的硬件运行环境的装置结构示意图;
[36]
图2为本申请CTR预估方法第一实施例的流程示意图;
[37]
图3为图2中的步骤S20的细化流程示意图;
[38]
图4为本申请CTR预估方法第二实施例的流程示意图。
[39]
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
[40]
具体实施方式
[41]
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[42]
本申请实施例的主要解决方案是:获取待训练的不同类型的广告数据样本;基于所述广告数据样本对预设的神经网络模型进行训练;获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。通过本申请实施例的技术方案,解决了现有的CTR预估方法不够准确及缺乏对CTR预估结果的合理分析和解释的技术问题。
[43]
如图1所示,图1是本申请实施例方案涉及的硬件运行环境的装置结构示意图。
[44]
本申请实施例装置可以是PC,也可以是智能手机、平板电脑、便携计算机等具有显示功能的可移动式终端设备。
[45]
如图1所示,该装置可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[46]
可选地,装置还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、Wi-Fi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。当然,装置还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[47]
本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[48]
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及CTR预估程序。
[49]
在图1所示的装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001、存储器1005可以设置在CTR预估装置中,所述CTR预估装置通过处理器1001调用存储器1005中存储的CTR预估程序,并执行以下操作:
[50]
获取待训练的不同类型的广告数据样本;
[51]
基于所述广告数据样本对预设的神经网络模型进行训练;
[52]
获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[53]
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
[54]
将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
[55]
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
[56]
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[57]
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
[58]
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
[59]
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
[60]
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
[61]
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
[62]
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
[63]
保存所述训练后的神经网络模型。
[64]
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
[65]
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
[66]
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
[67]
基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
[68]
基于所述多次CTR预估的结果,确定所述广告数据的CTR。
[69]
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
[70]
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
[71]
本实施例提供的方案,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本申请提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
[72]
基于上述硬件结构,提出本申请CTR预估方法实施例。
[73]
参照图2,图2为本申请CTR预估方法第一实施例的流程示意图,在该实施例中,所述方法包括:
[74]
步骤S10,获取待训练的不同类型的广告数据样本;
[75]
为了减轻CTR预估中对用户行为数据的质量和数量的过分依赖,提高CTR预估的准确性,本申请提出了一种CTR预估方法,利用迁移学习结合多种不同的广告数据以及用户行为数据对CTR预估的模型进行训练、学习,有效地提高了后续CTR预估的准确性。
[76]
具体地,首先获取待训练的广告数据样本,为了给不同的应用场景提供通用的解决方法,本实施例中将广告数据样本分为三种不同的类型:无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,其中,标注信息包括但不限于群体和点击率。
[77]
其中,无标注信息的广告数据样本,例如从互联网等来源抓取的广告文案,此类数据样本的获取成本极低,因此,在多数的应用场景下,该类数据样本的数量最多,但是抓取的数据样本缺乏明确的标准信息,即广告对应的CTR等,显然,该类数据质量较差,无法直接用来训练CTR预估所需的神经网络模型;而带有完整标注信息的广告数据样本,此类数据样本可以直接用来训练神经网络模型,具体地,标注信息可以包括该广告的点击率以及点击群体,例如,在金融产品推荐案例中,该类数据即为用户点击金融产品的行为数据、用户画像以及金融产品的属性等,这类数据在低频应用场景下,同一公司的此类数据较少,因此,该类数据质量最高,但数量较少;最后,带有弱标注信息的广告数据样本,该类数据样本大多为从第三方获取的广告文案及用户行为,点击率未知,可以理解的是,该类数据样本也不可以直接用来训练神经网络模型,例如,在用户对金融产品的点击率预测这个应用中,用户对新闻的点击行为无法被直接用来训练对金融产品点击率预测的CTR预估模型,此类包含弱标注信息的样本数据包含一定的行为信息且从第三方获取,因此,该类数据的质量和数量皆为中等。如下表1所示,对这三类数据的质量及数量关系进行总结,如下: [表1]
广告数据样本类型 质量 数量
无标注信息的广告数据样本
带有弱标注信息的广告数据样本
带有完整标注信息的广告数据样本

[78]
表1
[79]
步骤S20,基于所述广告数据样本对预设的神经网络模型进行训练;
[80]
进一步地,当获取上述三种不同类型的广告数据样本后,因为无标注信息的广告数据样本和带有弱标注信息的广告数据样本都无法直接用来训练CTR预估所需的神经网络模型,因此,需要利用迁移学习结合不同的广告数据以及用户行为数据对CTR预估所需的模型进行训练,具体地,如图3所示,所述步骤S20具体包括:
[81]
步骤S21,将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
[82]
在本实施例中,主要是利用特征迁移,特征迁移是通过观察源领域数据与目标域数据之间的共同特征,然后利用观察所得的共同特征在不同层级的特征间进行自动迁移,源领域数据即为无标注信息的广告数据样本和带有弱标注信息的广告数据样本,而目标域数据即带有完整标注信息的广告数据样本,通过迁移学习将不同的广告数据样本所记载的信息迁移至同一个特征空间中,在同一特征空间中维持各种数据的原有信息,以便更好地对CTR预估所需的模型进行训练。
[83]
具体地,首先是通过深度神经网络对输入的广告数据样本的文本特征进行提取,具体过程可以包括:将广告数据样本中的词转换为词向量,并通过深度神经网络扫描上述词向量,得到扫描特征;进一步地,通过对扫描特征进行采样生成深度特征;最后,将深度特征输入至深度神经网络的分类层得到分类结果,即完成了文本特征的提取,当然,除了上述表述的方式之外,还可以采用其他的方式进行文本特征提取,在此不作赘述。
[84]
步骤S22,基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
[85]
进一步地,对无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本三者分别对应的文本特征进行处理,使其迁移至同一特征空间中。
[86]
步骤S23,基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[87]
进一步地,基于预设的损失函数对上述同一特征空间中的特征进行学习,具体地,在本实施例中,预设的损失函数可以包括非监督损失函数、弱监督损失函数和监督损失函数,对应的,非监督损失函数是对同一特征空间中无标注信息的广告数据样本所对应的特征进行学习;弱监督损失函数是对同一特征空间中带有弱标注信息的广告数据样本所对应的特征进行学习;而监督损失函数是对同一特征空间中带有完整标注信息的广告数据样本所对应的特征进行学习。同时,还利用非监督损失函数对同一特征空间中所有的广告数据样本所对应的特征进行学习,因为,带有完整标注信息的广告数据样本和带有弱标注信息的广告数据样本,与无标注信息的广告数据样本相比,带有群体或点击率等标记信息,同样地可以被视为不带标注信息的样本数据,即对其所带有的完整标注、弱标注进行去除,然后利用非监督损失函数进行特征学习。可以理解的是,上述四个基于损失函数进行学习的过程可以同时进行,同时对该预设的神经网络模型进行优化训练。
[88]
进一步地,当损失函数开始收敛时,表明对预设的神经网络模型的训练完成,同时,对训练后的神经网络模型进行保存,以便用于后续的CTR在线预估。
[89]
可以理解的是,在利用迁移学习结合不同的广告数据以及用户行为数据对CTR预估所需的神经网络模型进行训练之前,为了加快学习的速度,即加速损失函数的收敛,提高神经网络模型的准确率,可以优先采用对预训练的神经网络模型进行权重初始化,权重初始化的方式可以包括但不限于初始化为小的随机数,如均值为0,方差为0.01的高斯分布,或者是Xavier均匀分布,以减少梯度弥散问题,使得信号在神经网络中可以传递得更深,还可以采用其他的方式进行权重初始化,在此不作赘述。
[90]
步骤S30,获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[91]
当需要进行CTR预估时,获取待预估的广告数据,并将其输入至训练后的神经网络模型中,神经网络模型即可输出该广告数据对应的CTR,即广告点击率。
[92]
在本实施例中,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本申请提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
[93]
进一步的,参照图4,基于上述实施例,提出本申请CTR预估方法第二实施例,在本实施例中,所述步骤S30还包括:
[94]
步骤S31,当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据;
[95]
当用户需要进行广告数据的CTR预估时,即可在终端上进行操作,当终端接收到相应的广告数据的CTR预估请求时,即可获取待广告数据的CTR预估请求对应的广告数据,以便基于训练好的神经网络模型对其进行CTR预估。
[96]
步骤S32,基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
[97]
在本实施例中,为了进一步地提高CTR预估的准确性,通过引入正则项的方式为神经网络模型引入随机性,进行多次CTR预估,以帮助估计CTR预估的不确定性。具体地,首先通过深度神经网络对待预估的广告数据进行特征提取,再通过引入正则项随机地减少特征的数量,再进行CTR预估,即可得到多次CTR预估结果。
[98]
步骤S33,基于所述多次CTR预估的结果,确定所述广告数据的CTR。
[99]
进一步地,对上述多次CTR预估的结果取平均值,即可得到本次广告数据的预估CTR。
[100]
进一步地,所述步骤S30之后,还包括:
[101]
步骤a,基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
[102]
在本实施例中,当通过神经网络模型对待预估的广告数据的CTR进行预测后,还可以通过特征筛选的方式确定该广告数据的重要特征,特征筛选所得的重要特征即为对广告预估结果的解释。具体地,是通过改变广告数据的某一特征后,再进行CTR预估,判断CTR预估的结果是否有发生大的变化,若没有,则表明该改变的特征不是重要特征;若有,则表明该特征是重要特征。例如,一金融广告数据基于神经网络模型进行特征提取后,得到6个特征,分别为男性、40-60岁、广东地区、高收益、高风险、购买人多,通过特征筛选的方式,确定重要特征为40-60岁和高收益,即神经网络模型主要依赖于这两个特征做出CTR预估。
[103]
在本实施例中,通过引入正则项的方式为神经网络模型引入随机性,进行多次CTR预估,得到多个CTR预估结果,提高了CTR预估结果的可信度及不确定性,同时采用特征筛选的方式确定广告数据对应的重要特征,对神经网络模型做出的CTR预估结果做出解释。
[104]
此外,本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有CTR预估程序,所述CTR预估程序被处理器执行时实现如下操作:
[105]
获取待训练的不同类型的广告数据样本;
[106]
基于所述广告数据样本对预设的神经网络模型进行训练;
[107]
获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[108]
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
[109]
将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
[110]
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
[111]
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[112]
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
[113]
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
[114]
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
[115]
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
[116]
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
[117]
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
[118]
保存所述训练后的神经网络模型。
[119]
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
[120]
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
[121]
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
[122]
基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
[123]
基于所述多次CTR预估的结果,确定所述广告数据的CTR。
[124]
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
[125]
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
[126]
本实施例提供的方案,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本申请提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
[127]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[128]
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
[129]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
[130]
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

权利要求书

[权利要求 1]
一种CTR预估方法,其中,所述CTR预估方法包括以下步骤: 获取待训练的不同类型的广告数据样本; 基于所述广告数据样本对预设的神经网络模型进行训练; 获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[权利要求 2]
如权利要求1所述的CTR预估方法,其中,所述广告数据样本包括无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,所述标注信息至少包括群体和点击率。
[权利要求 3]
如权利要求2所述的CTR预估方法,其中,所述基于所述广告数据样本对预设的神经网络模型进行训练的步骤包括: 将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征; 基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中; 基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[权利要求 4]
如权利要求3所述的CTR预估方法,其中,所述基于损失函数对所述同一特征空间中的特征进行学习的步骤包括: 基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和, 基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和, 基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和, 基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
[权利要求 5]
如权利要求4所述的CTR预估方法,其中,所述基于所述广告数据样本对预设的神经网络模型进行训练的的步骤之后,还包括: 保存所述训练后的神经网络模型。
[权利要求 6]
如权利要求5所述的CTR预估方法,其中,所述获取待预估的广告数据的步骤包括: 当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
[权利要求 7]
如权利要求6所述的CTR预估方法,其中,所述将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估的步骤包括: 基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估; 基于所述多次CTR预估的结果,确定所述广告数据的CTR。
[权利要求 8]
如权利要求7所述的CTR预估方法,其中,所述获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估的步骤之后,还包括: 基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
[权利要求 9]
一种CTR预估装置,其中,所述CTR预估装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的CTR预估程序,所述CTR预估程序被所述处理器执行时实现以下步骤: 获取待训练的不同类型的广告数据样本; 基于所述广告数据样本对预设的神经网络模型进行训练; 获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[权利要求 10]
如权利要求9所述的CTR预估装置,其中,所述广告数据样本包括无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,所述标注信息至少包括群体和点击率。
[权利要求 11]
如权利要求10所述的CTR预估装置,其中,所述CTR预估程序被所述处理器执行时实现以下步骤: 将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征; 基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中; 基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[权利要求 12]
如权利要求11所述的CTR预估装置,其中,所述CTR预估程序被所述处理器执行时实现以下步骤: 基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和, 基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和, 基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和, 基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
[权利要求 13]
如权利要求12所述的CTR预估装置,其中,所述CTR预估程序被所述处理器执行时实现以下步骤: 保存所述训练后的神经网络模型。
[权利要求 14]
如权利要求13所述的CTR预估装置,其中,所述CTR预估程序被所述处理器执行时实现以下步骤: 当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
[权利要求 15]
如权利要求14所述的CTR预估装置,其中,所述CTR预估程序被所述处理器执行时实现以下步骤: 基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估; 基于所述多次CTR预估的结果,确定所述广告数据的CTR。
[权利要求 16]
如权利要求15所述的CTR预估装置,其中,所述CTR预估程序被所述处理器执行时实现以下步骤: 基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
[权利要求 17]
一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有CTR预估程序,所述CTR预估程序被处理器执行时实现以下步骤: 获取待训练的不同类型的广告数据样本; 基于所述广告数据样本对预设的神经网络模型进行训练; 获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
[权利要求 18]
如权利要求17所述的计算机可读存储介质,其中,所述广告数据样本包括无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,所述标注信息至少包括群体和点击率。
[权利要求 19]
如权利要求18所述的计算机可读存储介质,其中,所述CTR预估程序被处理器执行时还实现以下步骤: 将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征; 基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中; 基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
[权利要求 20]
如权利要求19所述的计算机可读存储介质,其中,所述CTR预估程序被处理器执行时还实现以下步骤: 基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和, 基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和, 基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和, 基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。

附图