一种获取目标消息流量的数据处理系统的制作方法

allin2023-03-08  60



1.本发明涉及消息处理技术领域,尤其涉及一种获取目标消息流量的数据处理系统。


背景技术:

2.随着互联网技术的飞速发展,越来越多的用户在互联网消息平台中,投入到了大量的精力用于消息流量;当前,获取消息流量的方式主要是通过rtb模式获取消息流量,rtb(realtime bidding)实时竞价,是一种利用第三方技术在数以百万计的网站上针对每一个用户展示行为进行评估以及出价的竞价技术。
3.现有技术中,主要是采用消息流量的历史值确定所述消息流量的预期值;以所述预期值为基准,将消息流量分配给保量消息或非保量消息进行投放;但是,上述技术方案存在如下问题:无法准确的获取消息流量的点击率,导致无法准确的确定出消息流量的预期值,导致降低了获取消息流量的概率,使得用户无法获取到更多的所需消息流量。


技术实现要素:

4.针对上述技术问题,本发明采用的技术方案为一种获取目标消息流量的数据处理系统,所述系统包括:历史消息流量集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:s100、根据所述历史消息流量集,获取第一样本流量集a={a1,
……
,ai,
……
,am},以及获取第二样本流量集b={b1,
……
,bi,
……
,bm},ai是指第i个第一样本流量列表,bi是指ai对应的第二样本流量列表,i=1
……
m,m为第一样本流量列表的总数量;s200、根据a和b,获取中间消息流量集q={q1,
……
,qi,
……
,qm},qi={ai,bi};s300、将q作为训练数据集且基于所述训练数据集,获取目标流量点击率模型;s400、获取用户输入的目标消息流量列表e={e1,
……
,ej,
……
,en},其中,ej是指第j目标消息流量,j=1
……
n,n为目标消息流量的总数量;s500、根据e和所述目标流量点击率模型,获取e对应的消息流量的目标值列表u={u1,
……
,uj,
……
,un},uj是指ej对应的目标值,其中,uj符合如下条件:uj=f
0j
×
kj,其中,f
0j
是指ej对应的目标点击率,kj是指ej对应的预设值。
5.本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种获取目标消息流量的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:本发明的一种获取目标消息流量的数据处理系统包括:历史消息流量集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:根据所述历史消息流量集,获取第一样本流量集和第二样本流量集;根据第一样本流量集和第二样本流量集,获取中间消息流量集;将中间消息流量集作为训练数据集且基于所述训练数据集,获取目标流量点击率模型;根据用户输入的目标消息流量列表和所述目标流量点击
率模型,获取消息流量的目标值列表;能够准确的获取消息流量的点击率,进而准确的确定出消息流量的预期值,以使得用户可以获取到更多的所需消息流量。
6.此外,在点击率模型的训练过程中,采用不同权重对应的损失函数,一方面,保证了通过训练后的点击率模型,提高消息流量的点击率的准确性,以使得用户可以获取到更多的所需消息流量;另一方面,能够降低模型的复杂度,保证用户可以实时参与消息流量的竞争,避免遗漏到过多的用户所需消息流量。
7.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
8.图1为本发明实施例提供的一种获取目标消息流量的数据处理系统的执行步骤的流程图。
具体实施方式
9.为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种获取目标位置的数据处理系统的具体实施方式及其功效,详细说明如后。
10.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
11.实施例一本实施例提供了一种获取目标消息流量的数据处理系统,所述系统包括:历史消息流量集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤,如图1所示:s100、根据所述历史消息流量集,获取第一样本流量集a={a1,
……
,ai,
……
,am},以及获取第二样本流量集b={b1,
……
,bi,
……
,bm},ai是指第i个第一样本流量列表,bi是指ai对应的第二样本流量列表,i=1
……
m,m为第一样本流量列表的总数量。
12.具体地,在s100步骤中还包括如下步骤:s101、获取所述历史消息流量集d={d1,
……
,dr,
……
,ds}和d对应的历史值集f={f1,
……
,fr,
……
,fs},其中,dr是指第r个历史消息流量,fr是指dr对应的历史值,r=1
……
s,s为历史消息流量的总数量。
13.具体地,所述历史消息流量是指用户参与竞争的所有的消息流量。
14.具体地,所述历史值是指用户参与消息流量的历史竞价值。
15.s103、遍历d且从所述d中获取第一消息流量集和第二消息流量集。
16.进一步地,所述第一消息流量集是指基于第一消息流量构建的数据集,其中,所述第一消息流量是指在历史消息流量集中,用户已获取到的消息流量。
17.进一步地,所述第二消息流量集是指基于第二消息流量构建的数据集,其中,所述第二消息流量是指在历史消息流量集中,用户未获取到的消息流量,可以理解为所述第二消息流量集为所述原消息流量集中除所述第一消息流量集之外的消息流量集。
18.s105、根据所述第一消息流量集和f,获取a。
19.进一步地,在s105步骤中还包括如下步骤:s1051、根据所述第一消息流量集,从f中获取所述第一消息流量集对应的第一历史值列表p={p1,
……
,pg,
……
,pz},pg是指第g个第一消息流量对应的历史值,g=1
……
z,z为第一消息流量的总数量。
20.s1053、从p中获取第一消息流量对应的最大历史值p
max
和第一消息流量对应的最小历史值p
min

21.s1055、基于p
max
和p
min
,获取目标历史值区域列表h={h1,
……
,hi,
……
,hm},hi=[h
imin
,h
imax
],其中,h
imin
是指历史消息流量的第i个目标历史值区域中最小历史值,h
imax
是指历史消息流量的第i个目标历史值区域中最大历史值。
[0022]
优选地,h
i+1max-h
imin
=1。
[0023]
优选地,m符合如下条件:,其中,λ为预设参数值。
[0024]
s1057、当|pg|∈hi时,将pg对应的第一消息流量插入至ai中且基于ai构建a。进一步理解:当判断pg是否属于hi时,需要将pg取整,避免遗漏数据。
[0025]
s107、根据所述第二消息流量集和f,获取b。
[0026]
具体地,在s107步骤中还包括如下步骤:s1071、根据所述第二消息流量集,从f中获取所述第二消息流量集对应的第二历史值列表p'={p'1,
……
,p'
t
……
,p'k},p'
t
是指第t个第二消息流量对应的第二历史值,t=1
……
k,k为第二消息流量的总数量。
[0027]
优选地,z+k=s。
[0028]
s1073、当|p'
t
|∈hi时,将p'
t
对应的第二消息流量插入至bi中且基于bi构建b。
[0029]
上述,能够准确的划分出消息流量的数据集,进而准确的获取消息流量的点击率,进而准确的确定出消息流量的预期值,以使得用户可以获取到更多的所需消息流量。
[0030]
s200、根据a和b,获取中间消息流量集q={q1,
……
,qi,
……
,qm},qi={ai,bi}。
[0031]
s300、将q作为训练数据集且基于所述训练数据集,获取目标流量点击率模型。
[0032]
具体地,在s300步骤中还包括如下步骤:s301、将所述训练数据集输入至预设流量点击率模型中,获取q对应的总损失函数值l0。
[0033]
具体地,所述预设流量点击率模型为fm模型。
[0034]
进一步地,在s301步骤中还包括如下步骤:s3011、将ai输入至预设流量点击率模型中,获取ai对应的第一流量点击率列表ci={c
i1

……
,c
ix

……
,c
iqi
},c
ix
是指ai中第x个第一样本流量对应的点击率,x=1
……
qi,qi是
指ai中第一样本流量的总数量;可以理解为:c
ix
是指ai中第x个第一样本流量通过预设流量点击率模型获取到的。
[0035]
具体地,所述第一样本流量是指a中任一第一消息流量。
[0036]
s3013、将bi输入至预设流量点击率模型中,获取bi对应的第二流量点击率列表gi={g
i1

……
,g
iy

……
,g
ipi
},g
iy
是指bi中第y个第二样本流量对应的点击率,y=1
……
pi,pi是指bi中第二样本流量的总数量;可以理解为:g
iy
是指bi中第x个第一样本流量通过预设流量点击率模型获取到的。
[0037]
具体地,所述第二样本流量是指b中任一第一消息流量。
[0038]
s3015、根据c
ix
和g
iy
,获取l0,其中,l0符合如下条件:,其中,c
0ix
是指c
ix
对应的实际流量点击率,g
0iy
是指g
iy
对应的实际流量点击率;本领域技术人员知晓,任一获取实际流量点击率的方法均属于本实施例的保护范围。
[0039]
优选地,。
[0040]
s303、根据l0对所述预设流量点击率模型的参数进行调整,获取到所述目标流量点击率模型。
[0041]
上述实施例,能够在点击率模型的训练过程中,采用不同权重对应的损失函数,一方面,保证了通过训练后的点击率模型,提高消息流量的点击率的准确性,以使得用户可以获取到更多的所需消息流量;另一方面,能够降低模型的复杂度,保证用户可以实时参与消息流量的竞争,避免遗漏到过多的用户所需消息流量。
[0042]
s400、获取用户输入的目标消息流量列表e={e1,
……
,ej,
……
,en},其中,ej是指第j目标消息流量,j=1
……
n,n为目标消息流量的总数量。
[0043]
优选地,所述目标消息流量是指非历史消息流量集中的消息流量。
[0044]
s500、根据e和所述目标流量点击率模型,获取e对应的消息流量的目标值列表u={u1,
……
,uj,
……
,un},uj是指ej对应的目标值,其中,uj符合如下条件:uj=f
0j
×
kj,其中,f
0j
是指ej对应的目标点击率,kj是指ej对应的预设值。
[0045]
具体地,所述目标点击率是指目标消息流量输入至所述目标流量点击率模型中获取到的点击率。
[0046]
具体地,所述预设值是指用户对目标流量设置的竞价值。
[0047]
具体地,所述目标值是指用户对目标流量的预期竞价值。
[0048]
本实施例提供了一种获取目标消息流量的数据处理系统包括:历史消息流量集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:根据所述历史消息流量集,获取第一样本流量集和第二样本流量集;根据第一样本流量集和第二样本流量集,获取中间消息流量集;将中间消息流量集作为训练数据集且基于所述训练数据集,获取目标流量点击率模型;根据用户输入的目标消息流量列表和所述目标流量点击率模型,获取消息流量的目标值列表;能够准确的获取消息流量的点击率,进而准确
的确定出消息流量的预期值,以使得用户可以获取到更多的所需消息流量。
[0049]
此外,在点击率模型的训练过程中,采用不同权重对应的损失函数,一方面,保证了通过训练后的点击率模型,提高消息流量的点击率的准确性,以使得用户可以获取到更多的所需消息流量;另一方面,能够降低模型的复杂度,保证用户可以实时参与消息流量的竞争,避免遗漏到过多的用户所需消息流量。
[0050]
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

技术特征:
1.一种获取目标消息流量的数据处理系统,其特征在于,所述系统包括:历史消息流量集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:s100、根据所述历史消息流量集,获取第一样本流量集a={a1,
……
,a
i

……
,a
m
},以及获取第二样本流量集b={b1,
……
,b
i

……
,b
m
},a
i
是指第i个第一样本流量列表,b
i
是指a
i
对应的第二样本流量列表,i=1
……
m,m为第一样本流量列表的总数量;s200、根据a和b,获取中间消息流量集q={q1,
……
,q
i

……
,q
m
},q
i
={a
i
,b
i
};s300、将q作为训练数据集且基于所述训练数据集,获取目标流量点击率模型;s400、获取用户输入的目标消息流量列表e={e1,
……
,e
j

……
,e
n
},其中,e
j
是指第j目标消息流量,j=1
……
n,n为目标消息流量的总数量;s500、根据e和所述目标流量点击率模型,获取e对应的消息流量的目标值列表u={u1,
……
,u
j

……
,u
n
},u
j
是指e
j
对应的目标值,其中,u
j
符合如下条件:u
j
=f
0j
×
k
j
,其中,f
0j
是指e
j
对应的目标点击率,k
j
是指e
j
对应的预设值。2.根据权利要求1所述的获取目标消息流量的数据处理系统,其特征在于,在s100步骤中还包括如下步骤:s101、获取所述历史消息流量集d={d1,
……
,d
r

……
,d
s
}和d对应的历史值集f={f1,
……
,f
r

……
,f
s
},其中,d
r
是指第r个历史消息流量,f
r
是指d
r
对应的历史值,r=1
……
s,s为历史消息流量的总数量;s103、遍历d且从所述d中获取第一消息流量集和第二消息流量集;s105、根据所述第一消息流量集和f,获取a;s107、根据所述第二消息流量集和f,获取b。3.根据权利要求2所述的获取目标消息流量的数据处理系统,其特征在于,所述第一消息流量集是指基于第一消息流量构建的数据集,其中,所述第一消息流量是指在历史消息流量集中,用户已获取到的消息流量。4.根据权利要求2所述的获取目标消息流量的数据处理系统,其特征在于,所述第二消息流量集是指基于第二消息流量构建的数据集,其中,所述第二消息流量是指在历史消息流量集中,用户未获取到的消息流量。5.根据权利要求2所述的获取目标消息流量的数据处理系统,其特征在于,在s105步骤中还包括如下步骤:s1051、根据所述第一消息流量集,从f中获取所述第一消息流量集对应的第一历史值列表p={p1,
……
,p
g

……
,p
z
},p
g
是指第g个第一消息流量对应的历史值,g=1
……
z,z为第一消息流量的总数量;s1053、从p中获取第一消息流量对应的最大历史值p
max
和第一消息流量对应的最小历史值p
min
;s1055、基于p
max
和p
min
,获取目标历史值区域列表h={h1,
……
,h
i

……
,h
m
},h
i
=[h
imin
,h
imax
],其中,h
imin
是指历史消息流量的第i个目标历史值区域中最小历史值,h
imax
是指历史消息流量的第i个目标历史值区域中最大历史值;s1057、当|p
g
|∈h
i
时,将p
g
对应的第一消息流量插入至a
i
中且基于a
i
构建a。6.根据权利要求5所述的获取目标消息流量的数据处理系统,其特征在于,m符合如下
条件:,其中,λ为预设参数值。7.根据权利要求5所述的获取目标消息流量的数据处理系统,其特征在于,h
i+1max-h
imin
=1。8.根据权利要求5所述的获取目标消息流量的数据处理系统,其特征在于,在s107步骤中还包括如下步骤:s1071、根据所述第二消息流量集,从f中获取所述第二消息流量集对应的第二历史值列表p'={p'1,
……
,p'
t
……
,p'
k
},p'
t
是指第t个第二消息流量对应的第二历史值,t=1
……
k,k为第二消息流量的总数量;s1073、当|p'
t
|∈h
i
时,将p'
t
对应的第二消息流量插入至b
i
中且基于b
i
构建b。9.根据权利要求1所述的获取目标消息流量的数据处理系统,其特征在于,在s300步骤中还包括如下步骤:s301、将所述训练数据集输入至预设流量点击率模型中,获取q对应的总损失函数值l0;s303、根据l0对所述预设流量点击率模型的参数进行调整,获取到所述目标流量点击率模型。10.根据权利要求9所述的获取目标消息流量的数据处理系统,其特征在于,所述预设流量点击率模型为fm模型。

技术总结
本发明涉及消息处理技术领域,尤其是一种获取目标消息流量的数据处理系统,所述系统包括:历史消息流量集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:根据所述历史消息流量集,获取第一样本流量集和第二样本流量集;根据第一样本流量集和第二样本流量集,获取中间消息流量集;将中间消息流量集作为训练数据集且基于所述训练数据集,获取目标流量点击率模型;根据用户输入的目标消息流量列表和所述目标流量点击率模型,获取消息流量的目标值列表;本发明能够准确的获取消息流量的点击率,进而准确的确定出消息流量的预期值,以使得用户可以获取到更多的所需消息流量。获取到更多的所需消息流量。获取到更多的所需消息流量。


技术研发人员:叶新江 李浩川 姚建明 陈建斌
受保护的技术使用者:每日互动股份有限公司
技术研发日:2022.05.31
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-5639.html

最新回复(0)