基于机器学习的卷烟需求预测方法、装置、设备和存储介质与流程

allin2024-07-06  96



1.本技术的实施例涉及卷烟需求预测领域,尤其涉及基于机器学习的卷烟需求预测方法、装置、设备和计算机可读存储介质。


背景技术:

2.目前市面上对一些快消品的需求预测完全基于市场化,以销量和利润为导向,不符合烟草行业的特殊性,烟草行业是由国家统一调控、管理,在此基础上,有一定的市场化行为,所以需要结合烟草行业的特殊性,不会一味追求销量和利润,保持行业稳定高质量发展才是重要目标。
3.当前一些软件厂商为烟草公司研发的平台,预测准确度和效率较低,没有加入深度学习算法,基于指标固定公式计算,脱离行业背景,使用率较低。


技术实现要素:

4.根据本技术的实施例,提供了一种基于机器学习的卷烟需求预测方案。
5.在本技术的第一方面,提供了一种基于机器学习的卷烟需求预测方法。该方法包括:
6.获取零售商的数据信息;
7.对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。
8.进一步地,所述对所述零售商的数据信息进行规则化处理包括:
9.将每一品规每月每个零售商的信息为一条记录。
10.进一步地,所述需求预测模型包括:
11.采用网格搜索法,构建所述需求模型中的参数组合。
12.进一步地,所述对已规则化的零售商的数据信息进行特征提取包括:
13.采用one out,one in法则,对已规则化的零售商的数据信息进行特征提取。
14.进一步地,还包括:
15.根据所述零售商的数据信息中的订单量,通过预设方法对所述预测需求量进行修正,得到最终的需求量。
16.在本技术的第二方面,提供了一种基于机器学习的卷烟需求预测装置。该装置包括:
17.获取模块,用于获取零售商的数据信息;
18.处理模块,用于对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。
19.在本技术的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
20.在本技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本技术的第一方面的方法。
21.本技术实施例提供的基于机器学习的卷烟需求预测方法,通过获取零售商的数据信息;对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量,提高卷烟需求预测的精准度和实效性。
22.应当理解,发明内容部分中所描述的内容并非旨在限定本技术的实施例的关键或重要特征,亦非用于限制本技术的范围。本技术的其它特征将通过以下的描述变得容易理解。
附图说明
23.结合附图并参考以下详细说明,本技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
24.图1示出了本技术的实施例提供的方法所涉及的系统架构图。
25.图2示出了根据本技术的实施例的基于机器学习的卷烟需求预测方法的流程图;
26.图3示出了根据本技术的实施例的基于机器学习的卷烟需求预测装置的方框图;
27.图4示出了适于用来实现本技术实施例的终端设备或服务器的结构示意图。
具体实施方式
28.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
29.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在 a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
30.图1示出了可以应用本技术的基于机器学习的卷烟需求预测方法或基于机器学习的卷烟需求预测装置的实施例的示例性系统架构100。
31.如图1所示,系统架构100可以包括终端设备101、102、103,网络104 和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
32.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如模型训练类应用、视频识别类应用、网页浏览器应用、社交平台软件等。
33.终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、 102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture experts groupaudio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving pictureexperts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为
软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
34.当终端101、102、103为硬件时,其上还可以安装有视频采集设备。视频采集设备可以是各种能实现采集视频功能的设备,如摄像头、传感器等等。用户可以利用终端101、102、103上的视频采集设备来采集视频。
35.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、 103上显示的数据处理的后台服务器。后台服务器可以对接收到的数据进行分析等处理,并可以将处理结果(例如识别结果)反馈给终端设备。
36.需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
37.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。特别地,在目标数据不需要从远程获取的情况下,上述系统架构可以不包括网络,而只包括终端设备或服务器。
38.如图2所示,是本技术实施例的基于机器学习的卷烟需求预测方法的流程图。从图2中可以看出,本实施例的基于机器学习的卷烟需求预测方法,包括以下步骤:
39.s210,获取零售商的数据信息。
40.在本实施例中,基于标签算法的卷烟精准投放方法的执行主体(例如图1 所示的服务器)可以通过有线方式或者无线连接的方式获取零售商的数据信息。
41.进一步地,上述执行主体可以获取与之通信连接的电子设备(例如图1 所示的终端设备)发送的零售商的数据信息,也可以是预先存储于本地的零售商的数据信息。
42.在一些实施例中,所述零售户的数据信息包括地理位置、每个月销售各类卷烟的数量、零售户的类型、规模、经营年限和/或所处poi商圈信息等,可通过大数据分析、网络爬虫等方式进行获取。
43.s220,对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。
44.在一些实施例中,对步骤s210获取的数据信息进行整理,汇总每一品规每月各零售商的订单数据、投放数据和/或终端数据,将其中缺失数据补充完整,如将其中没有记录的月份以订单量(投放量、销量)为零补充完整。其中,所述品规为烟草sku,表示每一种商品,如中行(软)、中华(硬)。
45.在一些实施例中,对汇总后的数据进行规则化处理,将每一品规每月每个零售商的信息为一条记录。
46.进一步地,对已规则化的零售商的数据信息进行特征提取,包括历史订单量、投放量、卷烟销量等,同时汇总各零售商的经营业态、周围人口信息和/或周围商圈信息等。
47.在一些实施例中,所述需求预测模型可通过如下方式进行构建:
48.生成训练样本集合,其中,训练样本包括带有标注信息的零售商的历史订单数据;所述标注信息包括销售数据;
49.利用所述训练样本集合中的样本对需求预测模型进行训练,以所述历史订单数据作为输入,以销售数据作为输出,当输出的销售数据与标注的销售数据的统一率满足预设阈值时,完成对需求预测模型的训练。
50.其中,对所述需求预测模型进行训练时,取零售商的历史订单数据中的最后一个月作为测试集;
51.在所述训练样本中,验证集和训练集以2比8的比例进行随机抽取(抽取时排除最后一个月的数据)。
52.在一些实施例中,通过网格搜索法,提取使得验证集上均方误差最小的“learning_rate”、“n_estimators”和“num_leaves”组合,作为模型参数。
53.在一些实施例中,当训练集达到连续5个epoch时,终止后续训练。
54.在一些实施例中,采用one out,one in法则,对已规则化的零售商的数据信息进行特征提取,以期在较短的时间内取得较好的效果。即首先选取与订单密切相关的几个特征(利用feature importances找出贡献最大的几个特征),再进行10轮“one-in-and-one-out”的特征选择,每轮找到未被选取的特征中最能提高模型预测效果的特征,并淘汰已被选取的特征中如果没有该特征的参与模型效果最好的特征(若不淘汰任何特征比淘汰效果更好时,则不淘汰)。
55.例如:若选特征为1、2、3,备选特征为4、5、6、7、8、9、10,则本轮首先会从4-10特征中选取最能提高模型效果的特征,若比之前的特征组合效果更优,则就加入这个特征(比如是4),若不能提升,那么停止选择,返回1、2、3特征组合;其次(前面未返回),再从1、2、3、4这四个特征中找出删除哪一个特征对模型效果更好,若删除后提升效果,则删除这个特征。
56.进一步地,还包括:
57.根据所述零售商的数据信息中的订单量,通过预设方法对所述预测需求量进行修正,得到最终的需求量。
58.具体地,计算每月平均订单量,
59.若预测时距离该零售户第一次订购超过一年,则用过去一年订单量/12;
60.若有订购记录但未满一年,则用过去一年订单量/距离该零售户第一次订购有几月;
61.若未订购,则订单量为零。
62.通过所述每月平均订单量,设定修正系数,通过所述修订系数对所述预测需求量进行修正,得到最终的需求量。
63.根据本公开的实施例,实现了以下技术效果:
64.将多源数据融合(零售商的数据信息),通过机器学习的算法,科学预测单零售客户对单卷烟品规的需求。提高了预测的准确度、精准度和预测效率。
65.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本技术所必须的。
66.以上是关于方法实施例的介绍,以下通过装置实施例,对本技术所述方案进行进
一步说明。
67.图3示出了根据本技术的实施例的基于机器学习的卷烟需求预测装置 300的方框图,如图3所示,装置300包括:
68.获取模块310,用于获取零售商的数据信息;
69.处理模块320,用于对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。
70.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
71.图4示出了适于用来实现本技术实施例的终端设备或服务器的结构示意图。
72.如图4所示,终端设备或服务器400包括中央处理单元(cpu)401,其可以根据存储在只读存储器(rom)402中的程序或者从存储部分408加载到随机访问存储器(ram)403中的程序而执行各种适当的动作和处理。在ram 403 中,还存储有系统400操作所需的各种程序和数据。cpu 401、rom 402以及 ram 403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。
73.以下部件连接至i/o接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至i/o接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
74.特别地,根据本技术的实施例,上文方法流程步骤可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(cpu)401执行时,执行本技术的系统中限定的上述功能。
75.需要说明的是,本技术所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器 (eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的
程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
76.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
77.描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
78.作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或者多个程序,当上述前述程序被一个或者一个以上的处理器用来执行描述于本技术的方法。
79.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的申请范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中申请的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

技术特征:
1.一种基于机器学习的卷烟需求预测方法,其特征在于,包括:获取零售商的数据信息;对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。2.根据权利要求1所述的方法,其特征在于,所述对所述零售商的数据信息进行规则化处理包括:将每一品规每月每个零售商的信息为一条记录。3.根据权利要求2所述的方法,其特征在于,所述需求预测模型包括:采用网格搜索法,构建所述需求模型中的参数组合。4.根据权利要求3所述的方法,其特征在于,所述对已规则化的零售商的数据信息进行特征提取包括:采用one out,one in法则,对已规则化的零售商的数据信息进行特征提取。5.根据权利要求4所述的方法,其特征在于,还包括:根据所述零售商的数据信息中的订单量,通过预设方法对所述预测需求量进行修正,得到最终的需求量。6.一种基于机器学习的卷烟需求预测装置,其特征在于,包括:获取模块,用于获取零售商的数据信息;处理模块,用于对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。7.根据权利要求6所述的装置,其特征在于,所述对所述零售商的数据信息进行规则化处理包括:将每一品规每月每个零售商的信息为一条记录。8.根据权利要求7所述的装置,其特征在于,所述需求预测模型包括:采用网格搜索法,构建所述需求模型中的参数组合。9.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~5中任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~5中任一项所述的方法。

技术总结
本申请的实施例提供了基于机器学习的卷烟需求预测方法、装置、设备和计算机可读存储介质。所述方法包括获取零售商的数据信息;对所述零售商的数据信息进行规则化处理;对已规则化的零售商的数据信息进行特征提取,将提取到的特征输入至需求预测模型,输出零售商的预测需求量。以此方式,可以提高了卷烟预测的效率。率。率。


技术研发人员:师耀东 宋志远 李辉 陈军 夏海 史佳媚 李华 杨夏菲 王玮 刘焱红
受保护的技术使用者:北京零点有数数据科技股份有限公司
技术研发日:2022.04.19
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-15138.html

最新回复(0)