本发明涉及大数据分析,具体而言,涉及一种基于大数据的岗位工作内容分配方法及系统。
背景技术:
1、对于企业以及组织来说,其能够形成高效运行的系统主要在于设置了能够满足业务以及作业需求的岗位,通过每个岗位提供不同的作业处理功能来实现对整体作业的高效处理。因而,要进一步提升作业的效率,就需要加强对于岗位作业的分工和配合方面的管理,通过有效的岗位作业管理手段实现对系统各个岗位作业效能的强化。
2、当前,对于岗位所需要处理的作业以及作业类型大部分还是人工进行,尤其是针对人作为岗位作业的单元的情况更是将岗位作业的内容和类型的分配处理得不尽人意,导致岗位作业无法实现高效化、专业化,进而大大降低了岗位作业的效率。
3、因此,设计一种基于大数据的岗位工作内容分配方法及系统,通过利用岗位作业的历史大数据进行作业量和作业类型的合理分配以大大提高岗位作业的效率,是目前亟待解决的问题。
技术实现思路
1、本发明的目的在于提供一种基于大数据的岗位工作内容分配方法,通过获取岗位的历史工作匹配数据一方面对历史工作内容进行基于工作类型的聚类分析,获取能够识别工作内容的类型的特征数据,进而为后续在接收到新的工作内容时能够快速高效的进行工作类型的判断提供数据基础。另一方面将历史工作内容与岗位匹配数据进行提取分析,确定出每个岗位能够处理的工作内容以及对于不同工作类型的工作内容不同岗位处理的效率,进而作为后续对接收到的工作内容从宏观层面进行分配提供参考依据,以实现最合理的工作内容岗位匹配,大大提高对工作内容高效处理的同时,也能够充分的平衡不同岗位的工作量,保持多个岗位组成的作业处理系统能够高效且合理的完成工作内容的处理。
2、本发明的目的还在于提供一种基于大数据的岗位工作内容分配系统,通过配置成充分完成历史岗位工作匹配数据的大数据采集和分析、工作内容类型特征数据的分析提取、岗位匹配基础数据的分析采集以及实时工作内容的合理匹配分析的系统,为保证基于大数据的岗位工作内容分配提供了重要且稳定的物质基础,有利于提升多个作业岗位组成的组织的工作处理效率。
3、第一方面,本发明提供一种基于大数据的岗位工作内容分配方法,包括获取历史岗位工作匹配数据,并提取所有历史工作内容,进行基于内容标签的聚类,形成不同标签历史工作内容集;对标签历史工作内容集进行内容特征信息的提取分析,形成不同内容标签的历史工作内容特征数据;根据历史岗位工作匹配数据,对不同岗位进行匹配工作内容特征分析,形成岗位匹配工作内容特征数据;获取实时待分配工作内容,并结合历史工作内容特征数据和岗位匹配工作内容特征数据进行匹配分析,形成实时岗位工作匹配数据。
4、在本发明中,该方法通过获取岗位的历史工作匹配数据一方面对历史工作内容进行基于工作类型的聚类分析,获取能够识别工作内容的类型的特征数据,进而为后续在接收到新的工作内容时能够快速高效的进行工作类型的判断提供数据基础。另一方面将历史工作内容与岗位匹配数据进行提取分析,确定出每个岗位能够处理的工作内容以及对于不同工作类型的工作内容不同岗位处理的效率,进而作为后续对接收到的工作内容从宏观层面进行分配提供参考依据,以实现最合理的工作内容岗位匹配,大大提高对工作内容高效处理的同时,也能够充分的平衡不同岗位的工作量,保持多个岗位组成的作业处理系统能够高效且合理的完成工作内容的处理。
5、作为一种可能的实现方式,对标签历史工作内容集进行内容特征信息的提取分析,形成不同内容标签的历史工作内容特征数据,包括:对标签历史工作内容集中的所有历史工作内容进行基于内容标签的特征词提取,形成内容标签对应的标签内容特征词集;对标签历史工作内容集中的所有历史工作内容进行基于过程文件类型的特征提取,形成内容标签对应的标签文件类型特征集;将同一内容标签下的标签内容特征词集和标签文件类型特征集对应,形成内容标签的历史特征数据集。
6、在本发明中,对已经标定类型的历史工作内容进行内容特征信息的提取,其具体所要提取的特征信息包括两个方面的内容,一方面是对工作内容中的文字进行特征词的提取,特征词的提取主要是围绕内容标签进行,即让提取到的特征词是与内容标签相关的词语簇,这样在后续利用这些特征词进行对比分析判断时,才能够准确的通过这些特征词确定出对应的工作类型。当然,对于特征词的提取可以是基于语义分析的特征词提取,也可以是基于自主学习的特征词的寻找,也可以是其他能够实现提取有效特征词的方式,另一方面是对工作内容处理过程中所产生的文件类型进行提取,这一方面的特征信息的提取既有助于为后续进行不同类型文件的准备提供参考,又能够为后续进行新收到的工作内容的类型确认提供辅助性的判断支持。需要说明的是,对于文件类型的确定,可以根据所分析的岗位所在行业的具体情况来确定,诸如在工程领域的图纸文件是一个重要的区别于其他类型工作内容的文件类型,当然,也可以进一步的基于需要进行深化,诸如调查文件、审批文件、检验文件等。
7、作为一种可能的实现方式,对标签历史工作内容集中的所有历史工作内容进行基于内容标签的特征词提取,形成内容标签对应的标签内容特征词集,包括:根据标签历史工作内容集对应的内容标签,在标签历史工作内容集中的所有历史工作内容中提取与内容标签相关的特征词,形成内容标签对应的初始内容特征词集;结合所有初始内容特征词集,进行基于重复统计的筛选分析,形成每个内容标签对应的标签内容特征词集。
8、在本发明中,对历史工作内容进行基于特征词的提取,其方式多样,本技术采用首先在相同类型的工作内容中提取出所有关于该内容标签的特征词集,再在不同类型的工作内容之间进行特征词的筛选,进而获取到能够充分针对不同内容标签的特征词数据,为后续基于这些特征词数据进行工作内容的类型判断提供了准确且合理的数据基础,并且有助于提高工作内容类型判断的工作效率。
9、作为一种可能的实现方式,结合所有初始内容特征词集,进行基于重复统计的筛选分析,形成每个内容标签对应的标签内容特征词集,包括:对所有初始内容特征词集中的特征词进行重复统计分析,并根据重复统计结果进行以下筛选判断:若对于特征词均存在于所有的初始内容特征词集中,则将特征词确定为共同特征词;若对于特征词存在于部分初始内容特征词集中,则将特征词确定为非完全重复特征词;若对于特征词仅存在于单独的初始内容特征词集中,则将特征词确定为独立特征词;对内容标签,集合对应初始内容特征词集中包含的所有独立特征词,形成内容标签对应的独立特征词集;对内容标签,集合对应初始内容特征词集中包含的所有非完全重复特征词,形成内容标签对应的非完全重复特征词集;对每个内容标签,将独立特征词集和非完全重复特征词集相对应,形成内容标签对应的标签内容特征词集。
10、在本发明中,对于不同的内容标签来说,由于内容标签背后是不同类型的工作内容,因而所采集到的特征词集就需要准确的提供确认工作内容类型的数据。在将相同类型的工作内容进行特征词的提取后,进行不同内容标签对应的特征词的对比会出现三种情况,一种是特征词在所有的内容标签中都出现过,那么可以认为这种类型的特征词并不具有识别不同工作内容类型的作用,因而考虑将这种特征词筛选出来去除,以避免后续进行工作内容类型判断时增加分析判断的工作量进而降低作业效率。第二种情况是特征词出现在部分的内容标签中,这一类的特征词通常来说还是比较多的,毕竟对于多个岗位形成的组织一般是具有作业专一性的,不同内容标签的工作内容存在一定的关联性。对于这一类的特征词是需要进行保留的,用以区别那些不包含这些特征词的工作内容或者内容标签。第三种情况是特征词只出现在一类内容标签上,这样这种类型的特征词是具有绝对的识别作用的,因而包含有这类特征词的工作内容必然对应了唯一的内容标签。将非完全重复的特征词集和独立特征词集对应起来能够为识别后续的工作内容的类型提供了重要的数据基础。
11、作为一种可能的实现方式,对标签历史工作内容集中的所有历史工作内容进行基于过程文件类型的特征提取,形成内容标签对应的标签文件类型特征集,包括:提取对标签历史工作内容集中的每个历史工作内容包含的所有文件类型;对标签历史工作内容集中所有历史工作内容所包含的文件类型进行以下分析提取:将存在于所有历史工作内容中的文件类型确定为必要文件类型;将并非存在于所有历史工作内容中的文件类型确定为非必要文件类型;集合所有必要文件类型,形成内容标签对应的标签文件类型特征集。
12、在本发明中,对文件类型的特征提取,考虑工作内容的处理过程中会因为结果需求的不同而使处理过程中所需要的文件类型产生一定的偏差,即并不是工作内容的类型相同,在处理工程中所能够用到的文件类型就必须是一致相同的,多多少少会有一些不一样,而文件类型特征数据的提取主要也是为后续进行工作内容的类型判断提供辅助依据,因而确定工作内容是否属于某个类型,就需要确定必要的文件类型是否在工作内容中都出现过。文件类型的特征提取也是为工作内容的类型识别提供了准确且合理的基础对比数据。
13、作为一种可能的实现方式,根据历史岗位工作匹配数据,对不同岗位进行匹配工作内容特征分析,形成岗位匹配工作内容特征数据,包括:根据历史岗位工作匹配数据,确定每个岗位所匹配的所有历史工作内容;对每个岗位,根据所匹配的历史工作内容的内容标签,确定岗位对应的所有内容标签,形成岗位匹配内容标签集;根据岗位匹配内容标签集,对岗位对应的所有历史工作内容进行聚类,形成每个内容标签对应的岗位标签历史内容集;根据岗位标签历史内容集,确定内容标签对应的岗位平均处理时长;集合岗位匹配内容标签集和岗位匹配内容标签集中每个内容标签对应的岗位平均处理时长,形成岗位对应的岗位匹配工作内容特征数据。
14、在本发明中,每个岗位可以处理的工作内容的类型通常并不单一,因而需要对岗位进行其能够处理的工作内容的类型的确定。而岗位所能够处理工作内容类型的分析也主要源于历史工作内容被分配的结果数据。大数据下可以根据历史分配结果准确的确定出岗位所能处理的工作内容类型。可以理解的是,对于还没有利用大数据进行工作内容分配时,岗位所能够处理的工作内容的类型有可能会超出岗位上人员自身的作业处理能力,因而可以基于岗位对应地处理了不同类型工作内容的频次来择优地进行选择确定,以为后续岗位匹配工作内容后能够更加快速高效地完成作业提供了数据基础。当然,对于不同的岗位,其针对不同类型的工作内容的处理效率也是不同的,而这种处理效率也是进行匹配分析的一个重要数据参考部分,毕竟不能老是将工作内容匹配到效率低下的岗位上,反之也不能老是将工作内容匹配到效率较高的岗位上,容易造成岗位在工作内容处理上的不合理。这里,以处理的时长作为评估岗位对既定的工作内容类型上的作业的处理效率,使得评估更加方便且全面。
15、作为一种可能的实现方式,获取实时待分配工作内容,并结合历史工作内容特征数据和岗位匹配工作内容特征数据进行匹配分析,形成实时岗位工作匹配数据,包括:根据历史工作内容特征数据,对实时待分配工作内容进行定标分析,确定实时待分配工作内容的实时内容标签;根据实时内容标签以及岗位匹配工作内容特征数据,进行基于工作量的岗位匹配分析,形成实时岗位工作匹配数据。
16、在本发明中,在完成工作内容的特征信息提取和岗位工作内容匹配的基础数据后,就可以利用这些数据对待匹配的工作内容进行合理的匹配分析了。分析包括主要包括两个方面,一个是对待处理的工作内容进行类型的确定,另一方面是基于工作量对工作内容进行岗位的合理匹配,以充分保证匹配后系统运行的效率会更高。
17、作为一种可能的实现方式,根据历史工作内容特征数据,对实时待分配工作内容进行定标分析,确定实时待分配工作内容的实时内容标签,包括:根据历史工作内容特征数据中的不同独立特征词集,对实时待分配工作内容中进行以下采集分析:若存在独立特征词集中的所有独立特征词均出现在实时待分配工作内容中,则将独立特征词集对应的内容标签确定为实时待分配工作内容的实时内容标签;若不存在,则根据历史工作内容特征数据中的不同非完全重复特征词集和对应的标签文件类型特征集,确定出非完全重复特征词和对应的必要文件类型均出现在实时待分配工作内容的历史工作内容特征数据,并将历史工作内容特征数据对应的内容标签确定为实时待分配工作内容的实时内容标签。
18、在本发明中,待分配工作内容的类型确定是具有顺序性的,这种顺序性的分析判断有利于提高分析的效率。首先是获取能够进行唯一工作类型确定的独立特征词,将所有的独立特征词在实时待分配工作内容中进行对比,确定是否存在,若存在则能够快速的确定待分配工作内容的类型。在独立特征词为找到情况下,就是利用非完全重复特征词进行对比分析,若存在完全包含其中一个类型的非完全重复特征词的情况,则初步判断待分配工作内容类型所属于的工作内容类型有哪些。由于非完全重复特征词并不像独立特征词一样具有绝对的唯一性,因而初步的分析判断进能够确定是否存在有一些工作内容类型可用于对待分配工作内容的类型确定。要进一步的确定待分配工作内容的类型,就需要根据必要文件类型进行进一步的确定,只有两者具具有的情况下才能完全确定待分配工作内容的类型。
19、作为一种可能的实现方式,根据实时内容标签以及岗位匹配工作内容特征数据,进行基于工作量的岗位匹配分析,形成实时岗位工作匹配数据,包括:根据待分配工作内容的实时内容标签,确定岗位匹配工作内容特征数据中包含与实时内容标签相同的内容标签的岗位,并确定为目标匹配岗位;根据岗位匹配工作内容特征数据,确定每个目标匹配岗位的现存工作内容总时长和每个目标匹配岗位含与实时内容标签相同内容标签的历史工作内容的现存标签内容有效工作量n表示不同目标匹配岗位的编号;根据岗位匹配工作内容特征数据,确定每个目标匹配岗位完成待分配工作内容的岗位平均处理时长tn和有效工作量qn,其中,有效工作量qn根据以下方式确定:确定所有目标匹配岗位完成待分配工作内容最短的岗位平均处理时长,并标定为基准时长tmin;根据基准时长以及岗位平均处理时长tn,确定目标匹配岗位对应的有效工作量分别设定工作总时长波动阈值α和有效工作量波动阈值β,并将满足下式的所有k的取值中数值最小的有效工作量对应的目标匹配岗位确定为分配岗位:其中,k取任一的n值,i为k取定后任意的n值。
20、在本发明中,在确定待分配工作内容的类型后,可以确定出能够处理待分配工作内容的岗位有哪些。而如何进行分配成为匹配工作的重点。这里,通过考虑实际岗位在分配到待分配工作内容后增加的处理时长以及变化的有效工作量来进行合理的分配。需要说明的是,对于平均处理时长的增减情况,主要考虑岗位的作业具有同一的作业时长性,因而不能因为分配了待分配的工作内容后导致岗位的处理时长超过平均水平太多,因而就需要考虑在岗位被分配待分配的工作内容后在这些目标匹配岗位中作业时长是否发生了较大的变化,这里通过对被分配待分配工作内容的岗位相对平均水平的偏量的分析来进行确认。同时,还需要考虑到不同岗位处理同一类型的工作内容的效率是不同的,如果一直将工作分配给效率高的或者低的岗位也会造成分配的不合理,因而从工作量上进行考虑,即被分配到工作内容的岗位相对其他岗位的有效工作量的差距不能太大,这里,对于工作量的考虑仅仅是基于所有目标匹配岗位中现有的和待分配工作内容类型相同的所有工作内容形成的有效工作量,而对平均处理时长的考虑则是对所有目标岗位现在包含的所有类型的工作内容所需平均处理时长的总和。另外,需要说明的是,对于波动阈值可以根据实际的需要进行设定,也可以基于大数据分析确定。对于k值,每次取定一个,然后分析所选定的目标匹配岗位即k的取值对应的岗位在被分配待分配工作内容的情况下两个式子的结果,逐步的让k取到每一个n,然后取定出满足阈值条件的所有k值,再在k值中确定有效工作量最小的那个目标匹配岗位即可。
21、第二方面,本发明提供一种基于大数据的岗位工作内容分配系统,基于大数据的岗位工作内容分配系统被配置为获取历史岗位工作匹配数据,并提取所有历史工作内容,进行基于内容标签的聚类,形成不同标签历史工作内容集;对标签历史工作内容集进行内容特征信息的提取分析,形成不同内容标签的历史工作内容特征数据;根据历史岗位工作匹配数据,对不同岗位进行匹配工作内容特征分析,形成岗位匹配工作内容特征数据;获取实时待分配工作内容,并结合历史工作内容特征数据和岗位匹配工作内容特征数据进行匹配分析,形成实时岗位工作匹配数据。
22、在本发明中,该系统通过配置成充分完成历史岗位工作匹配数据的大数据采集和分析、工作内容类型特征数据的分析提取、岗位匹配基础数据的分析采集以及实时工作内容的合理匹配分析的系统,为保证基于大数据的岗位工作内容分配提供了重要且稳定的物质基础,有利于提升多个作业岗位组成的组织的工作处理效率。
23、本发明提供的一种基于大数据的岗位工作内容分配方法及系统的有益效果有:
24、该方法通过获取岗位的历史工作匹配数据一方面对历史工作内容进行基于工作类型的聚类分析,获取能够识别工作内容的类型的特征数据,进而为后续在接收到新的工作内容时能够快速高效的进行工作类型的判断提供数据基础。另一方面将历史工作内容与岗位匹配数据进行提取分析,确定出每个岗位能够处理的工作内容以及对于不同工作类型的工作内容不同岗位处理的效率,进而作为后续对接收到的工作内容从宏观层面进行分配提供参考依据,以实现最合理的工作内容岗位匹配,大大提高对工作内容高效处理的同时,也能够充分的平衡不同岗位的工作量,保持多个岗位组成的作业处理系统能够高效且合理的完成工作内容的处理。
25、该系统通过配置成充分完成历史岗位工作匹配数据的大数据采集和分析、工作内容类型特征数据的分析提取、岗位匹配基础数据的分析采集以及实时工作内容的合理匹配分析的系统,为保证基于大数据的岗位工作内容分配提供了重要且稳定的物质基础,有利于提升多个作业岗位组成的组织的工作处理效率。
1.一种基于大数据的岗位工作内容分配方法,其特征在于,包括:
2.根据权利要求1所述的基于大数据的岗位工作内容分配方法,其特征在于,所述对所述标签历史工作内容集进行内容特征信息的提取分析,形成不同内容标签的历史工作内容特征数据,包括:
3.根据权利要求2所述的基于大数据的岗位工作内容分配方法,其特征在于,所述对所述标签历史工作内容集中的所有历史工作内容进行基于内容标签的特征词提取,形成所述内容标签对应的标签内容特征词集,包括:
4.根据权利要求3所述的基于大数据的岗位工作内容分配方法,其特征在于,所述结合所有所述初始内容特征词集,进行基于重复统计的筛选分析,形成每个所述内容标签对应的所述标签内容特征词集,包括:
5.根据权利要求4所述的基于大数据的岗位工作内容分配方法,其特征在于,所述对所述标签历史工作内容集中的所有历史工作内容进行基于过程文件类型的特征提取,形成所述内容标签对应的标签文件类型特征集,包括:
6.根据权利要求5所述的基于大数据的岗位工作内容分配方法,其特征在于,所述根据所述历史岗位工作匹配数据,对不同岗位进行匹配工作内容特征分析,形成岗位匹配工作内容特征数据,包括:
7.根据权利要求6所述的基于大数据的岗位工作内容分配方法,其特征在于,所述获取实时待分配工作内容,并结合所述历史工作内容特征数据和所述岗位匹配工作内容特征数据进行匹配分析,形成实时岗位工作匹配数据,包括:
8.根据权利要求7所述的基于大数据的岗位工作内容分配方法,其特征在于,所述根据所述历史工作内容特征数据,对所述实时待分配工作内容进行定标分析,确定所述实时待分配工作内容的实时内容标签,包括:
9.根据权利要求8所述的基于大数据的岗位工作内容分配方法,其特征在于,所述根据所述实时内容标签以及所述岗位匹配工作内容特征数据,进行基于工作量的岗位匹配分析,形成所述实时岗位工作匹配数据,包括:
10.一种基于大数据的岗位工作内容分配系统,采用权利要求1-9任意一项所述基于大数据的岗位工作内容分配方法,其特征在于,所述基于大数据的岗位工作内容分配系统被配置为获取历史岗位工作匹配数据,并提取所有历史工作内容,进行基于内容标签的聚类,形成不同标签历史工作内容集;对所述标签历史工作内容集进行内容特征信息的提取分析,形成不同内容标签的历史工作内容特征数据;根据所述历史岗位工作匹配数据,对不同岗位进行匹配工作内容特征分析,形成岗位匹配工作内容特征数据;获取实时待分配工作内容,并结合所述历史工作内容特征数据和所述岗位匹配工作内容特征数据进行匹配分析,形成实时岗位工作匹配数据。