1.本公开实施例涉及计算技术领域,尤其涉及一种群智感知任务发布及参与 者选择方法、系统、设备及介质。
背景技术:2.群智感知利用参与者的移动智能设备上的传感器来收集数据,从而完成大 规模、复杂的感知任务。群智感知中有大量感知任务需要感知参与者在连续的 时间内持续参与任务。譬如空气质量监测通常需要从不同时间的多个地理区域 收集空气质量测量数据,以便进行分析和处理。交通拥堵监测通常需要持续地 对特定的路段进行监测。此外,例如噪声污染,也需要持续性的监测,需要对 不同时段的噪声强度进行测量。在这样的场景中,为了收集到更准确的数据, 通常需要相同场景的不同时间段内多次收集数据,因此研究激励参与者长期参 与的机制是十分必要的。
3.当前群智感知领域应用最广泛、效果最好的激励机制是金钱式激励。目前 常见的金钱式激励通常采用拍卖、博弈的方式来激励参与者参与任务,而目前 这些研究当中大多存在两个问题,第一、这些研究没有考虑到激励参与者长期 参与的问题,只考虑了对参与者的短期激励,即通过报酬的方式补偿参与者在 参与感知任务的过程中消耗的资源。并且这些研究都是基于传统经济学的成本
ꢀ‑
收益模型,他们假设只有当参与者的收益高于成本时,参与者才会参与任务; 并且当参与者获得的报酬低于成本时,参与者会选择退出。第二、其他的一些 激励机制虽然并没有具体提及长期激励的问题,但是在机制的作用过程中产生 了长期激励的效果。例如声誉机制中,平台会根据参与者的历史记录来更新参 与者的声誉,为了获取任务或者获得更高的报酬,参与者会不断地提高自己的 声誉。但是这些工作都认为参与者在进行决策时是根据参与者效用函数的绝对 值来决定的,也就是说大部分的研究认为激励效果和报酬成正比;此外这些研 究也没有考虑到参与者的决策会受到先前因素(例如参与者上一轮的出价以及 其他获胜参与者的出价等)的影响。然而,前景理论的研究表明,人们是从相 对于某个参考点衡量的收益和损失中获得效用,而不是从绝对水平中获得效 用;前景理论的研究还表明在不确定条件下人们进行决策时,决策结果会受到 先前因素的影响并且不断偏向这些信息。
4.综上所述,亟需一种考虑前景理论对参与者行为决策影响的、能够激励参 与者长期参与群智感知任务方法来解决上述问题。
技术实现要素:5.有鉴于此,本公开实施例提供一种群智感知任务发布及参与者选择方法、 系统、设备及介质,至少部分解决现有技术中存在感知任务的覆盖率和参与者 的感知维持率较差的问题。
6.第一方面,本公开实施例提供了一种群智感知任务发布及参与者选择方 法,包括:
7.步骤1,依据前景理论将参与者完成任务获得的报酬设计为两种报酬方 案,其中,所述报酬方案包括普通方案和彩票方案;
8.步骤2,平台根据本轮的任务以及上一轮获胜参与者的出价情况设置外部 参照点;
9.步骤3,将任务最高报酬以及不同的报酬方案、平台设置的外部参照点发 布给参与者;
10.步骤4,获取群智感知参与者选择任务的对应出价的集合;
11.步骤5,对于每个感知任务,平台根据竞争该任务的参与者的出价以及其 参与者的彩票方案选择次数、参与者的损失因子计算的出参与者在感知任务中 的优先级,依次选择优先级最高的参与者,得到获胜参与者集合;
12.步骤6,当所有选择彩票报酬方案的参与者完成感知任务后,平台公布中 奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者的损失厌恶 值,并根据损失厌恶值来调整参与者的损失因子。
13.根据本公开实施例的一种具体实现方式,根据所述彩票方案和所述普通方 案构建了不确定条件下的决策场景,其中所述彩票方案包括选择彩票方案的参 与者在完成任务时可以获得任务的报酬以及一张{af,pf,as,ps,c
lottery
}的彩 票,c
lottery
表示彩票的成本,af为一等奖的奖金,其大小为ξb
t
,其中ξ为一 等奖奖金系数,b
t
为第t轮奖金池大小,pf为一等奖的获奖概率;as为二等奖 的奖金大小,ps为二等奖的获奖概率,
14.对于参与者来说彩票方案的前景值为:
[0015][0016]vt
表示第t轮的任务报酬,cj表示参与者j完成任务所需的成本,p={f,s} 表示奖金的等级,其中f表示一等奖,s表示二等奖,ω(
·
)表示加权后的概率;
[0017]
平台根据前景理论的研究预估得到参与者对于彩票的预期收益
[0018][0019]
其中,α和β表示收益和损失区间的价值函数的凹凸程度,取值范围为(0, 1);λ表示损失厌恶程度,λ>1;
[0020]
所述普通方案包括参与者完成任务后获得的报酬即为参与者的出价,
[0021]
普通方案的前景值为:
[0022][0023]
面对不确定的决策场景,通过以下公式来衡量参与者选择不同报酬方案的 概率:
[0024][0025]
其中pk表示选择方案k的概率,uk表示方案k的前景值,u表示报酬方案 的集合,u=
{lottery,normal},分别表示彩票方案和普通方案。
[0026]
根据本公开实施例的一种具体实现方式,所述步骤4中,选择普通方案的 参与者,其出价为:
[0027][0028]
其中ε表示外部参照点对于群智感知参与者的影响,η表示内部参照点对 于参与者的影响,表示第t-1轮参与者j的出价与其成本的比值,表 示感知任务τi的价值;
[0029]
选择彩票方案的参与者其出价为:
[0030][0031]
其中表示参与者j对于彩票的预期收益,
[0032]
在平台发布任务的同时,平台会给出平台设置的外部参照点,即平台给出 的参考出价,其公式如下:
[0033][0034]
其中φ
t
表示第t轮设置的参照价格,表示参与者j第t-1轮的获胜任 务集合,wp
t-1
表示第t-1轮的获胜参与者集合,
[0035]
在参考出价的影响下,参与者对于感知任务的出价可以表示为:
[0036][0037]
根据本公开实施例的一种具体实现方式,所述步骤5具体包括:平台根据 参与者提供的起点和目的地信息,计算出参与者的候选轨迹集合,平台计算出 参与者不同轨迹集合的优先级,并依次选择出优先级最高的参与者轨迹,直到 感知任务集合和参与者轨迹集合中没有匹配的任务时结束,其中优先级的定义 如下:
[0038][0039]
其中b
k,j
表示参与者j的第k条轨迹的感知任务平均出价,nj表示参与者j 连续选择彩票方案的次数,μj为平台通过评估参与者的损失程度给与参与者的 损失因子。
[0040]
第二方面,本公开实施例提供了一种群智感知任务发布及参与者选择系 统,包括:
[0041]
设计模块,用于依据前景理论将参与者完成任务获得的报酬设计为两种报 酬方案,其中,所述报酬方案包括普通方案和彩票方案;
[0042]
设置模块,用于平台根据本轮的任务以及上一轮获胜参与者的出价情况设 置外部参照点;
[0043]
发布模块,用于将任务最高报酬以及不同的报酬方案、平台设置的外部参 照点发布给参与者;
[0044]
获取模块,用于获取群智感知参与者选择任务的对应出价的集合;
[0045]
选择模块,用于对于每个感知任务,平台根据竞争该任务的参与者的出价 以及参与者的彩票方案选择次数、参与者的损失因子计算得出参与者在感知任 务中的优先级,依次选择优先级最高的参与者,得到获胜参与者集合;
[0046]
计算模块,用于当所有选择彩票报酬方案的参与者完成感知任务后,平台 公布中奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者的损 失厌恶值,并根据损失厌恶值来调整参与者的损失因子。
[0047]
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
[0048]
至少一个处理器;以及,
[0049]
与该至少一个处理器通信连接的存储器;其中,
[0050]
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个 处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一 实现方式中的群智感知任务发布及参与者选择方法。
[0051]
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非 暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行 前述第一方面或第一方面的任一实现方式中的群智感知任务发布及参与者选 择方法。
[0052]
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产 品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程 序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一 方面的任一实现方式中的群智感知任务发布及参与者选择方法。
[0053]
本公开实施例中的群智感知任务发布及参与者选择方案,包括:步骤1, 依据前景理论将参与者完成任务获得的报酬设计为两种报酬方案,其中,所述 报酬方案包括普通方案和彩票方案;步骤2,平台根据本轮的任务以及上一轮 获胜参与者的出价情况设置外部参照点;步骤3,将任务最高报酬以及不同的 报酬方案、平台设置的外部参照点发布给参与者;步骤4,获取群智感知参与 者选择任务的对应出价的集合;步骤5,对于每个感知任务,
平台根据竞争该 任务的参与者的出价以及其参与者的彩票方案选择次数、参与者的损失因子计 算的出参与者在感知任务中的优先级,依次选择优先级最高的参与者,得到获 胜参与者集合;步骤6,当所有选择彩票报酬方案的参与者完成感知任务后, 平台公布中奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者 的损失厌恶值,并根据损失厌恶值来调整参与者的损失因子。
[0054]
本公开实施例的有益效果为:通过本公开的方案,将不确定的高额报酬引 入到报酬方案的设计当中,设计了能够影响群智感知参与者决策行为的报酬方 案,并通过设置外部参照点来影响参与者的出价行为,提高了感知任务的覆盖 率,并且能够维持参与者长期参与感知任务。
附图说明
[0055]
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些 实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可 以根据这些附图获得其它的附图。
[0056]
图1为本公开实施例提供的一种群智感知任务发布及参与者选择方法的 流程示意图;
[0057]
图2为本公开实施例提供的一种属性计算机制的流程图;
[0058]
图3为本公开实施例提供的一种群智感知任务发布及参与者选择方法与 现有的具有代表性的方法,群智感知参与者参与次数比较图;
[0059]
图4为本公开实施例提供的一种群智感知任务发布及参与者选择方法与 现有的具有代表性的方法,群智感知任务覆盖率比较曲线示意图;
[0060]
图5为本公开实施例提供的一种群智感知任务发布及参与者选择系统的 结构示意图;
[0061]
图6为本公开实施例提供的电子设备示意图。
具体实施方式
[0062]
下面结合附图对本公开实施例进行详细描述。
[0063]
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本 说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实 施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另 外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不 同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是, 在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开 中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有 其他实施例,都属于本公开保护的范围。
[0064]
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方 面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所 描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术 人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以 各种方式组合这些方面中的两者或两者以上。
举例来说,可使用本文中所阐述 的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐 述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此 方法。
[0065]
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的 基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数 目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意 的改变,且其组件布局型态也可能更为复杂。
[0066]
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所 属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
[0067]
本公开实施例提供一种群智感知任务发布及参与者选择方法,所述方法可 以应用于群智感知场景的任务发布与分配流程中。
[0068]
参见图1,为本公开实施例提供的一种群智感知任务发布及参与者选择方 法的流程示意图。如图1所示,所述方法主要包括以下步骤:
[0069]
步骤1,依据前景理论将参与者完成任务获得的报酬设计为两种报酬方 案,其中,所述报酬方案包括普通方案和彩票方案;
[0070]
可选的,根据所述彩票方案和所述普通方案构建了不确定条件下的决策场 景,其中所述彩票方案包括选择彩票方案的参与者在完成任务时可以获得任务 的报酬以及一张{af,pf,as,ps,c
lottery
}的彩票,c
lottery
表示彩票的成本,af为 一等奖的奖金,其大小为ξb
t
,其中ξ为一等奖奖金系数,b
t
为第t轮奖金池大 小,pf为一等奖的获奖概率;as为二等奖的奖金大小,ps为二等奖的获奖概 率,
[0071]
对于参与者来说彩票方案的前景值为:
[0072][0073]vt
表示第t轮的任务报酬,cj表示参与者j完成任务所需的成本,p={f,s} 表示奖金的等级,其中f表示一等奖,s表示二等奖,ω(
·
)表示加权后的概率;
[0074]
平台根据前景理论的研究预估得到参与者对于彩票的预期收益平台根据前景理论的研究预估得到参与者对于彩票的预期收益
[0075]
其中,α和β表示收益和损失区间的价值函数的凹凸程度,取值范围为(0, 1);λ表示损失厌恶程度,λ>1;
[0076]
所述普通方案包括参与者完成任务后获得的报酬即为参与者的出价,
[0077]
普通方案的前景值为:
[0078][0079]
面对不确定的决策场景,通过以下公式来衡量参与者选择不同报酬方案的 概率:
[0080][0081]
其中pk表示选择方案k的概率,,uk表示方案k的前景值,u表示报酬方 案的集合,u={lottery,normal},分别表示彩票方案和普通方案。
[0082]
例如,具体参数如表1所示,共有m个参与者和n个感知任务,参与者完 成感知任务的成本在[1,10]之间取随机值,感知任务的最高报酬为10。
[0083]
表1
[0084][0085]
然后构建群智感知任务发布环境。如图1和图2所示,假设环境中共有m 参与者(m≥2),n个感知任务(n≥2),任务集合γ={τ1,τ2,...,τn},对应γ中每个 任务τi∈γ(i∈[1,n])的价值是vi。依据前景理论将参与者完成任务获得的报酬设 计为两种报酬方案,其中,所述报酬方案包括普通方案和彩票方案,彩票方案: 选择彩票方案的参与者在完成任务时可以获得任务的报酬以及一张 {af,pf,as,ps,c
lottery
}的彩票,c
lottery
表示彩票的成本,af为一等奖的奖金,其大小 为ξb
t
,其中ξ为一等奖奖金系数,b
t
为第t轮奖金池大小;pf为一等奖的获奖 概率;as为二等奖的奖金大小,ps为二等奖的获奖概率。
[0086]
普通方案:参与者完成任务后获得的报酬即为参与者的出价。
[0087]
在行为经济学的相关研究中,在面对不确定的决策场景,通过以下公式来 衡量参与者选择不同报酬方案的概率:
[0088][0089]
其中pk表示选择方案k的概率,u={lottery,normal},分别表示彩票方案和普 通方案,uk表示方案k的前景值。显而易见,pk是关于uk的单调递增函数,也 就是说,某个方案的前景值越大,参与者选择这个方案的概率也就越高。
[0090][0091]
[0092]vt
表示第t轮的任务报酬,cj表示参与者j完成任务所需的成本,p={f,s} 表示奖金的等级,其中f表示一等奖,s表示二等奖,ω(
·
)表示加权后的概率;
[0093]
其中,α和β表示受益和损失区间的价值函数的凹凸程度,α=β=0.88。λ 表示损失厌恶,当它大于1时,表示损失区间比收益区间更陡,在本实例中, λ=2.25。γ表示用户对概率的敏感程度,根据行为经济学的相关研究,γ通常 取0.65,故而在本实例中γ=0.65。
[0094]
而普通方案的前景值即为:
[0095][0096]
步骤2,平台根据本轮的任务以及上一轮获胜参与者的出价情况设置外部 参照点;
[0097]
具体实施时,可以根据行为经济学中参照效应的相关研究,在不确定条件 下人们进行决策时,决策结果会受到参照点的影响并且不断偏向参照点。
[0098]
因此,在平台发布任务的同时,平台会给出平台设置的外部参照点,即平 台给出的参考出价,其公式如下:
[0099][0100]
其中表示参与者j第t-1轮的获胜任务集合,表示第t-1轮的获胜 任务集合。
[0101]
步骤3,将任务最高报酬以及不同的报酬方案、平台设置的外部参照点发 布给参与者;
[0102]
具体实施时,在得到所述外部参照点后,可以将任务最高报酬以及不同的 报酬方案、平台设置的外部参照点发布给参与者,以便参与者进行自由选择出 价方案。
[0103]
步骤4,获取群智感知参与者选择任务的对应出价的集合;
[0104]
可选的,所述步骤4中,选择普通方案的参与者,其出价为:
[0105][0106]
其中ε表示外部参照点对于群智感知参与者的影响,η表示内部参照点对 于参与者的影响,表示第t-1轮参与者j的出价与其成本的比值,表 示感知任务τi的价值;
[0107]
选择彩票方案的参与者其出价为:
[0108][0109]
其中表示参与者j对于彩票的预期收益,
[0110]
在平台发布任务的同时,平台会给出平台设置的外部参照点,即平台给出 的参考出价,其公式如下:
[0111][0112]
其中φ
t
表示第t轮设置的参照价格,表示参与者j第t-1轮的获胜任 务集合,wp
t-1
表示第t-1轮的获胜参与者集合,
[0113]
在参考出价的影响下,参与者对于感知任务的出价可以表示为:
[0114][0115]
具体实施时,在参照点的影响下,参与者的出价可以表示为:
[0116][0117]
其中表示在没有设置参考价格是参与者的出价,由于平台设置了两种 不同报酬方案,参与者在选择不同的报酬方案时对于感知任务的预期收益也不 同,因此参与者在选择不同的报酬方案时也不同,其中选择普通方案的参 与者,其出价为:
[0118][0119]
其中ε表示外部参照点对于群智感知参与者的影响,η表示内部参照点对 于参与者的影响,表示第t-1轮参与者j的出价与其成本的比值。
[0120]
而选择彩票方案的参与者其出价为:
[0121][0122]
其中表示参与者j对于彩票的预期收益,σ表示彩票收益对于参与 者出价的影响。
[0123]
步骤5,对于每个感知任务,平台根据竞争该任务的参与者的出价以及其 参与者的彩票方案选择次数、参与者的损失因子计算的出参与者在感知任务中 的优先级,依次选择优先级最高的参与者,得到获胜参与者集合;
[0124]
可选的,所述步骤5具体包括:平台根据参与者提供的起点和目的地信息, 计算出参与者的候选轨迹集合,平台计算出参与者不同轨迹集合的优先级,并 依次选择出优先级最高的参与者轨迹,直到感知任务集合和参与者轨迹集合中 没有匹配的任务时结束,其中优先级的定义如下:
[0125][0126]
其中b
k,j
表示参与者j的第k条轨迹的感知任务平均出价,nj表示参与者j 连续选择彩票方案的次数,μj为平台通过评估参与者的损失程度给与参与者的 损失因子。
[0127]
具体实施时,平台可以通过计算出参与者的不同候选轨迹的平均出价,得 到参与者的优先级,并依次选择出优先级最高的参与者加入获胜者集合,直到 感知任务集合和参与者轨迹集合中没有匹配的任务时结束。其中优先级的定义 如下:
[0128][0129]
其中b
k,j
表示参与者j的第k条轨迹的感知任务平均出价,nj表示参与者j 连续选择彩票方案的次数,μj则是平台通过评估参与者的损失程度给与参与者 的损失因子,w
t
为第t轮的所有参与者集合,为参与者的损失因子对与参与 者的优先级的影响程度。
[0130]
步骤6,当所有选择彩票报酬方案的参与者完成感知任务后,平台公布中 奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者的损失厌恶 值,并根据损失厌恶值来调整参与者的损失因子。
[0131]
具体实施时,根据平台公布的中奖信息,平台可以计算得出各个参与者本 轮的平均彩票收益iolj,根据行为学经济学的相关研究,得到各个参与者的损 失厌恶值,其中,参与者的损失厌恶值包含两个部分:一部分是自身收益未达 到预期产生的损失;另一部分是其他参与者收益参照下产生的损失厌恶值;
[0132][0133]
其中表示参与者wj在第t轮时竞争获胜的感知任务集合,表示参与 者对于报酬方案的选择,γf表示获得一等奖奖金的任务集合,γs表示获得 二等奖奖金的任务集合。
[0134][0135]
其中vlasj表示平台通过参与者的彩票收益与平台设置的彩票收益参照点 的差值来计算参与者自身彩票收益低于参照点的损失厌恶值,
[0136][0137]
vlaoj表示其他参与者的中奖情况参照下参与者的损失厌恶值,其中wp
t
表 示本轮获胜的参与者集合εf表示参与者是否获得了一等奖,当参与者获得一等 奖时εf=1,否则εf=0;而εs表示参与者是否获得了二等奖,类似于εf;
[0138]
所以参与者在中奖结果公布后的损失厌恶值可以表示为
[0139][0140]
平台通过损失厌恶值与参与者收益来衡量参与者的损失厌恶程度,故而将 损失因子μj设置为
[0141][0142]
通过更新不同参与者的损失因子,可以影响参与者在下一轮竞争感知任务 的优先级,在本轮任务中彩票收益小于预期收益的参与者损失厌恶值更高,其 损失因子更大,在下一轮感知任务的竞争中优先级会有所提高,更利于参与者 获取感知任务。
[0143]
在本实施例中,首先评估了当群智感知参与者数量一定时,任务数量对群 智感知任务覆盖率的影响。为了更进一步评估本发明的性能,本发明也与其它 目前有代表性的方法(hector)进行比较,如图3和图4所示。验证结果表明, 本发明的性能均优于其它目前最先进的方法。图3表示的是机制运行100轮的 情况下,本发明与hector机制作用下的参与者参与轮次的对比。可以看出在 本发明机制中存在部分参与者由于自身感知任务的成本过高而无法在感知任 务的竞争中获胜,但是参与了感知任务的参与者在100轮感知任务过后,其参 与次数大都集中分布在[50,100]的区间内,而hector机制比较均匀的分布在[0,100]之间,也就是说在本发明机制的作用下,能够维持群智感知参与者长 期参与感知任务。制中并且相对于hector机制来说能够维持更多的高活跃度 的参与者。
[0144]
图4是本发明与hector机制关于任务覆盖率的对比,可以看到虽然 hector机制和本发明的任务覆盖率都在0.92以上,但是本发明提出的机制在 长期作用下的任务覆盖率要高于hector机制,是因为本文的机制通过基于损 失厌恶的维持机制,维持了平台中有能力竞争感知任务的参与者继续参与到感 知任务中。
[0145]
表2
[0146][0147]
本实施例提供的群智感知任务发布及参与者选择方法,通过将不确定的高 额报酬引入到报酬方案的设计当中,设计了能够影响群智感知参与者决策行为 的报酬方案,并通过设置外部参照点来影响参与者的出价行为;此外,根据前 景理论的相关研究,引入了损失因子,根据参与者的预期收益和其实际收益, 计算得出参与者的损失厌恶值,并根据损失厌恶值来调整参与者的损失因子, 提高了实际收益小于预期收益的参与者在下一轮感知任务竞争中的优先级,能 够维持参与者继续参与感知任务。同时,相较于对比的机制,本方案不需要提 高任务报酬就能激励更多参与者参与感知任务,提高了感知任务的覆盖率,并 且能够维持参与者长期参与感知任务。
[0148]
与上面的方法实施例相对应,参见图5,本公开实施例还提供了一种群智 感知任务发布及参与者选择系统50,包括:
[0149]
设计模块501,用于依据前景理论将参与者完成任务获得的报酬设计为两 种报酬方案,其中,所述报酬方案包括普通方案和彩票方案;
[0150]
设置模块502,用于平台根据本轮的任务以及上一轮获胜参与者的出价情 况设置外部参照点;
[0151]
发布模块503,用于将任务最高报酬以及不同的报酬方案、平台设置的外 部参照点发布给参与者;
[0152]
获取模块504,用于获取群智感知参与者选择任务的对应出价的集合;
[0153]
选择模块505,用于对于每个感知任务,平台根据竞争该任务的参与者的 出价以及参与者的彩票方案选择次数、参与者的损失因子计算得出参与者在感 知任务中的优先级,依次选择优先级最高的参与者,得到获胜参与者集合;
[0154]
计算模块506,用于当所有选择彩票报酬方案的参与者完成感知任务后, 平台公布中奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者 的损失厌恶值,并根据损失厌恶值来调整参与者的损失因子。
[0155]
图5所示系统可以对应的执行上述方法实施例中的内容,本实施例未详细 描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
[0156]
参见图6,本公开实施例还提供了一种电子设备60,该电子设备包括:至 少一个处理器以及与该至少一个处理器通信连接的存储器。其中,该存储器存 储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以 使该至少一个处理器能够执行前述方法实施例中的群智感知任务发布及参与 者选择方法。
[0157]
本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机 可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实 施例中的群智感知任务发布及参与者选择方法。
[0158]
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储 在非
暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当 该程序指令被计算机执行时,使该计算机执行前述方法实施例中的群智感知任 务发布及参与者选择方法。
[0159]
下面参考图6,其示出了适于用来实现本公开实施例的电子设备60的结 构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记 本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便 携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸 如数字tv、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示 例,不应对本公开实施例的功能和使用范围带来任何限制。
[0160]
如图6所示,电子设备60可以包括处理装置(例如中央处理器、图形处 理器等)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储 装置608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作 和处理。在ram 603中,还存储有电子设备60操作所需的各种程序和数据。 处理装置601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o) 接口605也连接至总线604。
[0161]
通常,以下装置可以连接至i/o接口605:包括例如触摸屏、触摸板、键 盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置606;包括 例如液晶显示器(lcd)、扬声器、振动器等的输出装置607;包括例如磁带、 硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备 60与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装 置的电子设备60,但是应理解的是,并不要求实施或具备所有示出的装置。 可以替代地实施或具备更多或更少的装置。
[0162]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为 计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承 载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示 的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609 从网络上被下载和安装,或者从存储装置608被安装,或者从rom 602被安装。 在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上 述功能。
[0163]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质 或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例 如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装 置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包 括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机 访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom 或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存 储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以 是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器 件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基 带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代 码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号 或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质 以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输 用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可 读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、 光缆、rf(射频)等等,或者上述的任意合适的组合。
[0164]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存 在,而未装配入该电子设备中。
[0165]
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序 被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
[0166]
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多 个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关 步骤。
[0167]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作 的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言 或类似的程序设计语言。程序代码可以完全地在参与者计算机上执行、部分地 在参与者计算机上执行、作为一个独立的软件包执行、部分在参与者计算机上 部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远 程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan) 或广域网(wan)—连接到参与者计算机,或者,可以连接到外部计算机(例如 利用因特网服务提供商来通过因特网连接)。
[0168]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计 算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图 中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、 或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应 当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图 中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执 行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的 是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合, 可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专 用硬件与计算机指令的组合来实现。
[0169]
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以 通过硬件的方式来实现。
[0170]
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
[0171]
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到 的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围 应以权利要求的保护范围为准。
技术特征:1.一种群智感知任务发布及参与者选择方法,其特征在于,包括:步骤1,依据前景理论将参与者完成任务获得的报酬设计为两种报酬方案,其中,所述报酬方案包括普通方案和彩票方案;步骤2,平台根据本轮的任务以及上一轮获胜参与者的出价情况设置外部参照点;步骤3,将任务最高报酬以及不同的报酬方案、平台设置的外部参照点发布给参与者;步骤4,获取群智感知参与者选择任务的对应出价的集合;步骤5,对于每个感知任务,平台根据竞争该任务的参与者的出价以及参与者的彩票方案选择次数、参与者的损失因子计算得出参与者在感知任务中的优先级,依次选择优先级最高的参与者,得到获胜参与者集合;步骤6,当所有选择彩票报酬方案的参与者完成感知任务后,平台公布中奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者的损失厌恶值,并根据损失厌恶值来调整参与者的损失因子。2.根据权利要求1所述的方法,其特征在于,所述步骤1还包括:根据所述彩票方案和所述普通方案构建了不确定条件下的决策场景,其中所述彩票方案包括选择彩票方案的参与者在完成任务时可以获得任务的报酬以及一张{a
f
,p
f
,a
s
,p
s
,c
lottery
}的彩票,c
lottery
表示彩票的成本,a
f
为一等奖的奖金,其大小为ξb
t
,其中ξ为一等奖奖金系数,b
t
为第t轮奖金池大小,p
f
为一等奖的获奖概率;a
s
为二等奖的奖金大小,p
s
为二等奖的获奖概率,对于参与者来说彩票方案的前景值为:v
t
表示第t轮的任务报酬,c
j
表示参与者j完成任务所需的成本,p={f,s}表示奖金的等级,其中f表示一等奖,s表示二等奖,ω(
·
)表示加权后的概率;平台根据前景理论的研究预估得到参与者对于彩票的预期收益平台根据前景理论的研究预估得到参与者对于彩票的预期收益其中,α和β表示收益和损失区间的价值函数的凹凸程度,取值范围为(0,1);λ表示损失厌恶程度,λ>1;所述普通方案包括参与者完成任务后获得的报酬即为参与者的出价,普通方案的前景值为:面对不确定的决策场景,通过以下公式来衡量参与者选择不同报酬方案的概率:
其中p
k
表示选择方案k的概率,u
k
表示方案k的前景值,u表示报酬方案的集合,u={lottery,normal},分别表示彩票方案和普通方案。3.根据权利要求1所述的方法,其特征在于,所述步骤4中,选择普通方案的参与者,其出价为:其中ε表示外部参照点对于群智感知参与者的影响,η表示内部参照点对于参与者的影响,表示第t-1轮参与者j的出价与其成本的比值,表示感知任务τ
i
的价值;选择彩票方案的参与者其出价为:其中表示参与者j对于彩票的预期收益,在平台发布任务的同时,平台会给出平台设置的外部参照点,即平台给出的参考出价,其公式如下:其中φ
t
表示第t轮设置的参照价格,表示参与者j第t-1轮的获胜任务集合,wp
t-1
表示第t-1轮的获胜参与者集合,在参照价格的影响下,参与者对于感知任务的出价可以表示为:4.根据权利要求1所述的方法,其特征在于,所述步骤5具体包括:平台根据参与者提供的起点和目的地信息,计算出参与者的候选轨迹集合,平台计算出参与者不同轨迹集合的优先级,并依次选择出优先级最高的参与者轨迹,直到感知任务集合和参与者轨迹集合中没有匹配的任务时结束,其中优先级的定义如下:
其中b
k,j
表示参与者j的第k条轨迹的感知任务平均出价,n
j
表示参与者j连续选择彩票方案的次数,μ
j
为平台通过评估参与者的损失程度给与参与者的损失因子。5.一种群智感知任务发布及参与者选择系统,其特征在于,包括:设计模块,用于依据前景理论将参与者完成任务获得的报酬设计为两种报酬方案,其中,所述报酬方案包括普通方案和彩票方案;设置模块,用于平台根据本轮的任务以及上一轮获胜参与者的出价情况设置外部参照点;发布模块,用于将任务最高报酬以及不同的报酬方案、平台设置的外部参照点发布给参与者;获取模块,用于获取群智感知参与者选择任务的对应出价的集合;选择模块,用于对于每个感知任务,平台根据竞争该任务的参与者的出价以及参与者的彩票方案选择次数、参与者的损失因子计算得出参与者在感知任务中的优先级,依次选择优先级最高的参与者,得到获胜参与者集合;计算模块,用于当所有选择彩票报酬方案的参与者完成感知任务后,平台公布中奖结果并计算参与者的报酬,并根据参与者的中奖结果计算参与者的损失厌恶值,并根据损失厌恶值来调整参与者的损失因子。6.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述权利要求1-4中任一项所述的群智感知任务发布及参与者选择方法。7.一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述权利要求1-4中任一项所述的群智感知任务发布及参与者选择方法。
技术总结本公开实施例中提供了一种群智感知任务发布及参与者选择方法、系统、设备及介质,属于计算技术领域,具体包括:依据前景理论将参与者完成任务获得的报酬设计为两种报酬方案;平台根据本轮的任务以及上一轮获胜参与者的出价情况设置外部参照点;将任务最高报酬以及不同的报酬方案、平台设置的外部参照点发布给参与者;获取群智感知参与者选择任务的对应出价的集合;平台根据各个参与者的出价以及其选择的任务集合,依次选择优先级最高的参与者,得到获胜参与者集合;当所有选择彩票报酬方案的参与者完成感知任务后,根据损失厌恶值来调整参与者的损失因子。通过本公开的方案,提高了感知任务完成的覆盖率,并且能够维持参与者长期参与感知任务。期参与感知任务。期参与感知任务。
技术研发人员:李登 李良宇 刘佳琦
受保护的技术使用者:中南大学
技术研发日:2022.04.06
技术公布日:2022/7/5