极速滚球-beplay滚球玩法刺激-beplay体育官网网页版等您来挑战！

mos

Modeling and Simulation

2324-8696 2324-870X

beplay体育官网网页版等您来挑战！

10.12677/mos.2025.143258

mos-110435

Articles

信息通讯, 工程技术

基于少样本学习和图神经网络的移动群智感知招募方法
A Recruitment Method for Mobile Crowd Sensing Based on Few-Shot Learning and Graph Neural Networks

冯

瑶

上海理工大学出版学院，上海

06 03 2025

14 03 716 729 26 2 ：2025 19 2 ：2025 19 3 ：2025

2024

This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

在移动群智感知招募中，当工人未执行任务或执行任务较少时，工人的偏好特征和信誉度特征信息存在稀疏性问题，考虑工人偏好和信誉度特征的招募方法很难准确估计工人的任务完成质量。同时现有研究大多忽略了工人待完成任务对工人招募的客观影响。为此本文提出了一种基于少样本学习和图神经网络的移动群智感知招募方法。首先，建立基于图神经网络的小样本学习模型(FSL-GNN)的工人与任务主观相关性估计模型，估计出工人的工人偏好对任务特征的相关性和工人信誉度对任务特征的相关性。然后，设计基于异质图卷积网络的工人与任务的客观相关性模型，计算工人待完成任务与待招募任务特征之间的客观相关性。最后使用注意力机制结合以上三种相关性估计出工人对任务的完成质量。基于大量真实数据集的实验仿真结果表明，提出的招募方法具有较好的工人任务完成质量估计准确度优势，与其他招募模型相比显著提高了任务的完成质量。
In existing mobile crowd sensing recruitment methods, data sparsity issues exist when there are workers who have few or no experience of executing tasks, which limits the analysis of preference and credibility features while estimating the task completion quality of workers. In addition, these studies ignore the objective impact of incomplete tasks in the hiring process. At the same time, most of the existing studies ignore the objective impact of the tasks to be completed by workers on worker recruitment. To overcome those problems, this paper proposes a novel recruitment method for mobile crowd sensing based on few-shot learning and graph neural networks (FSL-GNN). First, a worker-task subjective correlation estimation model is built on a few-shot learning framework with a graph neural network, which is employed to estimate two types of subjective correlations: worker preferences to task features and worker credibility related to task features. Then, this study designs an objective correlation model between workers and tasks based on the convolutional network of heterogeneous graphs, and calculates the objective correlation between the characteristics of workers’ tasks to be completed and tasks to be recruited. Finally, the attention mechanism combined with the above three correlations is used to estimate the workers’ completion quality of the task. Experimental simulations on extensive real-world datasets demonstrate that the proposed method can provide accurate task completion quality estimation and outperforms other recruitment models in terms of task quality enhancement.

移动群智感知，工人招募，任务完成质量，图神经网络，异质图
Mobile Crowd Sensing
Worker Recruitment Task Completion Quality Graph Neural Networks Heterogeneous Graphs

1. 引言

近年来，移动群智感知(mobile crowd sensing, MCS) [1] [2] 作为一种具有巨大潜力的新兴物联网(IoT)感知模式，受到了广泛的关注。相比传统传感器网络，MCS具有时空覆盖范围广、成本低、可扩展性强等优势。这一技术已应用于环境监测 [3] 、公共安全 [4] 、交通管理 [5] 、医疗保健 [6] 等多个领域，显著提升了人类生活质量并促进了社会发展。

工人招募是MCS的核心问题 [7] ，平台需要为目标任务选择合适的工人，以确保任务的完成质量 [8] - [10] 。研究表明，工人的偏好和信誉是影响任务完成质量的两个关键因素。在基于工人偏好招募的方法中，主要关注两种偏好：任务类型偏好 [11] - [13] 和时空信息偏好 [14] - [16] 。任务类型偏好反映了工人对于执行特定类型任务的意愿，与工人在相关任务类别中的专业能力及经验有关。时空信息偏好体现了工人在特定时段和区域完成任务的倾向 [17] ，反映了其对任务时间安排和地理分布的适应性。在基于工人信誉度招募 [18] [19] 的方法中，信誉度用来量化工人的恶意行为的可能性，信誉度高的工人往往能提供更可靠的数据 [20] 。

在MCS中，当参与者任务历史记录不足或未执行过任务时，工人偏好和信誉度特征信息会出现稀疏性问题，这使得考虑工人偏好和信誉度特征的招募方法很难准确估计工人的任务完成质量。此外，现有研究主要聚焦于工人特征对任务完成质量的主观影响，忽视了待执行任务在工人招募中的客观影响。例如，当工人的待执行任务与目标任务在区域、时间或任务类型上高度匹配时，工人通常能够以更快的速度和更高的熟练度完成目标任务，从而提升任务的完成质量。

为了解决MCS中工人偏好和信誉度特征信息的稀疏性问题，本研究引入了基于图神经网络的小样本学习模型(Few-Shot Learning with Graph Neural Networks, FSL-GNN)对工人与任务相关的偏好和信誉度特征进行估计。随后结合目标任务特征，计算工人偏好对任务特征的相关性和工人信誉度对任务特征的相关性两种工人与任务的主观相关性。此外，本研究采用异质图神经网络对任务特征向量进行表征学习，并通过计算工人待执行任务特征与目标任务特征的相似性，得出工人未完成任务与待招募任务之间的客观相关性。最后，利用注意力机制融合主客观相关性，综合评估工人对目标任务的完成质量，包含任务响应时间、任务完成率和任务可靠性等指标。本文的主要贡献如下：

(1) 提出基于FSL-GNN的工人与任务主观相关性估计模型，将具有偏好和信誉度特征的工人和没有偏好和信誉度特征工人作为节点构建社交网络图，通过FSL-GNN泛化能力，动态更新社交网络图中的节点特征及边的权重，精准提取工人偏好和信誉度特征，解决了偏好和信誉度特征信息稀疏性的问题，并与任务特征矩阵结合，计算工人偏好对任务特征的相关性和工人信誉度对任务特征的相关性两种工人与任务的主观相关性。

(2) 提出基于异质图卷积网络的工人与任务的客观相关性估计模型，利用异质图嵌入和GCN对任务节点进行特征向量表征学习，计算工人待执行任务特征与待招募任务特征的相似性，得到工人与任务特征之间的客观相关性，从而优化工人招募质量。

2. 相关工作 2.1. 考虑工人偏好特征的MSC招募

工人的偏好信息是MSC招募中的关键参数之一，主要包括任务类型偏好和时空偏好。以任务类型偏好为例，Wu等人 [11] 设计了一个个性化任务推荐系统框架，该系统通过利用用户的隐式反馈描述任务偏好，并基于工人偏好与任务可靠性进行匹配，从而选择合适的工人执行任务。Li等人 [12] 则从用户历史任务记录中提取潜在偏好，并据此生成个性化推荐列表。Xiong等人 [13] 通过任务类型、时间等多个维度构建任务向量和用户向量，并计算余弦相似度来匹配任务和用户，选择合适的用户作为任务候选者。以时空偏好为例，Ngo等人 [14] 提出了一种基于流动性估计模型(CAMP)的上下文感知工人招聘框架，结合RNN模型预测工人流动性和加权效用工人选择算法，考虑工人不同位置和感知周期之间任务分配的变化，从而使工人的选择更加准确和高效，提高任务的完成率。Wang等人 [15] 提出了一种结合时空概率和感知任务属性的用户选择方法，通过计算任务完成概率来优化工人招募过程。Zhang等人 [16] 根据工人的轨迹预测来选择能够收集高价值数据的参与者，提出了一种STGCN-GRU用户轨迹预测算法，该算法利用STGCN算法提取与时空信息相关的特征，并将特征序列输入到GRU中进行轨迹预测，提高了用户轨迹预测的精度。Ma等人 [17] 提出了FUP的偏好学习模型，同时考虑工人对任务类型的偏好和时空偏好，通过创建图形会话发现用户的动态类别偏好，从而将任务分配给最匹配的工人。

2.2. 考虑工人信誉度的MCS招募

工人信誉度是指工人在感知平台上的声誉和表现，通常是通过对工人过去的工作表现、准确性、及时性等指标来建立的。王等人 [18] 提出了一种面向任务代价差异的移动群智感知激励模型(MCIP)，该模型在分析任务间代价差异的基础上，结合任务代价分类、信誉度评估和参与者优选，实现了预算的合理制定和成本的有效分配。通过动态信誉度更新和合理的任务分配，提升了用户参与度和数据质量。Gao等人 [19] 提出了一种基于动态信任的MCS招募计划(DTRF)来搜索高质量的工人，实时直接信任和轻量级反馈聚合信任相结合，以选择适合的参与者。Wang等人 [20] 针对物联网环境中工人可能无意提供损坏或伪造数据，或出于恶意故意传播虚假信息的问题，提出了一种名为“体验信誉”的新型信任模型，用于评估MCS平台上任意两名移动设备工人之间的信任关系。

在上述现有MCS招募方法中，当工人的任务历史记录不足或未参与过任务时，会导致偏好和信誉度特征的稀疏性问题，这使得上述方法难以准确评估工人的任务完成质量。此外，上述研究多集中于工人特征对任务完成质量的主观影响，而忽略了工人的待执行任务对工人招募的客观影响。

3. 系统模型

本文的MCS系统由任务发布者、平台和工人组成。任务发布者通过平台发布任务请求，平台负责在工人池中招募合适的工人，并分配任务给他们执行，任务完成后，工人提交感知数据至平台。

假设任务集合为 $S = {s_{1}, s_{2}, \dots, s_{i}, \dots}$ ， $s_{i}$ 为第 $i$ 个任务。任务集合可进一步划分为待招募工人的目标任务集合 $S^{goal} = {s_{1}^{goal}, s_{2}^{goal}, \dots, s_{j}^{goal}, \dots, s_{n}^{goal}}$ ，待执行任务集合 $S^{wait}$ 和已执行任务集合。系统中每个任务的特征向量都由三类特征的特征因子向量组成：任务的类型特征因子 $A = {a_{1}, a_{2}, \dots, a_{α}}$ ，任务执行时段特征因子 $B = {b_{1}, b_{2}, \dots, b_{β}}$ 和任务执行区域特征因子 $C = {c_{1}, c_{2}, \dots, c_{γ}}$ 。例如，任务 $s_{i}$ 的特征向量由 $F_{i} = {f_{i}^{a_{1}}, f_{i}^{a_{2}}, \dots, f_{i}^{a_{α}}, f_{i}^{b_{1}}, f_{i}^{b_{2}}, \dots, f_{i}^{b_{β}}, f_{i}^{c_{1}}, f_{i}^{c_{2}}, \dots, f_{i}^{c_{γ}}}$ 表示，如果任务 $s_{i}$ 具有特征因子 $a_{α}$ 则 $f_{i}^{a_{α}} = 1$ ，否则等于0，其他特征因子同理。目标任务特征矩阵表示为 $F^{goal} = {[F_{1}^{goal}, F_{2}^{goal}, \dots, F_{j}^{goal}, \dots, F_{n}^{goal}]}^{T} \in R^{n \times (α + β + γ)}$ ， $F_{j}^{goal}$ 代表目标任务 $s_{j}^{goal}$ 的特征向量。

假设系统中共有 $m$ 名工人，用集合 $W = {w_{1}, w_{2}, \dots, w_{l}, \dots, w_{m}}$ 来表示。工人 $w_{l}$ 的待执行任务集合由 $S_{l}^{wait} = {S_{l 1}^{wait}, S_{l 2}^{wait}, \dots, S_{l δ}^{wait}}$ 表示， $δ$ 代表待执行任务数量。工人 $w_{l}$ 的社交特征向量 ${Soc}_{l} = {{soc}_{l, 1}, {soc}_{l, 2}, \dots, {soc}_{l, u - 1}, {soc}_{l, u}, \dots, {soc}_{l, m}}$ ，其中 ${soc}_{l, u}$ 表示工人 $l$ 和工人 $u$ 之间的社交相关性，计算公式如下：

$\begin{matrix} {soc}_{l, u} = \end{matrix} \frac{w_{l} 和 w_{u} 的共同好友数量}{w_{l} 总的好友数量}$ (1)

此外，每个工人 $w_{l}$ 具有与任务特征相关的偏好向量 $P_{l} = {p_{a_{1}}^{l}, p_{a_{2}}^{l}, \dots, p_{a_{α}}^{l}, p_{b_{1}}^{l}, p_{b_{2}}^{l}, \dots, p_{b_{β}}^{l}, p_{c_{1}}^{l}, p_{c_{2}}^{l}, \dots, p_{c_{γ}}^{l}}$ 和与任务特征相关的信誉向量 $Q_{l} = {q_{a_{1}}^{l}, q_{a_{2}}^{l}, \dots, q_{a_{α}}^{l}, q_{b_{1}}^{l}, q_{b_{2}}^{l}, \dots, q_{b_{β}}^{l}, q_{c_{1}}^{l}, q_{c_{2}}^{l}, \dots, q_{c_{γ}}^{l}}$ ，且这两种特征数量与任务特征一致，为对应关系，例如， $p_{a_{α}}^{l}$ 表示工人 $w_{l}$ 对 $a_{α}$ 特征因子的偏好值，偏好向量和信誉向量中的元素值都是由0~1之间的值来表示，如果工人 $w_{l}$ 没有执行过任务，其偏好向量和信誉向量中的元素值为全0。所有工人的偏好向量构成偏好特征矩阵，表示为 $P = {[P_{1}, P_{2}, \dots, P_{l}, \dots, P_{m}]}^{T}$ ，所有工人的信誉向量构成偏好特征矩阵，表示为 $Q = {[Q_{1}, Q_{2}, \dots, Q_{l}, \dots, Q_{m}]}^{T}$ 。

平台负责为目标任务招募工人，每个任务只能由一个工人完成，每个工人可执行多个任务。首先，本文将利用FSL-GNN模型估计工人的偏好矩阵 $P^{'}$ 和信誉度矩阵 $Q^{'}$ ，将这两个矩阵与目标任务特征矩阵 $F^{goal}$ 分别相乘，计算出工人与目标任务的偏好相关性矩阵 $P^{rel}$ 和信誉度相关性矩阵 $Q^{rel}$ ，计算过程如下：

$\begin{matrix} P^{rel} = P^{'} \times {(F^{goal})}^{T} = [\begin{matrix} p_{1, 1}^{rel}, p_{1, 2}^{rel}, \dots, p_{1, j}^{rel}, \dots, p_{1, n}^{rel} \\ p_{2, 1}^{rel}, p_{2, 2}^{rel}, \dots, p_{2, j}^{rel}, \dots, p_{2, n}^{rel} \\ ⋮ \\ p_{l, 1}^{rel}, p_{l, 2}^{rel}, \dots, p_{l, j}^{rel}, \dots, p_{l, n}^{rel} \\ ⋮ \\ p_{m, 1}^{rel}, p_{m, 2}^{rel}, \dots, p_{m, j}^{rel}, \dots, p_{m, n}^{rel} \end{matrix}] \end{matrix}$ (2)

$\begin{matrix} Q^{rel} = Q^{'} \times {(F^{goal})}^{T} = [\begin{matrix} q_{1, 1}^{rel}, q_{1, 2}^{rel}, \dots, q_{1, j}^{rel}, \dots, q_{1, n}^{rel} \\ q_{2, 1}^{rel}, q_{2, 2}^{rel}, \dots, q_{2, j}^{rel}, \dots, q_{2, n}^{rel} \\ ⋮ \\ q_{l, 1}^{rel}, q_{l, 2}^{rel}, \dots, q_{l, j}^{rel}, \dots, q_{l, n}^{rel} \\ ⋮ \\ q_{m, 1}^{rel}, q_{m, 2}^{rel}, \dots, q_{m, j}^{rel}, \dots, q_{m, n}^{rel} \end{matrix}] \end{matrix}$ (3)

$p_{l, j}^{rel}$ 表示工人 $w_{l}$ 与目标任务 $s_{j}$ 的偏好相关性值， $q_{l, j}^{rel}$ 表示工人 $w_{l}$ 与目标任务 $s_{j}$ 的信誉度相关性值。

其次，本文将使用异质图卷积网络对任务特征进行表征学习，得出目标任务特征 $F^{goal^{'}} \in R^{m \times (α + β + γ)}$ 和待完成任务特征 $F^{wait^{'}} \in R^{δ \times (α + β + γ)}$ ，通过计算工人的待完成任务特征和待招募任务特征的相似性累加，获得工人与任务的客观相关性值 $z_{l, j}^{rel}$ ，最终获得客观相似性矩阵，表示为：

$\begin{matrix} Z^{rel} = [\begin{matrix} z_{1, 1}^{rel}, z_{1, 2}^{rel}, \dots, z_{1, j}^{rel}, \dots, z_{1, n}^{rel} \\ z_{2, 1}^{rel}, z_{2, 2}^{rel}, \dots, z_{2, j}^{rel}, \dots, z_{2, n}^{rel} \\ ⋮ \\ z_{l, 1}^{rel}, z_{l, 2}^{rel}, \dots, z_{l, j}^{rel}, \dots, z_{l, n}^{rel} \\ ⋮ \\ z_{m, 1}^{rel}, z_{m, 2}^{rel}, \dots, z_{m, j}^{rel}, \dots, z_{m, n}^{rel} \end{matrix}] \end{matrix}$ (4)

最后，本文使用注意力机制结合上述三种相关性矩阵，估计出影响工人任务完成质量的三个指标，任务响应时间，任务完成率，数据可靠性，最终估算出工人对目标任务的完成质量，以作为工人招募的依据，为每个任务招募完成质量估算值最高的工人执行任务。

4. 基于异质图和FSL-GNN的招募

为了招募到能高质量完成任务的工人，本文提出基于少样本学习和图神经网络的移动群智感知招募方法，包括FSL-GNN的工人与任务主观相关性估计，基于异质图卷积网络的工人与任务的客观相关性估计，任务完成质量估计模块三个部分。

<xref></xref>4.1. FSL-GNN的工人与任务主观相关性估计 Figure 1 Figure 1. Flowchart of subjective relevance estimation based on FSL-GNN--图1. 基于FSL-GNN的主观相关性估计流程图--

由于MCS系统启动之初执行过任务的工人很少，这会导致工人的偏好特征和信誉度特征信息稀疏。为此，如图1 所示，本文将执行过任务和未执行过任务工人的特征(社交特征、偏好特征以及信誉度特征)一并嵌入到社交网络关系图中，通过FSL-GNN模型对工人的节点特征的泛化，估计所有工人与任务特征相关的偏好矩阵 $P^{'}$ 和工人与任务特征相关的信誉度矩阵 $Q^{'}$ 。将两个矩阵分别与目标任务特征 $F^{goal}$ 相结合，最终得到工人与任务的偏好相关性矩阵 $P^{rel}$ 以及工人与任务的信誉度相关性矩阵 $Q^{rel}$ 两个主观相关性矩阵。

首先，本文构建工人的社交关系图 $G = (V, E)$ ， $V$ 表示工人节点， $E$ 表示工人之间的社交关系，其中 $e_{l u} \in E$ ，表示工人 $w_{l}$ 和 $w_{u}$ 之间是否有社交关系，如果有 $e_{l u} = 1$ 否则 $e_{l u} = 0$ 。每个工人节点的初始信息如公式所示：

$\begin{matrix} y_{l}^{(0)} = concat (S_{l}, δ_{l}) \end{matrix}$ (5)

其中 $δ_{l} \in {P_{l}, Q_{l}}$ ， $concat (\cdot)$ 表示将工人 $w_{l}$ 社交特征向量分别和工人与任务特征相关的偏好向量，工人 $w_{l}$ 与任务特征相关的信誉度向量相结合。

随后，本文使用FSL-GNN模型进行小样本学习，模型会根据节点特征的相似性动态更新社交网络图中相邻节点边的权重，提高图神经网络在小样本中的泛化能力，其过程如公式(6)所示：

$\begin{matrix} η_{l, u}^{(r)} = {MLP}_{θ} (abs (y_{l}^{(r)} - y_{u}^{(r)})) \end{matrix}$ (6)

其中 $y_{l}^{(r)}$ 和 $y_{u}^{(r)}$ 分别表示第 $r$ 层相邻工人节点 $l$ 与 $u$ 的节点特征。输入两个节点特征向量的绝对差值到 ${MLP}_{θ}$ 中，用于计算节点之间对应边的权重 $η_{l, u}^{(r)}$ ，其中 $θ$ 为可学习参数，将权重与原特征矩阵相结合，若两名工人之间没有社交关系，那么两者之间边的权重始终为0，通过计算得到邻接矩阵 $η^{(r)} \in R^{n \times n}$ 。

在社交网络中工人节点彼此之间连接分布不均匀，导致部分节点拥有大量邻居节点，部分节点邻居节点非常稀少，进而使邻接矩阵内部元素差值非常巨大，同时节点需要保留自己的特征。为此本文做了以下处理：

$\begin{matrix} {\hat{η}}^{(r)} = D^{- \frac{1}{2}} η^{{(r)}^{'}} D^{- \frac{1}{2}} \end{matrix}$ (7)

$\begin{matrix} η^{{(r)}^{'}} = η^{(r)} + I \end{matrix}$ (8)

其中 $D \in R^{n \times n}$ 表示节点的度矩阵，这种处理让信息传播更加稳定，且避免了高连接节点的特征被过度放大。 $I$ 表示单位矩阵，其目的是为了节点在卷积时考虑自身因素。

通过GCN更新节点的特征，捕捉更高阶的社交关系，其更新过程如公式所示：

$\begin{matrix} y^{(r + 1)} = GCN (y^{(r)}) = ReLu ({\hat{η}}^{(r)} y^{(r)} ξ^{(r)}) \end{matrix}$ (9)

其中，输入特征为 $y^{(p)} \in R^{n \times d_{r}}$ ，输出特征为 $y^{(r + 1)} \in R^{n \times d_{r + 1}}$ ， $d_{r + 1}$ 和 $d_{r}$ 表示工人节点特征在卷积第 $r$ 层的维度。 $ξ^{(r)} \in R^{d_{r} \times d_{r + 1}}$ 表示卷积第 $r$ 层的可训练参数。在最后一层输出中得到工人与任务特征相关的偏好矩阵 $P^{'}$ 和工人与任务特征相关的偏好矩阵 $Q^{'}$ 。

为了降低估计值与真实值之间的差距，本文采用多标签损失函数来对模型进行调参。损失函数公式如下：

$\begin{matrix} Loss = - \sum [x_{l j} \cdot \log (σ ({\hat{x}}_{l j})) + (1 - x_{l j}) \cdot \log (1 - σ ({\hat{x}}_{l j}))] \end{matrix}$ (10)

其中， $x_{l j}$ 表示工人 $w_{l}$ 与任务 $s_{j}$ 特征相关的偏好或工人与任务特征相关的偏好特征真实标签， ${\hat{x}}_{l j}$ 表示工人 $w_{l}$ 这两个特征的估计值。

最后，本文将两个矩阵 $P^{'}$ 和 $Q^{'}$ 分别与待招募工人的目标矩阵特征 $F^{goal}$ 相乘，得出工人与任务特征的偏好相关性以及工人与任务特征的信誉度相关性矩阵 $P^{rel} \in R^{n \times m}$ 和 $Q^{rel} \in R^{n \times m}$ 。

4.2. 基于异质图卷积网络的工人与任务的客观相关性估计

本文针对工人待完成任务对目标任务完成质量的影响，构造了一个包含具有待完成任务的工人，任务，任务特征的异质图。其中，任务节点包括具有待完成任务工人的已完成任务、待完成任务和待招募的目标任务。如图2 所示，本文通过定义任务元路径，利用图卷积神经网络对任务特征向量进行表征学习，并通过语义聚合计算不同元路径的重要性，获得任务特征的整体嵌入表示。随后，结合工人待完成任务特征与目标任务特征的相似度计算，最终得出有待完成执行记录工人与目标任务特征的相关。

Figure 2 Figure 2. Flowcharts for estimating objective relevance between workers and tasks based on heterogeneous graph convolutional networks--图2. 基于异质图卷积网络的工人与任务的客观相关性估计流程图--

定义1. 异质图。用 $G^{'} = (V^{'}, E^{'})$ 表示异质图， $V^{'}$ 代表节点集合， $E^{'}$ 代表关系边集合，存在映射关系 $V^{'} \to ϕ$ ， $E^{'} \to φ$ ， $ϕ$ 表示节点的类型，该图包括工人 $W$ ，任务 $S$ ，任务特征 $F$ ， $φ$ 表示关系的类型，还包括任务与任务特征的所属关系和任务与工人的执行关系。

定义2. 元路径。图 $G^{'}$ 上的元路径是由多种节点类型和多种关系组成的有序序列，为了学习任务节点的表征，本文选取了以下核心元路径：

$\begin{matrix} 任务元路径 {\begin{array}{l} 任务 - 任务特征 - 任务 (SFS) \\ 任务 - 工人 - 任务 (SWS) \end{array} \end{matrix}$ (11)

SFS表示两个任务(待招募任务或未完成任务)具有相同任务特征。SWS表示具有待完成任务的工人执行过的任务与左右两边任务(待招募任务或未完成任务)有相同的任务特征。

特征嵌入分为两个步骤，元路径内聚合和元路径间聚合。元路径内聚合是为了聚合元路径中目标节点和其邻居节点的特征，元路径间聚合需要学习不同元路径的重要性，以捕获高阶邻居对目标节点的影响。

首先是元路径内聚合，在异质图中，同样会出现节点彼此之间连接分布不均匀的情况。因此为正确学习节点在元路径下与各类节点之间的内部联系，使用元路径内图卷积，对元路径中的节点特征进行更新操作。设“任务–任务特征–任务”接矩阵为 $Λ_{S-F-S}$ ，“任务–工人–任务”邻接矩阵为 $Λ_{S-W-S}$ ，元路径间节点聚合过程如下：

$\begin{matrix} h^{(Φ + 1)} = GCN ({\tilde{Λ}}^{'} h^{Φ} τ_{h}^{Φ}) \end{matrix}$ (12)

$\begin{matrix} \tilde{Λ} = Λ + I \end{matrix}$ (13)

$\begin{matrix} {\tilde{Λ}}^{'} = {\tilde{D}}^{- \frac{1}{2}} \tilde{Λ} {\tilde{D}}^{- \frac{1}{2}} \end{matrix}$ (14)

其中 $Λ \cup {{Adja}_{S-F-S}, {Adja}_{S-W-S}}$ ， $h^{Φ}$ 表示第 $Φ$ 层的特征矩阵， $τ_{h}^{Φ}$ 代表第 $l$ 层可训练的输入权重矩阵， $\tilde{D}$ 为节点的度矩阵。经过GCN处理后，分别得到基于元路径的任务特征嵌入 $F_{S-F-S}$ 和 $F_{S-W-S}$ 。

在元路径内聚合节点特征仅考虑了邻居节点的影响，不能充分反映任务节点之间的结构和语义联系，想要更全面地学习任务节点表征，需要进行元路径间聚合。使用语义级注意力学习不同元路径的重要性，元路径(SFS)和(SWS)的与语义级注意力可以表示为 $(h_{SFS}, h_{SWS}) = a t t_{S e m} (F_{S-F-S}, F_{S-W-S})$ 。为计算语义级注意力权重，先将节点在某条元路径下的嵌入进行非线性转化，乘以使用一个可学习的语义级注意力向量 $q$ ，然后对同一元路径下所有节点的运算结果求平均值，得到特定元路径的重要性 $ℋ_{λ} \in {ℋ_{SFS}, ℋ_{SWS}}$ ，计算公式表示为：

$w_{ℋ_{λ}} = \frac{1}{| N |} \sum_{i \in N} q^{T} \tanh (W \cdot F_{i}^{ℋ_{λ}} + b)$ (15)

其中，N表示 $ℋ_{λ}$ 中的节点数量， $W$ 为线性方程的权重矩阵， $b$ 为偏置向量。然后，使用softmax函数对所有元路径的重要性 $w_{ℋ_{λ}}$ 进行规范化，得到元路径 $ℋ_{λ}$ ，的注意力权重 $h_{ℋ_{λ}}$ 。 $h_{ℋ_{λ}}$ 代表元路径 $ℋ_{λ}$ 的贡献率， $h_{ℋ_{λ}}$ 越高，意味着重要性越强。使用 $h_{ℋ_{λ}}$ 对经过节点级注意力处理后的任务特征 $F_{ℋ_{λ}}$ 。进行加权求和，得到节点最终的特征表示 $F^{'}$ ，计算公式为：

$\begin{matrix} F^{'} = h_{ℋ_{SFS}} \cdot F_{ℋ_{SFS}} + h_{ℋ_{SFS}} \cdot F_{ℋ_{SFS}} \end{matrix}$ (16)

本文从最终的任务特征节点嵌入 $F^{'}$ 中，分出每个工人的待完成任务工人的待执行任务特征矩阵 $F_{l}^{wait^{'}} \in R^{o \times (α + β + γ)}$ ，没有待完成任务的，矩阵为空。目标任务特征矩阵 $F^{goal^{'}} \in R^{m \times (α + β + γ)}$ ，如下所示。通过计算工人 $w_{l}$ 待完成任务特征和目标任务特征的相似度累积得出工人与目标任务特征的相似度 $z_{l, j}$ 。其公式如下：

$\begin{matrix} z_{l, j} = \sum_{\partial = 1}^{δ} \frac{F_{l \partial}^{wait^{'}} \cdot F_{j}^{goal^{'}}}{‖ F_{l \partial}^{wait^{'}} ‖ \cdot ‖ F_{j}^{goal^{'}} ‖} \end{matrix}$ (17)

$\partial$ 代表工人 $w_{l}$ 的待完成任务序号。最终得到待完成任务工人与任务特征相关性矩阵 $Z^{rel}$ 。

4.3. 任务完成质量估计模块

经过以上步骤，本文得到了工人与任务特征的偏好相关性 $P^{rel}$ 和工人与任务特征的信誉度相关性 $Q^{rel}$ 以及待完成任务工人与任务特征相关性矩阵 $Z^{rel}$ 。为了考虑以上相关性对任务执行质量的影响，本小节利用注意力机制获取所有相关性信息的权值，并计算出权值总和对工人的任务完成质量的指标进行估计。在本研究中评论任务完成质量好坏是由工人l的任务j及时性，任务执行完整性 $Q_{l j}$ ，任务结果可靠性 $ℛ_{l j}$ 这三个指标来决定的，以上三个指标由主观性和客观相关性决定，且指标之间互相不影响。具体公式如下：

$\begin{matrix} λ_{l j}^{ϱ, ϒ} = {Softmax}_{l} (W^{ϒ} ϒ_{l j} + b^{ϒ}) \end{matrix}$ (18)

$\begin{matrix} x_{l j} = \sum λ_{l j}^{ϱ, ϒ} \cdot ϒ_{l j} \end{matrix}$ (19)

其中， $ϒ \in {P^{rel}, Q^{rel}, Z^{rel}}$ ，， $λ_{l j}^{ϱ, ϒ}$ 为工人l对任务 $j$ 指标 $ϱ_{l j}$ 的相关性 $ϒ$ 的注意力权重，向量 $W^{ϒ} \in R^{m \times m}$ 和 $b^{ϒ} \in R^{1 \times m}$ 为可训练的权重矩阵与偏置矩阵。在这里本文同样使用多标签损失函数，利用梯度下降算法最小化任务执行结果的估计概率和真实标签之间的交叉熵损失。具体过程如公式所示：

$\begin{matrix} L = - \sum_{j = 1}^{N} (σ_{l j} \log_{e}^{χ_{l j}} + (1 - χ_{l j}) σ_{l j} \log_{e}^{(1 - χ_{l j})}) \end{matrix}$ (20)

其中， $χ_{l j} \in R^{1 \times m}$ ， $σ_{l j} \in R^{1 \times m}$ 分别代表工人 $l$ 任务执行结果的估计标签和真实标签。

5. 实验评估 5.1. 数据集介绍

如表1 所示，本文使用两个开放数据集，Yelp数据集和Gowalla数据集。Gowalla数据集记录了用户在Gowalla平台上的签到信息，详细反映了用户的地理移动轨迹和社交互动行为及用户之间的社交关系。由于两个数据集过于庞大，针对Yelp和Gowalla数据集本文分别选择2019年费城区域和纽约区域有执行任务记录和社交关系的工人数据来进行实验，将用户数据大概分为80%的训练集，10%的验证集，10%的测试集。

Table 1 <xref></xref>Table 1. Dataset detailsTable 1. Dataset details 表1. 数据集详细信息

数据集	Yelp	Gowalla
总用户数	14,941	13,522
测试集未执行过任务的用户数量	700	700
测试集做过任务的用户数量	800	800
总任务数量	56,102	61,874
目标任务数量	600	600

5.2. 模型精确度评估

为了确保本实验的模型准确度，我们将对FSL-GNN和异质图神经网络去估计出的工人与任务特征相关的偏好向量和工人与任务特征相关的偏好向量真实值( ${observed}_{t}$ )和预测值( ${predicted}_{t}$ )进行求余弦相似度，其中t和N代表没有执行过任务工人的编号和总数，公式如(21)：

$\begin{matrix} Accuracy = \frac{1}{N} \sum_{t = 1}^{N} \frac{{observed}_{t} \cdot {predicted}_{t}}{‖ {observed}_{t} ‖ \cdot ‖ {predicted}_{t} ‖} \end{matrix}$ (21)

经过对两个数据集的精确度评估，其结果表2 所示。

Table 2 <xref></xref>Table 2. Model accuracy tableTable 2. Model accuracy table 表2. 模型精确度表

数据集	Yelp	Gowalla
偏好	0.923	0.902
信誉	0.892	0.874

由结果可知，两个数据的精确值都在0.85以上，精确度高，可以进行后续实验。

5.3. 招募算法对比实验

在本实验中，任务的完成质量考虑了工人完成任务时的任务响应时间，任务完成率，任务可靠性。其计算方法如公式(22)所示。

$\begin{matrix} 任务的完成质量 = (1 - \frac{任务响应时间}{24}) \times 任务完成率 \times 任务可靠性 \end{matrix}$ (22)

这三个指标的真实值计算如下。

1) 任务响应时间，用于反应响应任务的时间长短，为任务响应时间总和的平均值，其计算过程公式(22)所示。

$\begin{matrix} 任务响应时间 = \frac{\sum (工人响应时间 - 任务分配时间)}{已执行目标任务数量} \end{matrix}$ (22)

2) 任务完成率，用来描述工人在任务执行中的有效工作量比值，值越接近1，表示任务完成率越高，其计算过程公式(23)所示。

$\begin{matrix} 任务完成率 = \frac{\sum (\frac{工人完成工作量}{目标任务工作量})}{已执行目标任务数量} \end{matrix}$ (23)

3) 数据可靠性，用来描述工人执行结果与任务预期结果的偏离程度，不同的任务有不同的可靠性计算方法，在本实验中通过所有任务结果的预期结果值与真实结果值的差异进行非线性归一化平均来求得，其计算过程公式(24)所示。

$\begin{matrix} 数据可靠性 = \frac{\sum 1 - Tanh (预期结果值 - 真实结果值)}{已执行目标任务数量} \end{matrix}$ (24)

4) 任务完成质量精确度(MSE)，通过平方误差的平均值来反映模型预测结果的精确程度，值越小，表示工人的任务完成质量越接近实际结果，其计算过程公式(25)所示。

$\begin{matrix} MSE = \frac{{\sum (真实任务完成质量 - 预测任务完成质量)}^{2}}{已执行目标任务数量} \end{matrix}$ (25)

本文将本文算法与以下现有招募算法进行对比：

1) 偏好和信誉度NUR [21] ：这种方法结合用户历史数据，采用随机半代数混合系统(SSAHS)建模用户的移动性和行为，预测用户对任务的偏好。通过综合用户的时间、空间和类别偏好，优先招募高质量用户上传可靠数据。目标在于优化数据可靠性和任务及时性。

2) 信誉度基于社交网络信任的招募方法RSUT [22] ：这种方法提出了基于社交用户信任的招募机制，通过该方法通过分析社交网络中的用户信任关系，解决冷启动问题并提高任务完成质量。RSUT设计了一种实时信任更新机制，以识别恶意用户，并根据任务需求调整奖励，从而确保公平性和高质量任务完成率。主要评估指标包括用户招募数量、任务完成率和任务质量。

3) 个性化任务匹配机制PTOM [23] ：此方法通过分析用户偏好(任务内容、时间和位置)与任务需求的匹配程度，采用Logit模型预测任务–工人配对的概率。平台根据匹配概率主动招募最合适的工人，确保实时高质量的数据收集。该方法的主要指标包括响应时间、任务完成率和数据质量。

4) 信誉度基于服务质量的参与者选择方法QoS-PR [24] ：该方法提出了一种根据工人服务质量预测的招募方法，基于参与者的历史任务完成情况、积累的声誉和意愿来预测数据质量。通过最大化服务质量，使用启发式贪婪算法来选择最适合的参与者。重点指标包括任务完成率、数据可靠性以及响应时间。

上述不同模型在Yelp数据集和Gowalla数据集的中的对比实验结果如图3 和图4 所示。随着任务数量的增加，三种指标的变化趋势分别为任务响应时间逐渐上升、任务完成率逐渐下降、任务可靠性逐渐下降，可知随着任务数量增加，模型性能会减弱。在每个任务数量下，本研究模型在三种指标上的表现始终优于其他模型，尤其是在在任务完成率上展现出较大的优势。此外，随着任务数量的增加，本研究模型的三种指标结果始终保持较高水平，就算在高负载任务场景下依然能够维持较好的执行效果。相比之下，其他对比算法在任务数量增大时，三种指标都呈现较大幅度的改变。实验表明，本研究模型在能招募高任务完成质量工人的同时，具有更强的稳定性和适应性。

Figure 3 Figure 3. Yelp data set different model task completion quality indicators--图3. Yelp数据集不同模型任务完成质量指标-- Figure 4 Figure 4. Gowalla data set different model task completion quality indicators--图4. Gowalla数据集不同模型任务完成质量指标-- Figure 5 Figure 5. The yelp dataset that focuses on task completion quality indicators for different correlation variants--图5. Yelp数据集侧重不同相关性的变体任务完成质量指标--

为了系统性地评估不同相关性因素对任务完成质量的实际贡献，本文通过控制单一相关性的权重，设定了3种变体。变体1将工人与任务特征的偏好相关性权重降低，变体2将工人与任务特征的信誉度相关性权重降低，变体3将工人与任务的客观相关性权重降低。其目的是在后续的实践中能够针对性地强化关键因素，提升任务完成的整体质量。本实验将权重降低的相关性权重设置为0.2，其余为0.4。所有变体的实验对比结果如图5 和图6 所示。

Figure 6 Figure 6. The Gowalla dataset that focuses on task completion quality indicators for different correlation variants--图6. Gowalla数据集侧重不同相关性的变体任务完成质量指标--

由实验结果可知，三种变体在Yelp和Gowalla两个数据集上的实验结果表现出类似的趋势，验证了工人与任务特征的偏好、信誉度两种主观相关性与工人与任务的客观相关性在任务完成质量中的重要性。通过控制单一相关性的权重，实验将每种变体的表现进行了比较，从而进一步揭示了不同相关性对任务完成率、任务响应时间、任务可靠性以及MSE的影响。

在考虑任务响应时间时，随着任务数量的增加，变体1和变体3相比于变体2在Yelp和Gowalla数据集上均表现出较高的数值。在考虑任务完成率时，随着任务数量的增加，变体1和变体2相比于变体3均呈现较低的任务完成率。在考虑任务可靠性时，随着任务数量的增加，变体1和变体2相比于变体3均呈现较低的任务完成率。在考虑MSE时，随着任务数量的增加，变体1和变体2相比于变体3均呈现较高的任务完成率。综合来看，任务完成质量受工人与任务特征的偏好相关性影响较大，其次是工人与任务特征的信誉度相关性，工人与任务的客观相关性。

6. 结论

本文提出了一种基于少样本学习和图神经网络的移动群智感知招募方法，旨在解决工人偏好和信誉度特征稀疏性问题，并综合考虑工人待执行任务对招募的客观影响。通过FSL-GNN模型，我们能够有效估计工人与任务的主观相关性，同时利用异质图卷积网络计算客观相关性，最终通过注意力机制实现任务完成质量的精准评估。实验结果表明，该方法显著提升了任务完成质量的估计精度，尤其是在任务完成率和数据可靠性方面表现出色。此外，通过变体实验，我们发现偏好相关性对任务完成率的影响最为显著，信誉度相关性对数据可靠性的重要性不容忽视，而客观相关性则对任务响应时间也有重要影响。这些发现为优化招募策略提供了重要依据。未来，我们将进一步探索任务由多个工人协作完成的场景，并拓展优化方法，以适应更加复杂的实际应用需求。

References 1

刘云浩, 信息科学. 物联网导论[M]. 北京: 科学出版社, 2017.

Suhag, D. and Jha, V. (2023) A Comprehensive Survey on Mobile Crowdsensing Systems. Journal of Systems Architecture, 142, Article ID: 102952. >https://doi.org/10.1016/j.sysarc.2023.102952

Cicek, D. and Kantarci, B. (2023) Use of Mobile Crowdsensing in Disaster Management: A Systematic Review, Challenges, and Open Issues. Sensors, 23, Article No. 1699. >https://doi.org/10.3390/s23031699

Chowdhury, C. and Roy, S. (2017) Mobile Crowd‐Sensing for Smart Cities. In: Song, H.B., et al., Eds., Smart Cities: Foundations, Principles, and Applications, Wiley, 125-154.

Fatima, Z., Rehman, A.U., Hussain, R., Karim, S., Shakir, M., Soomro, K.A., et al. (2023) Mobile Crowdsensing with Energy Efficiency to Control Road Congestion in Internet Cloud of Vehicles: A Review. Multimedia Tools and Applications, 83, 53949-53974. >https://doi.org/10.1007/s11042-023-17611-z

Zhang, E., Trujillo, R., Templeton, J.M. and Poellabauer, C. (2023) A Study on Mobile Crowd Sensing Systems for Healthcare Scenarios. IEEE Access, 11, 140325-140347. >https://doi.org/10.1109/access.2023.3342158

Azzam, R., Mizouni, R., Otrok, H., Ouali, A. and Singh, S. (2016) GRS: A Group-Based Recruitment System for Mobile Crowd Sensing. Journal of Network and Computer Applications, 72, 38-50. >https://doi.org/10.1016/j.jnca.2016.06.015

Azzam, R., Mizouni, R., Otrok, H., Singh, S. and Ouali, A. (2018) A Stability-Based Group Recruitment System for Continuous Mobile Crowd Sensing. Computer Communications, 119, 1-14. >https://doi.org/10.1016/j.comcom.2018.01.012

陆安琪. 移动群智感知系统工人招募算法的研究[D]: [硕士学位论文]. 哈尔滨: 黑龙江大学, 2021.

吴小同. 移动群智感知中任务分配与参与者招募策略研究[D]: [硕士学位论文]. 重庆: 重庆大学, 2020.

Wu, F., Yang, S., Zheng, Z., Tang, S. and Chen, G. (2021) Fine-Grained User Profiling for Personalized Task Matching in Mobile Crowdsensing. IEEE Transactions on Mobile Computing, 20, 2961-2976. >https://doi.org/10.1109/tmc.2020.2993963

Li, X., Zhang, L., Zhou, M. and Bian, K. (2023) Task Recommendation Based on User Preferences and User-Task Matching in Mobile Crowdsensing. Applied Intelligence, 54, 131-146. >https://doi.org/10.1007/s10489-023-05208-w

Xiong, J., Chen, X., Yang, Q., Chen, L. and Yao, Z. (2020) A Task-Oriented User Selection Incentive Mechanism in Edge-Aided Mobile Crowdsensing. IEEE Transactions on Network Science and Engineering, 7, 2347-2360. >https://doi.org/10.1109/tnse.2019.2940958

Ngo, Q.T. and Yoon, S. (2023) Context-Aware Worker Recruitment for Mobile Crowd Sensing Based on Mobility Prediction. IEEE Access, 11, 92353-92364. >https://doi.org/10.1109/access.2023.3308202

Wang, J., Liu, J., Zhao, Z. and Zhao, G. (2021) A Task Recommendation Framework for Heterogeneous Mobile Crowdsensing. The Journal of Supercomputing, 77, 12121-12142. >https://doi.org/10.1007/s11227-021-03745-0

Zhang, J., Wang, Q., Lang, D., Xu, Y., Li, H. and Li, X. (2023) Research on User Recruitment Algorithms Based on User Trajectory Prediction with Sparse Mobile Crowd Sensing. Mathematical Biosciences and Engineering, 20, 11998-12023. >https://doi.org/10.3934/mbe.2023533

Ma, Y., Ma, L., Gao, X. and Chen, G. (2023) Fused User Preference Learning for Task Assignment in Mobile Crowdsourcing. In: Monti, F., et al., Eds., Service-Oriented Computing, Springer Nature, 227-241. >https://doi.org/10.1007/978-3-031-48424-7_17

王健, 黄越, 赵国生, 等. 面向任务代价差异的移动群智感知激励模型[J]. 电子与信息学报, 2019, 41(6): 1503-1509.

Gao, Y., Li, X., Li, J. and Gao, Y. (2017) A Dynamic-Trust-Based Recruitment Framework for Mobile Crowd Sensing. 2017 IEEE International Conference on Communications (ICC), Paris, 21-25 May 2017, 1-6. >https://doi.org/10.1109/icc.2017.7997420

Wang, J., Tang, J., Yang, D., Wang, E. and Xue, G. (2016). Quality-Aware and Fine-Grained Incentive Mechanisms for Mobile Crowdsensing. 2016 IEEE 36th International Conference on Distributed Computing Systems (ICDCS), Nara, 27-30 June 2016, 354-363. >https://doi.org/10.1109/icdcs.2016.30

Xie, Y., Liu, X., Obaidat, M.S., Li, X. and Vijayakumar, P. (2023) Nondeterministic Evaluation Mechanism for User Recruitment in Mobile Crowd-Sensing. ACM Transactions on Sensor Networks, 19, 1-18. >https://doi.org/10.1145/3546951

Wang, P., Li, Z., Long, S., Wang, J., Tan, Z. and Liu, H. (2024) Recruitment from Social Networks for the Cold Start Problem in Mobile Crowdsourcing. IEEE Internet of Things Journal, 11, 30536-30550. >https://doi.org/10.1109/jiot.2024.3407329

Wang, Z., Zhao, J., Hu, J., Zhu, T., Wang, Q., Ren, J., et al. (2021) Towards Personalized Task-Oriented Worker Recruitment in Mobile Crowdsensing. IEEE Transactions on Mobile Computing, 20, 2080-2093. >https://doi.org/10.1109/tmc.2020.2973990

Jiang, W., Chen, J., Liu, X., Liu, Y. and Lv, S. (2021) Participant Recruitment Method Aiming at Service Quality in Mobile Crowd Sensing. Wireless Communications and Mobile Computing, 2021, Article ID: 6621659. >https://doi.org/10.1155/2021/6621659