1. 研究背景与意义
近年来,随着远程医疗、线上教学、自动驾驶等技术的发展,无线通信网络中接入的设备数量与无线数据流量均呈爆发式增长。传统蜂窝网络提供的数据传输速率难以满足当今用户需求,用户服务质量难以保障,频谱资源短缺等问题日益凸显。因此,为了解决这些问题国内外研究人员不得不探索新的网络体系架构和通信技术 [1] 。
设备直通(Device-to-Device, D2D)通信技术是5G蜂窝网络中的可行方案之一,该技术是一种不需要通过基站(Base Station, BS) BS进行数据中继处理与转发,在近邻设备与设备之间直接进行数据传输的通信技术 [2] 。在D2D通信技术的加持下,D2D用户可以与蜂窝用户在同一频段进行通信,提高了频谱效率;用户进行数据传输时无需通过网络中心设备的干预,可以大大减少基站BS的数据处理和转发次数,降低基站负载 [3] 。
但在传统蜂窝用户在与D2D用户进行频谱资源共享时,二者之间的通信会产生一定的干扰,影响用户服务质量 [4] 。因此想要使用户服务质量得到根本保障,合理的资源分配算法是十分必要的。合理的资源分配算法可以在保证用户的服务质量(Quality of Service, QoS)的同时,优化系统性能,降低功耗,且可为D2D用户选择优质的频谱资源,抑制通信干扰 [5] 。因此,如何设计出合理有效的资源分配方案是我们接下来要研究的重点。
申滨,孙万平等人提出了一种两阶段资源分配方法 [6] ,相比于传统算法,该算法能够显著提高系统和速率及D2D接入率,同时确保用户公平性,但D2D用户共享多个蜂窝用户的频谱资源时,产生的干扰有可能会抵消资源重用带来的容量增益。高鹏等人研究了D2D用户在不同的通信模式下贪婪算法的总速率最优方案,提出了一种改进贪婪算法 [7] ,它可以得到带有三维决策变量的指派问题的次优解,该算法的复杂度远低于穷尽搜索算法,而且在原问题有解的情况下一定能得到可行解,即可靠性远高于贪婪算法,但却牺牲了用户的服务质量。K.W. Choi,Z. Han等人提出了一种资源分配优化方案 [8] ,该算法虽然降低了基站信令开销,但却使资源分配时间有所提高。肖琳等人提出了基于GRU-DDQN的D2D-NOMA资源分配算法 [9] ,该算法只考虑了单一小区场景,且所有D2D用户均在单基站覆盖范围内。这些方案虽然使得资源分配速率有所提高,但基站负载、资源分配时间却有所提高。邓炳光等人提出了一种基于多智能体深度强化学习的D2D通信资源联合分配方法 [10] ,该方法将授权频段和免授权频段的联合部署考虑在内,使D2D用户吞吐量得到增加,但该算法忽略了现实通信中存在的干扰。张世良等人提出了一种基于深度强化学习的D2D异构网络节能模式选择和资源分配方法 [11] ,该方法对于系统的稳定性有一定提升,但该方法忽略了用户行为的随机性与不确定性,不能使用户服务质量得到根本保障。当前文章中提出的算法,大多无法在提高系统速率的同时,兼顾用户公平性和QoS。
因此,本文提出了一种基于服务质量保证的资源分配算法。该算法可以实现D2D通信的模式切换,打破D2D用户通信过程中通信模式不可变的束缚,有效提高系统的总速率,在兼顾用户服务质量的同时优化系统性能。当通信用户较多时,服务质量不再影响系统总速率的关键因素,在本文的模型下,把蜂窝小区半负载化,减少频谱利用率增加系统总速率,选择干扰最小的用户实现系统速率的最大化。
2. D2D通信技术
与传统的蜂窝通信一样,D2D通信也分为三种方式:单播、多播和广播。D2D通信采用的最多的方式是单播通信方式,这种方式的最大好处是可以直接建立链路进行数据传输,而不需要借助基站,在两台设备距离较近的情况下进行传输。
2.1. 设备配对
设备配对是指具有通信需求的D2D通信对,D2D用户可以通过收发信号发现附近的D2D设备,并在相互确认身份后完成配对过程。在设备配对的过程中非常重要的一步是,每个D2D设备都可以考虑到隐私保护的问题,将自己的发现模式设定为开放或受限模式,从而对D2D用户的附近进行探测和发现。
如果用户将设备设定为不被用户允许的受限模式,那么这个用户设备对于其他设备来说就是隐形的,它能够保证用户不被其他探索用户打扰,因此社交网络应用基于D2D通信更适合这个受限模式。
开放模式的过程更加简单,能够提高被附近设备发现的几率,但用户的隐私却更加难以保证。如图1(a)在“网络独立控制”模式下,对于D2D设备之间的配对过程基站拥有绝对控制权。其过程是先由D2D对话的请求人截获基站命令,将请求人身份、同步资讯及所需服务资讯等上传确认。基站接收请求者上传的一系列信息并确认后,再发送给附近的目标用户供其发现和连接。
如图1(b)在“网络辅助控制”模式下,基站只起辅助控制信息的作用。当D2D对话的请求者主动将自己的信息发送出去后,基站会定时广播这些信息,附近有需求的D2D用户可以通过指定的频道来完成设备配对,从而收发信息。
2.2. D2D通信模式选择
D2D通信有三种模式:
正交模式,D2D用户被分配到的信道资源与正在通信的蜂窝用户都相互正交;
复用模式,指D2D用户被分配的信道资源与某一正在通信的蜂窝用户相同;
基站中继模式,当D2D通信链路的状况不佳时,D2D用户将采用传统蜂窝通信方式,以基站作为中继进行数据传输。
D2D通信模式选择的影响因素除了上述的D2D设备与基站间的链路质量和D2D通信对间的链路质量外,还有D2D设备的位置与所处的干扰环境,距离会对上行频段和下行频段的效果产生影响。动态调整会根据环境的不同而改变通信模式,这种动态调整不但可以适应现实信道的时变特性,而且可以获得频谱效能的提高。
2.3. D2D通信技术的优势
1) 提高频谱利用率
在D2D通信模式下可以避免用户数据在蜂窝通信中通过网络中转传输而产生链路增益,也可以最大限度地利用D2D用户和D2D与蜂窝之间的资源,使资源重复利用产生增益;如图2所示,在长距离数据传输时,有D2D协作场景的能量效率明显优于没有D2D协作的场景。

Figure 2. Cellular subscriber energy efficiency map
图2. 蜂窝用户能效图
2) 提升用户体验
蜂窝小区的边缘用户信号比较弱,通信质量较差。而D2D通信的应用,使得处于社区边缘的用户也可以用通信的方式正常接收信号。
3) 扩展通信应用场景
传统的无线通信网络对通信基础设施要求较高。通信系统可能因核心网或接入网设备受损而瘫痪。D2D通信技术的推出,使蜂窝通信终端有了建立AdHoc网络的可能。终端可以通过D2D实现端到端通信。
4) 减轻基站负载
D2D通信技术的推出,减少了基站的信令开支,缓解了基站的压力,因为移动用户和业务的大量增长,基站的负荷不断增加,降低了用户的通信体验。
5) 干扰可控
D2D通信技术为保证通信性能,工作频段均为授权频段,这使得在与蓝牙、WIFI、Zigbee以及NFC的比较下,D2D通信技术抗干扰性能更为突出,通信质量更有保证。
2.4. D2D通信资源分配
D2D通信资源分配的主要目的是进行干扰抑制,使蜂窝用户资源复用通信时对D2D用户的干扰控制在一定范围内,不会对其他设备的正常通信造成影响 [12] 。
在设备对设备的通信方式中,有两种方案:采用集中资源分配方案,也就是终端需要发送D2D数据时,时频资源需要请求网络设备;采用分布式资源分配方案,当终端需要发送D2D数据时,需要在预配置的传输资源池中自主选择时频资源 [13] 。
D2D通信传输资源分配方式分为两种,分别是由eNB排定的资源配置与UE自发选择资源。
1) 由eNB来排定的资源配置
首先UE需要是RRC-CONNECTED状态,然后UE向eNB发送scheduling requset (D-SR or Random Access),后面跟着Sidelink BSR。根据Sidelink BSR,eNB能判断出该UE有数据需要经过Sidelink通信传输并评估传输用的资源,eNB就排定传输资源,通过配置好的SL-RNTI。
2) UE自发的选择资源
有8个资源池,每一个资源池都有一个或者多个PPPP和其相关联。为了发送一个MAC PDU,UE会选择一个资源池,该资源池相关的PPPP和逻辑信道的PPPP相同。Sidelink控制用的资源池和发送数据用的资源池存在一对一的对应关系。一旦一个资源池被选定,那么选定的资源池在整个Sidelink控制周期内都是有效的。当该周期结束后,UE可能会重新选择资源池。在一个Sidelink控制周期内,一个UE可以向多个不同的目的UE发送数据。
D2D用户密度日益增加,设备能量供给不足等问题也愈发显著。当D2D设备距中心网络较远时,数据传输会因能量供给不及时造成中断,从而无法接入蜂窝网络。合理的资源分配算法可以提高资源利用率、提高系统吞吐量、降低基站信令开销等。
3. 基于服务质量保证的资源分配算法
3.1. 系统模型
考虑的系统模型如图3所示。在一个BS处于中心位置的蜂窝网络中,D2D用户可用两种通信方式:专用模式和复用模式,进行数据通信。CUS用集合C表示,D2D用户用集合D表示。
由于现实生活中,蜂窝小区处于无用户通信状态或全负载状态的时间不会太长,网络中存在稳定通信的CU、稳定通信的D2D用户、待接入网络的CU和待接入网络的D2D用户四种类型用户。如图中,用集合Cn表示N个稳定通信的CU;用集合Dm表示M对稳定通信的D2D用户;用集合Cx表示X个待接入网络的CU;Y对待接入网络用户的D2D用户,用集合Dij表示。
用集合
表示蜂窝网络中K条相互正交的信道,当用户使用此类信道通信,必须获得相应的信道资源。当CHK被给于CUi和D2D用户对j时,CUi的瞬时SINR的公式为:
(3.1)
D2D用户的瞬时SINR对j接收端的计算公式为:
(3.2)
CUi和D2D用户对j的发射功率分别是
和
;蜂窝用户i对j的干扰信道功率增益是
,D2D用户对j的发射端到CUi与BS之间链路的干扰信道功率增益用
表示,CUi与BS之间的信道功率增益用
表示,D2D用户对j的发射端到接收端之间的信道功率增益用
表示,
为噪声功率。此式可计算各通信方式的信干噪比,为下面比较函数做准备。
3.2. 目标函数
本文研究问题的相关表达式如下
(3.3)
(3.3a)
(3.3b)
(3.3c)
(3.3d)
其中B代表信道的带宽,CUi和D2D用户对j的最小SINR门限值分别用
和
表示。这里的
和
是一对二值指示函数,用来表示资源分配的结果,他们的赋值如下:当值为1时表示信道被分配给相应通信模式,0表示未分配给相应通信模式。式(3.3)表示的速率
,其中B代表带宽,表示最大化系统的通信链路总数率。式(3.3a)与(3.3b)表示SINR的最小门限值。我们可以根据上述约束条件得到通信各信道最佳最快的通信速率。
(3.4)
(3.5)
最小的SINR用式(3.3a)和式(3.3b)表示,保证了用户在一定范围内受到的干扰,在复用情况下保证对应用户的QoS;约束式(3.3c)则保证两种通信模式只分配一个频道;约束式(3.3d)是一条信道只分配给一个CU用户或复用一对D2D用户。上述约束条件的设定是为了减少D2D用户访问造成的网络复杂问题。
3.3. 资源分配算法的实现过程
为了叙述方便,本节将待接入网络的用户统称为用户s。用户s会根据信噪比评判信道。
是CHk的通信链路中接收端的SNR,其计算公式为:
(3.6)
其中
是用户s到BS之间的信道功率增益,
是用户s的发射功率。这这里用二值指示函数
来表示用户特征值。根据式(3.3c)和式(3.3d),用户s可以判断是否使用CHk进行数据通信。不同情况下
的具体赋值表如表1所示,如果可以使用,则
,否则
。

Table 1. η s , k assignments in different situations
表1.
在不同情况下的赋值
变量
表示用户s对各条信道的选择程度,称为用户s的特征值列表,表达式为
。各信道按照
的规律排列,k是索引值,其中
排在第一个的信道索引值表示用户s最喜欢的信道。
3.4. 待接入网络用户的资源分配算法
下面我们就根据用户的特征值List进行联盟生成。允许结成联盟的只有目前最感兴趣的渠道,即相同的用户。若信道索引值为K,则表示本联盟为Ik。在联盟中,占用该信道进行数据传输的用户组合或者用户,能为整个系统提供最大速率增益 [14] 。
图4(a)中所示的情况,信道CHk被两种用户复用,这两种用户会被分给其他用户,计算公式如下:
(3.7)
图4(b)中所示的情况中,联盟Ik的CHk只能被稳定通信的CU占用,所以该联盟的最终速率可以由稳定通信的CU和待接入网络的D2D用户提供,计算公式如下:
(3.8)

Figure 4. Occupancy channel user situation
图4. 占用信道用户情况
本章的仿真基于MATLAB实现。蜂窝小区半径定为500 m,K = 40表示区间内有40个相互正交的信道。两种用户位置随机分布在区间内。由于D2D通信比较特殊,通信两方的距离不能过远,限定距离为50 m。所选信号的阴影衰落符合对数正态分布,蜂窝网络与D2D链路的标准差为8 dB和6 dB。其他的数据如下表2所示。
3.5. 仿真结果

Figure 5. The total rate curve for both algorithms
图5. 两种算法的总速率曲线
从图5可以看出,当通信模式是具有固定用户数目进行通信时,取蜂窝用户40个、D2D用户20个进行仿真,当各个算法都趋于饱和状态时可得到本算法比贪婪启发式算法的总数率提高了12%。当两种算法CDF曲线趋近于1时,基于服务质量保证算法速率明显优于贪婪启发式算法。
4. 结论
本文首先对国内外D2D通信技术研究现状进行总结分析,其次对D2D通信技术进行介绍,并提出了基于服务质量保证的资源分配算法。仿真证明该算法与贪婪启发式算法相比,可显著提高D2D用户的可选资源范围,打破了D2D通信对通信过程中通信模式不可更改的束缚,并进一步对系统性能进行了优化。但是本文中D2D通信资源分配算法的研究是针对独立的蜂窝小区进行的,而实际生活中的通信设备是随着用户的移动而不断移动的,地理位置以及网络环境都会发生相应改变。随着互联网对巨量用户接入,数据传输要求等的不断提高,关于D2D通信架构和资源分配方案的问题,仍需更加深入的探索和研究。
基金项目
河南省创新训练计划项目,项目编号:S202212949015资助。