1. 引言
Arikan教授提出的极化码[1],是编码理论问世以来,第一个能够证明可以在大量信道中实现信道容量的编码。在码长
趋近于无穷时,极化信道趋向于两个极端,即不是无噪声信道,就是纯噪声信道。并且,无噪声信道的比例接近信道容量。在渐进情况下,串行抵消译码算法作为一种低复杂度的算法足以达到信道容量,并且,在有限长度情况下,逐次消除列表(Successive Cancellation List, SCL)解码的性能可与许多其他类别的信道编码,如LDPC (Low Density Parity Check)码媲美,特别是结合CRC (Cyclic Redundancy Check)校验之后[2]。自Arikan发明极性码以来,极性码引起了广泛关注。极化码盛行的一个重要原因是,极化码是第一种具有明确的低复杂度构造结构的编码方案,同时能够在码长接近无穷大时实现信道容量。更重要的是,极化码不会出现Turbo码和(在较小程度上) LDPC码容易出现的错误平层现象。由于极性编码性能卓越,因此被应用为5G中eMBB (enhanced Mobile BroadBand)的控制信道编码。
使用
作为极化核是一个非常天才的想法,但这也限制了码长的选择,许多区块长度无法
用2的幂次表示。针对这一问题,渐渐产生两个研究方向。第一种,文献[3]-[6]提出了穿刺和缩短技术,在长度
的母极化码的基础上,使用这两项技术可以构造任意长度的极化码。
两者的区别在于,打孔操作删除的编码比特在接收端是未知的,即接收端没有被删除的编码比特的实际值的先验信息。在译码时,将被删除编码比特的对数似然比(Log-Likelihood Ratio, LLR)置为零。而缩短操作则通过删除特定的编码比特,并在发射端相应位置的子信道发送已知值。在这种情况下,接收端可以预先了解这些删除编码比特的值。在译码时,根据这些已知的值,将被删除编码比特的LLR置为正无穷或负无穷。
这两种都是很实用的方法,但是也有一些缺陷,包括较高的复杂度以及有可能导致的性能损失。当然,除了上述的两种方法,还存在其他的速率匹配方案。但是这些方案,相比于打孔和缩短的速率匹配方法,目前仍缺乏良好的理论和设计。而第二种则是基于Arikan在文献[1]中的猜想,极化现象并不仅仅局限于二阶核,这一猜想在文献[7]中得到了证明,进而可以设计出各阶核来实现极化现象。基于此,文献[8]提出了混合核极化码(Multi-kernel polar code)。这是一种在同一二进制符号集中混合大小不同的核来构造极化码的方法,编码遵循极化码的一般结构,解码也可以通过串联抵消算法来实现。
极化码的另一个短板,就是中短长度的极化码在SC解码下性能很差,文献[9]提出了串行抵消列表算法,随着列表大小的增加,SCL的性能逐渐接近最大虽然译码(Maximum Likelihood, ML),然而由于最小距离较小,性能依旧很差,这是由于中短长度的极化码的极化效应不够强烈,不足以超越距离特性。因此,计算每个阶段的陪集码谱就是一种自然的想法。许多学者都在尝试计算极化码的距离谱。例如,文献[10]的作者提出在有噪声的信道上发送全零码字,并利用连续消隐列表解码器对接收到的矢量进行解码。解码后,计算出列表中编码字的权重,并更新特殊的权重函数。文献[11]提出了如何高效计算概率权重分布表达式的方法。文献[12]推导出了极化码串联抵消码过程中每个阶段出现的精确权重分布。并确定了与两个位置不同的两条路径相关的两个陪集(coset)之间的最小距离。这可以视为分析连续取消列表解码权重分布的第一步。论文[13]利用概率的方法计算出了预变化极化码重量谱。
2. 预备知识
2.1. 极化码
极化编码是一种新的信道编码方法,已被证明达到任何二进制输入无记忆信道的容量,而该信道的容量是由均匀输入分布实现的(如准对称信道)。其证明技术和编码构造纯粹基于信息论概念,编码和解码复杂度都很低。polar码的产生来源于信道极化,本节旨在简单介绍信道极化的过程以及将其运用到信道编码的基本思想。
对于一个二进制离散无记忆信道(Binary-Discrete Memoryless Channel, B-DMC)
,其转移概率为
。信道极化的过程包括两个阶段:信道和信道分裂。如图1所示,将两个比特
编码为:
(1)
其中,
代表了模二的加法运算。
为码长为2的极化码的生成矩阵。将
和
分别经过W进行传输。
则合并后的信道
的转移概率为:
(2)
将式(1)和图1所示的操作称为一级极化。多级的级联进行上述操作,可以实现多级极化,如图2所示,生成矩阵为
,其中
是比特逆序重排矩阵。
。
表示Kronecker积。
其中,传输信源序列
的极化信道
的转移概率为:
(3)
信道
的输入是
,输出是
,其互信息是
。
Figure 1.The channelW2
图1.一级信道极化
信道
的极化信道
的转移概率:
(4)
Figure2.The channelW8
图2.三级信道极化
信道
的输入是
,输出
,其互信息是
。
定理1[1]在长度为N的极化码中,极化信道的有如下递归关系:
(5)
(6)
高效的译码算法是信道编码是否实用的决定性因素。文章[1]中提出了串行抵消(Successive Cancellation, SC)译码,成为极化码的经典译码算法之一。简单来说,对于长度
的polar码,SC译码器接收到经过信道传输的信号,首先利用这些信号译出
,接下来利用
的估计译码以及接收信号译出
,依此类推,直到利用接收到的信号和
的估计译码译出
。递归过程由图3给出。
Figure 3.The recursive process of SC decoding
图3.译码的递归过程示意图
给定任意
的极化码,利用SC译码器,通过计算式(7)来估计
,即第i位的硬判决。
(7)
其中,
为判决函数,其定义为:
(8)
2.2. 混合核极化码
在文献[8]中,作者提出了一种基于在同一二进制字母表上混合不同大小内核的极性码通用构造,以构造任意块长的极性码。通过在不同阶段使用不同大小的内核,事实上可以构造出块长度不仅是整数幂的极性码。这是与其他混合构造的主要区别是,混合极化码旨在优化块长度限制为整数幂的极性编码的性能。通过这种构造,获得了一个新的极性编码系列,其纠错性能可与通过穿刺/缩短方法获得的最先进极性编码相媲美,甚至更好。此外,编码复杂度与极性码相似,而解码遵循相同的一般结构。因此,列表解码算法可用于多核极性编码,还可通过使用循环冗余校验(CRC)比特来增强其性能。主要给出三阶核的构造。
三阶核的极化如图4所示。
接下来介绍针对长度为
,其中
是质数,但不一定是不同的。每个整数
对应一个大小为
的二进制内核
,即一个大小为
二进制矩阵。这种多核极性编码的变换矩阵定义为
。不同的核排序会导致不同的G。因为克罗内克积是不可交换的。我们利用Tanner图的表示方法来构造混合核极化码。
Figure 4.The channelW3
图4.三阶核的极化示意图
如图5所示,混合核极化码的Tanner图有S阶段,每个阶段有
个盒子,每个盒子为一个
的块,描述了
。连接如下:
阶段i的
个盒子通过置换
与
阶段的
相连;接着定义
为阶段i的内核大小的部分乘积,这样可以将阶段i和阶段
的盒子分成
个区块,这些排列组合在区块内操作,不同区块的两个盒子不相连。
下面,给出置换
的数学表达式。
那么对于
,有
。
其中,
,而
。
事实上,这样的构造方法是极化码的一种通用的构造形式,对于仅由二阶核极化的极化码,依然遵循这样的规律。为了使 Tanner图构造的描述更加清晰,以图5为例,计算一下$\pi_i$。
首先,
。对于
,因为
,所以得到
对于
,分成四个区块,
,所以
,得到
Figure5.1: Tanner graph of the multi-kernel polar code of length
for the transformation matrix
图5.码长为12,生成矩阵为
的混合核极化码的Tanner图
2.3. 陪集
在本节中,我们将介绍一种新的分析工具、即陪集码谱(coset weight spectrum),来分析极化码在SC解码下的误码性能。首先,我们研究单比特错误事件的错误概率,并介绍陪集和陪集码谱的概念。然后,我们基于极谱推导出新的BLER上限。
定理2单比特错误事件
与第i个极化信道相关联,该错误事件的概率可以通过将许多码元的错误概率相加来确定上限。
给定
,假设传输的信息比特为零,即
,那么单比特错误事件
的错误概率为:
(9)
证明:参考文献[1],因为对称的 B-DMC信道W,合成信道
和极化信道
可以写成:
(10)
以及
(11)
令
,
,可以得到:
,根据式:
展开得到:
(12)
令
,就得到:
利用并集的性质,完成证明。
由定理2我们发现错误事件
与通过极化信道
传输的码字相关。因此,我们引入以下定义:
定义1给定码字长度N,定义零陪集和一陪集分别为:
其中,
表示由向量张成的空间。
表示生成矩阵第i行。
定义2将一陪集
中非零码字的重量分布称为陪集码谱,用
表示,
。其中,d表示非零码字的重量,
表示一陪集中,码重为d的码字个数。
不加证明的直接给出陪集码谱与块误码率之间的关系:
定理3 AWGN信道下,利用BPSK调制时,
的错误概率上限为:
SC译码下的块误码率上界:
(13)
通过上面的错误率的分析,我们认识到陪集码谱的重要性,事实上,在SCL译码器中,在中间步骤i,即译到第i个比特时,一条译码路径可以定义为:
此时,SC实质上是在决定所接收向量更可能落入
对应的码字空间还是
所对应的空间,这是可以使用陪集进行解释的。另外,根据PM值的定义,PM值的大小反映了接收信号与译码路径对应的候选码字之间欧氏距离的大小。在SCL译码器中,零陪集和一陪集之间的最小码距及码谱与PM值在第i个步骤时的更新(即路径度量惩罚值)是密切相关的:零陪集和一陪集之间的最小码距越大,错误路径受到的PM惩罚值越大。由于SCL译码器在每个步骤最后都会进行路径剪枝,即从2L条路径中剪除PM值最大的L条路径,保留PM值最小的L条路径。若要防止正确路径在中间步骤i被丟弃,需要使得错误路径受到的PM惩罚尽量大于正确路径受到的PM惩罚。
从码字距离的角度来看,这可以等效为使得零陪集和一陪集之间的最小码距尽量大,从而使得正确路径更容易被识别。综上,对于陪集码谱的研究是很有实践意义的。
3. 主要结果
本节旨在提出一种计算二阶极化核和三阶极化核多对应的极化码的陪集码谱的计算方法,并且给出二阶核三阶核混合的混合核极化码的陪集码谱的定义方法。
在给出具体的定理前,我们首先定义一个非负的上三角矩阵T,它的对角线元素均为1,并且假设
,
是i.i.d. ~Bernoulli(
) r.v.
记
。
是
的第i个向量,
是
的第i个行向量。注意到:
那么根据陪集的定义,对于m阶段第i个陪集谱
只需求枚举
重量为d的个数。
表示m阶段第i个陪集谱
中重量为d的码字所占的比例。
那么有:
(14)
定理4对于只有二阶核
构成的极化码,
计算公式如下:
1):如果
,
2):如果
,
边界条件为
,且
证明:
当
时,
由于二阶核的结构以及克罗内克积的构造方法,可以令
,
。其中,
是长度为
的全零向量,
,
。
显然,
和
是独立的,并且
,
。我们假设
,
并且c表示
和
对应位置上均为1的数量,用
表示,
表示
除去指标集
的其他元素,有
。
因为
得到
。不论c的大小,上式一直成立,当且仅当
。根据全概率公式有:
最后一个等式是因为
。下面计算
综上,如果
,
当
时,
直接得到
得证。
定理5对于只有三阶核
的极化码,
计算公式如下:
如果
,
求和条件必须满足
。
如果
,
如果
,
边界条件为:
对于上述定理,利用相同的方法,可以得到结论。
在混合二阶和三阶内核的情况下,我们的重点始终是调整初始条件。在Tanner图中,当我们遍历二阶极化核时,定理4就会发挥作用,而定理5则会给出我们遍历三阶极化核的所需的计算表达式。下面给出一个常用的生成矩阵的形式的陪集码谱的计算方法。
定理6混合核极化码的生成矩阵
,那么它的
计算方式为:
当
时,
当
时,
此时,
通过定理5计算得出。
下面,简单给出两个计算的例子。首先,生成矩阵
的混合核极化码的陪集码谱的概率矩阵为:
交换
和
,得到:
这也进一步证明混合核极化码与极性码不同,克罗内克积的因子顺序很重要,因为不同的顺序会产生不同的变换矩阵,具有不同的极化行为,从而产生不同的冻结集。
以上,针对二阶核、三阶核和多核极化码的陪集码谱的计算方法的递归方法全部给出。虽然,这只是对SCL译码器每个阶段的陪集码谱的精确值的一种近似,但对于我们分析SCL译码器各个阶段的状态提供了巨大帮助。正如前文所述,在SCL译码器中,零陪集和一陪集之间的最小码距及码谱与PM值在第i个步骤时的更新(即路径度量惩罚值)是密切相关的:零陪集和一陪集之间的最小码距越大,错误路径受到的PM惩罚值越大,从码字距离角度,这等效于要使得零陪集之间的最小码距尽量大,从而使得正确路径更容易被识别。陪集码谱的研究对我们设计更高效的码字方案有着重大的意义。
当然,对于编码领域的研究来说,Polar码的瓶颈仍然存在,例如,我们没有办法对SCL译码器各个阶段进行理论分析。本文仅仅在理论上提出了一种陪集码谱近似的计算方法,进而大致了解各个阶段的译码情况。事实上,如果能求出确切的Polar的码谱,而不是陪集码谱,那将从根本上解决对SCL译码器各个阶段没有办法理论刻画的问题。对于混合核极化码来说,硬件的需求恐怕是最紧迫的,虽然理论上会比普通的二阶核的极化码优秀,但是对于硬件架构来说,相比于二阶核过于复杂。
4. 结论
本文首先回顾了极化码以及混合核极化码的概念,提出了一种计算混合核极化码的陪集码谱的概率方法,并提供了一个递归公式。这种方法大大有助于今后分析SCL解码各个阶段的状态。
本文的方法只是从理论上给出了陪集码谱的近似算法,没有给出的精确的结果,这是很困难的事情,可以作为后续的研究方向。另外,根据本文给出的结论,也可以利用该结果设计一种新型的极化码的设计方案。
NOTES
*通讯作者。