对抗式域自适配以对抗学习的方式最小化源领域中的任务损失和最大化域混肴损失,学习到领域间的共享特征空间,从而进行特征适配(分布式配),辅助目标领域学习任务,是当前域自适应研究,被广泛应用到在行人重识别、图像分类和情感分析等领域。本文梳理了当前对抗式域适配研究工作,按照源领域和目标领域标签类别空间异同将其分为同构对抗式域自适配和异构对抗式域自适配两种子类型。依次详细介绍边缘分布同构对抗式域自适配、条件分布对抗域自适配、联合分布对抗域自适配和动态分布对抗域自适配、开放集对抗式域自适配、局部对抗式域自适配和通用对抗式域适配六类子域自适配的研究问题、研究思路及主要研究工作。 Adversarial domain adaptation can be used to learn a shared feature space across domains by minimizing the task loss in the source domain and maximizing the domain confusion loss. Then the task in the target domain can get assistance from feature adaptation (distributed adaptation). Now, adversarial domain adaptation is widely used in the fields of pedestrian re-recognition, image classification, sentiment analysis, and so on. This paper summarizes the current research work of adversarial domain adaptation and divides it into two subtypes: homogeneous adversarial domain adaptation, heterogeneous adversarial domain adaptation according to whether the label space of the source domain and the target domain is the same. This paper also introduces in detail the research problems, research ideas, and main research work of six kinds of subdomain adaptation: marginal distribution adversarial domain adaptation, conditional distribution adversarial domain adaptation, joint distribution adversarial domain adaptation, dynamic distributed adversarial domain adaptation, open set adversarial domain adaptation, partial adversarial domain adaptation, and universal adversarial domain adaptation.
对抗式域自适配以对抗学习的方式最小化源领域中的任务损失和最大化域混肴损失,学习到领域间的共享特征空间,从而进行特征适配(分布式配),辅助目标领域学习任务,是当前域自适应研究,被广泛应用到在行人重识别、图像分类和情感分析等领域。本文梳理了当前对抗式域适配研究工作,按照源领域和目标领域标签类别空间异同将其分为同构对抗式域自适配和异构对抗式域自适配两种子类型。依次详细介绍边缘分布同构对抗式域自适配、条件分布对抗域自适配、联合分布对抗域自适配和动态分布对抗域自适配、开放集对抗式域自适配、局部对抗式域自适配和通用对抗式域适配六类子域自适配的研究问题、研究思路及主要研究工作。
迁移学习,同构对抗式域自适配,异构对抗式域自适配
Xuemei Zhang1, Yancong Zhou2*
1School of Science, Tianjin University of Commerce, Tianjin
2School of Information Engineering, Tianjin University of Commerce, Tianjin
Received: Nov. 6th, 2021; accepted: Dec. 6th, 2021; published: Dec. 13th, 2021
Adversarial domain adaptation can be used to learn a shared feature space across domains by minimizing the task loss in the source domain and maximizing the domain confusion loss. Then the task in the target domain can get assistance from feature adaptation (distributed adaptation). Now, adversarial domain adaptation is widely used in the fields of pedestrian re-recognition, image classification, sentiment analysis, and so on. This paper summarizes the current research work of adversarial domain adaptation and divides it into two subtypes: homogeneous adversarial domain adaptation, heterogeneous adversarial domain adaptation according to whether the label space of the source domain and the target domain is the same. This paper also introduces in detail the research problems, research ideas, and main research work of six kinds of subdomain adaptation: marginal distribution adversarial domain adaptation, conditional distribution adversarial domain adaptation, joint distribution adversarial domain adaptation, dynamic distributed adversarial domain adaptation, open set adversarial domain adaptation, partial adversarial domain adaptation, and universal adversarial domain adaptation.
Keywords:Transfer Learning, Homogeneous Adversarial Domain Adaptation, Heterogeneous Adversarial Domain Adaptation
Copyright © 2021 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
深度学习被广泛运用到图像视觉、自然语言处理和语音识别等各个领域,研究成果丰富。训练出一个泛化能力足够强的深度学习模型需要大量带标注的数据。在实际应用中,标注数据却是十分稀缺且获取难度较大的。特别是在大数据时代,海量数据不仅结构各异,分布也不同,难以确保收集的训练数据和测试数据满足机器学习模型训练中独立同分布的假设。因此,深度学习的发展面临着标注数据和训练数据稀缺的问题。
迁移学习有助于解决深度学习中标注数据稀缺的问题。它不但放松了数据独立同分布这一限制假设的要求,而且能够借助辅助领域知识来研究新领域,节约模型建立成本。同时,深度学习特有的分层结构带来的多层次特征学习,能够显示出不同领域数据的共享特征,即不能用来区分领域的特征,为迁移学习的实现提供了多种实现结构。一方面深度学习提供多视角,研究人员可以根据不同层的输入进行适当的处理,找到不同领域间的共享特征;另一方面深度学习的对抗结构能够自动找到不同领域间的共享特征,用特征提取器来提取领域特征,让判别器根据特征区分不同的领域,双方在博弈的过程中达到平衡时,领域间重叠部分即共享特征即可被筛选出。简而言之,深度学习天然适合迁移学习,其对抗网络结构可能成为迁移学习的范式。因此,基于对抗网络的深度迁移算法是迁移学习的研究热点之一。
对抗式域适配是深度对抗迁移学习算法的子领域,本文对当前对抗式域适配研究的梳理,主要贡献如下:
1) 本文对对抗式域适配进行定义,按照源领域与目标领域的标签类别空间异同分为同构域自适配和异构对抗域自适配两类;
2) 详细介绍了同构对抗式域适配和异构对抗式域适配研究的主要思路及重要研究。
首先给出文中所用的相关符号,具体说明如表1所示。
符号 | 含义 |
---|---|
上(下)标s/t | 表示源领域或目标领域 |
D | 领域 |
T | 任务 |
x / X / X | 特征向量/矩阵/空间 |
y / Y | 标签类别向量/空间 |
n | 样本数 |
P ( X ) | 边缘概率分布 |
P ( y | X ) | 条件分布 |
f ( X ) | 目标领域分类模型 |
表1. 符号说明表
对抗域自适配属于迁移学习领域,常用到迁移学习定义中“领域”和“任务”两个重要概念,目前广泛使用的定义是Pan等人 [
领域D定义为由 � 维特征空间 X 和边缘概率分布 P ( X ) 组成,即 D = { X , P ( X ) } ,其中样本 X = { x 1 , ⋯ , x n } ∈ X 。给定领域 D ,任务 T 定义为由标签类别空间 Y 和预测模型 f ( X ) ,即 T = { Y , f ( X ) } ,按统计学的观点,预测模型 f ( X ) 可以解释为条件概率分布 P ( y | X ) ,即 f ( X ) = P ( y | X ) ,其中 y ∈ Y 。故迁移学习的定义如下:
定义2.1 (迁移学习) [
迁移学习研究思路主要是确定源领域和目标领域的相似性,减小领域间的差异,对抗网络结构进行功能实现。对抗网络的生成器可以作为特征提取器,提取领域间的共享特征即领域间的“相似性”;判别器可以作为领域判别器,区分源领域和目标领域特征,与特征提取器进行博弈,双方在博弈的过程中达到平衡时,领域间重叠部分即共享特征即可被筛选出,其差异也被减小,因此研究者将对抗网络与迁移学习结合在一起,形成一个新的研究领域——对抗式域自适配。对抗域自适配网络一般由特征提取器F,标签分类器G和领域判别器D三部分组成,其定义如下:
定义2.2 (对抗式域自适配):给定一个迁移学习任务 〈 D s , T s , D t , f t ( ⋅ ) 〉 , f t ( ⋅ ) 是由对抗网络组成的非线性的函数。
根据源领域和目标领域标签类别空间异同,对抗域自适配包括同构对抗式域自适配和异构对抗式域自适配两种子类型。同构对抗式域自适配根据对边缘分布和条件分布的侧重可以分为边缘分布同构对抗域自适配、条件分布对抗域自适配、联合分布对抗域自适配和动态分布对抗域自适配四种子类型;异构对抗式域适配根据源领域和目标领域标签类空间交集情况可以分为开放集对抗式域自适配、局部对抗式域自适配和通用对抗式域适配三种。
本节将逐一介绍上述对抗式域自适配算法。
在同构域自适配中,常给定源领域 D S = { ( x i s , y i s ) } i = 1 n s ,有 n s 个带标签样本,目标领域 D t = { ( x i t ) } i = 1 n t ,有 n t 个无标签样本,假设源领域和目标领域的标签类别空间是相同的,即 Y s = Y t 。源领域数据的概率分布为p,目标领域的概率分布为q,且 p ≠ q 。现需要函数 f ( ⋅ ) 使得p和q的差异减小,且目标领域的分类误差有界,即 R t ( f t ) = E ( x , y ) ~ [ f t ( x ) ≠ y ] 有界。
这里的数据分布主要是指领域的边缘分布 P ( X ) 、条件概率分布 P ( y | X ) 和联合分布 P ( X , y ) ,根据源领域数据分布和目标领域不同的数据分布情况,在研究中需要对领域间的概率分布适配有所侧重,如图1所示(改编自文献 [
对抗式域自适配算法结构一般由特征提取器F,标签分类器G和领域判别器D三部分组成。特征提取器F的输入是源领域数据 X s 和目标领域数据 X t ,输出是数据特征f;标签分类器G的输入是f,输出是样本估计标签 y ^ = P ( y | X ) ;领域判别器的输入是f,输出是样本估计领域标签 d ^ ≈ P ( X ) 。
后文将介绍边缘分布同构对抗域自适配、条件分布对抗域自适配、联合分布对抗域自适配和动态分布对抗域自适配四种同构对抗式域自适配。
图1. 源领域和不同分布情况的目标领域图示
当源领域是对目标领域1进行适配时,两个领域的整体分布相似度低,即 P s ( X ) ≠ P t ( X ) ,具体到每个标签类中数据分布差异较小即 P s ( y | X ) ≈ P t ( y | X ) 时,对抗域自适配的主要任务是减小源领域和目标领域间边缘分布的差异,其目标函数可以简写为:
min D s , D t D i s t ( P s ( X ) , P t ( X ) ) (1)
例如,经典的对抗域自适配算法Domain-Adversarial Neural Network (DANN) [
当源领域是对目标领域2进行适配时,两个领域的整体分布相似度高即 P s ( X ) ≈ P t ( X ) ,具体到每个标签类中数据分布差异较大时,对抗域自适配的主要任务是减小源领域和目标领域间条件分布的差异,其目标函数可以简写为
min D s , D t D i s t ( P s ( y | X ) , P t ( y | X ) ) (2)
例如,TANG等人 [
联合分布同构对抗式域自适配其目标是减小源领域和目标领域的联合概率分布 P ( X , y ) 距离,完成迁移学习。由于目标领域的标注类别空间是未知,其联合概率分布则无法获知,源领域和目标领域的联合概率分布差异无法直接进行度量。因此,源领域和目标领域之间联合概率分布距离可以用边缘分布距离和条件分布距离之和近似估计,或者用边缘分布和条件分布的乘积估计源领域和目标领域的联合概率,再进行距离度量,即
min D s , D t D i s t ( P s ( X , y ) , P t ( X , y ) ) ≈ D i s t ( P s ( y | X ) , P t ( y | X ) ) + D i s t ( P s ( X ) , P t ( X ) ) (3)
或
min D s , D t D i s t ( P s ( X , y ) , P t ( X , y ) ) ≈ D i s t ( P s ( y | X ) P s ( X ) , P t ( y | X ) P t ( X ) ) (4)
例如,Multi-Adversarial Domain Adaptation (MADA) [
前面三种情况均对源领域和目标领域的数据分布差异作出假设,且默认边缘分布和条件分布自适配是同等重要的。若目标领域的数据分布是未知的,源领域和目标领域边缘分布和条件分布的差异是无从获知的,则对抗域自适配中边缘分布适配和条件分布适配的重要性是难以评估的,如图1中源领域对未知目标领域进行对抗域自适配。因此,WANG等人 [
min D s , D t ( 1 − μ ) D i s t ( P s ( X ) , P t ( X ) ) + μ D i s t ( P s ( y | X ) , P t ( y | X ) ) (5)
Dynamic Adversarial Adaptation Network (DAAN) [
μ = 2 ( 1 − L g ) 2 ( 1 − L g ) + 1 | Y s | ∑ k = 1 | Y s | 2 ( 1 − 2 L l k ) (6)
如图2所示,实线圈代表源领域标签类别空间,虚线圈代表目标领域标签类别空间,图2(a)表示闭集域自适配场景即源领域和目标领域的标签类别空间一致, Y s = Y t ,3.1节中同构对抗式域自适配算法均适用于此应用场景;图2(b)、图2(c)和图2(d)依次为开放集、局部和通用域自适配场景,源领域和目标领域标签类别空间是有差异的,即 Y s ≠ Y t ,下文将依次给出这三种场景的详细介绍。
图2. 从全封闭集到通用域自适配标签类别空间示意图
开放集域自适配(Open Set Domain Adaptation, OSDA) [
Saito等人 [
局部域自适配(Partial Domain adaptation, PDA) [
此场景由清华大学龙明盛教授团队提出,可以看作开集的一种特殊情况。他们在深度对抗网络的基础上提出Selective Adversarial Network (SAN) [
通用领域适配(Universal Domain Adaptation, UniDA) [
ξ = | Y s ∩ Y t Y s ∪ Y t | (7)
闭集领域自适应问题可以看作是UniDA的一种特殊情况, ξ = 1 。 ξ 越小,说明领域间可迁移的知识越少,领域自适应的难于越大。在UniDA情况中, ξ 是未知的,领域自适应模型需要在不同 ξ 值下取得较好的结果。同时,模型必须要能够对目标领域中来自 C ¯ t 和C的数据进行分类,即得到一个模型f,使得模型分类误差期望 E ( X , y ) ~ q C [ f ( X ) ≠ y ] 最小。
Universal Adaptation Network (UAN) [
本文对对抗式域自适配研究进行了总结和分析。对抗式域自适配按照源领域和目标领域标签类别空间的异同可分为同构对抗式域自适配和异构对抗式域自适配两种子类。同构对抗式域自适配属于闭集域自适配,运用对抗方式实现源领域和目标领域的概率分布适配,包含边缘概率分布适配、条件概率分布适配、联合分布适配和动态分布适配四种;异构对抗式域自适配根据源领域和目标领域标签类别空间的关系,可以分为开放集对抗式域自适配、局部集对抗式域自适配和通用对抗式域自适配三种,当前这方面的研究具有巨大潜力。
张雪梅,周艳聪. 对抗式域适配迁移学习研究Research on Adversarial Domain Adaptation[J]. 计算机科学与应用, 2021, 11(12): 2853-2861. https://doi.org/10.12677/CSA.2021.1112290
https://doi.org/10.1109/TKDE.2009.191
https://doi.org/10.1145/3360309
https://doi.org/10.1007/978-3-319-58347-1_10
https://doi.org/10.1609/aaai.v34i04.6123
https://ieeexplore.ieee.org/document/8953920
https://doi.org/10.1109/CVPR.2019.00517
https://doi.org/10.3390/e22010096
https://doi.org/10.1609/aaai.v34i04.5757
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/17067
https://doi.org/10.1145/3343031.3351070
https://doi.org/10.1145/3240508.3240512
https://doi.org/10.1109/ICDM.2019.00088
https://doi.org/10.1109/ICCV.2017.88
https://doi.org/10.1007/978-3-030-01228-1_10
https://ieeexplore.ieee.org/document/8953906
https://doi.org/10.1109/CVPR.2019.00304
https://ieeexplore.ieee.org/document/8578386
https://doi.org/10.1109/CVPR.2018.00288
https://ieeexplore.ieee.org/document/8954395
https://doi.org/10.1109/CVPR.2019.00310
https://openaccess.thecvf.com/content_CVPR_2019/ html/You_Universal_Domain_Adaptation_CVPR_2019_paper.html
https://link.springer.com/10.1007/978-3-030-585 55-6_34
https://doi.org/10.1007/978-3-030-58555-6_34