现阶段,基于深度学习的图像处理和识别技术已经发展的十分成熟,但在某些图像识别任务中由于深度学习技术的特点,一些深度神经网络模型层数较多导致的学习能力较强,将图像数据样本中的特征学习的过于充分,使得神经网络模型在训练数据上出现过拟合现象。同时,基于深度学习的图像处理算法训练的模型的好坏与数据集的质量、规模息息相关,但由于客观原因存在获得的图像数据集小、图像质量差,样本分布不均衡等现象。针对上述问题,研究人员提出通过使用图像数据增强技术实现对模型的输入数据的规模、质量和分布情况进行优化,将数据增强后的数据集用于深度学习模型将有效降低出现过拟合现象的概率。本文的主要工作是对现有的图像数据增强技术进行讨论,从传统图像处理方法和基于深度学习数据增强方法两方面进行梳理总结,其中传统图像处理方法有几何变换、颜色变换和像素变换;基于机器学习的图像数据增强方法有自动数据增强方法、基于生成对抗网络数据增强方法和基于自动编码器和生成对抗网络组合的数据增强方法。本文着重对图像融合、信息删除以及基于生成对抗网络的图像数据增强方法等技术进行介绍,并且对文中提出的数据增强方法的思想及其优缺点进行讨论,为研究人员在不同图像任务中利用对应的数据增强方法来优化数据集从而提高模型准确率提供研究思路。 Image processing and recognition technology based on deep learning has developed very well. However, in some image recognition tasks, due to the characteristics of deep learning models, some deep neural network models have strong learning ability due to the large number of layers, and the features in the images are learned too fully, which makes the neural network model appear fitting phenomenon on the training data. At the same time, the quality of the model trained by the image processing algorithm based on deep learning is closely related to the quality and scale of the dataset. However, due to the small dataset, poor image quality and unbalanced sample distribution, etc. In order to solve the above problems, the researchers proposed to optimize the scale, quality and distribution of the input data of the model by using image data augmentation technology. Applying the augmented dataset to the deep learning model will effectively reduce the probability of over-fitting. The main contribution of this paper is to discuss the existing image data augmentation technology, and summarize the traditional image processing methods and data augmentation methods based on deep learning, among which the traditional image processing methods include geometric, color, and pixel transformation. Image data augmentation methods based on machine learning include Auto Augment, methods based on GAN and methods based on combination of AE and GAN. In this paper, the technologies of image fusion, information deletion and image data augmentation method based on GAN are introduced, and the ideas, advantages and disadvantages of the data augmentation methods proposed in this paper are discussed, which provides ideas for researchers to optimize datasets and improve the accuracy of models by using corresponding data augmentation methods in different image tasks.
现阶段,基于深度学习的图像处理和识别技术已经发展的十分成熟,但在某些图像识别任务中由于深度学习技术的特点,一些深度神经网络模型层数较多导致的学习能力较强,将图像数据样本中的特征学习的过于充分,使得神经网络模型在训练数据上出现过拟合现象。同时,基于深度学习的图像处理算法训练的模型的好坏与数据集的质量、规模息息相关,但由于客观原因存在获得的图像数据集小、图像质量差,样本分布不均衡等现象。针对上述问题,研究人员提出通过使用图像数据增强技术实现对模型的输入数据的规模、质量和分布情况进行优化,将数据增强后的数据集用于深度学习模型将有效降低出现过拟合现象的概率。本文的主要工作是对现有的图像数据增强技术进行讨论,从传统图像处理方法和基于深度学习数据增强方法两方面进行梳理总结,其中传统图像处理方法有几何变换、颜色变换和像素变换;基于机器学习的图像数据增强方法有自动数据增强方法、基于生成对抗网络数据增强方法和基于自动编码器和生成对抗网络组合的数据增强方法。本文着重对图像融合、信息删除以及基于生成对抗网络的图像数据增强方法等技术进行介绍,并且对文中提出的数据增强方法的思想及其优缺点进行讨论,为研究人员在不同图像任务中利用对应的数据增强方法来优化数据集从而提高模型准确率提供研究思路。
数据增强,图像数据集,图像处理,深度学习
Xiaoshuo Feng1, Yue Shen2, Dongqi Wang2*
1Naval Research Institute, Beijing
2Software College, Northeastern University, Shenyang Liaoning
Received: Jan. 17th, 2021; accepted: Feb. 12th, 2021; published: Feb. 19th, 2021
Image processing and recognition technology based on deep learning has developed very well. However, in some image recognition tasks, due to the characteristics of deep learning models, some deep neural network models have strong learning ability due to the large number of layers, and the features in the images are learned too fully, which makes the neural network model appear fitting phenomenon on the training data. At the same time, the quality of the model trained by the image processing algorithm based on deep learning is closely related to the quality and scale of the dataset. However, due to the small dataset, poor image quality and unbalanced sample distribution, etc. In order to solve the above problems, the researchers proposed to optimize the scale, quality and distribution of the input data of the model by using image data augmentation technology. Applying the augmented dataset to the deep learning model will effectively reduce the probability of over-fitting. The main contribution of this paper is to discuss the existing image data augmentation technology, and summarize the traditional image processing methods and data augmentation methods based on deep learning, among which the traditional image processing methods include geometric, color, and pixel transformation. Image data augmentation methods based on machine learning include Auto Augment, methods based on GAN and methods based on combination of AE and GAN. In this paper, the technologies of image fusion, information deletion and image data augmentation method based on GAN are introduced, and the ideas, advantages and disadvantages of the data augmentation methods proposed in this paper are discussed, which provides ideas for researchers to optimize datasets and improve the accuracy of models by using corresponding data augmentation methods in different image tasks.
Keywords:Data Augmentation, Image Dataset, Image Processing, Deep Learning
Copyright © 2021 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
随着人工智能技术的不断发展,基于深度学习的图像处理技术愈发成熟,应用也越来越广泛。由数据集驱动的人工智能技术训练的模型往往需要巨大规模的数据集,但由于时间成本和金钱成本的限制,可能常会遇到图像数量少、图像质量差和类别不均衡 [
基于图像的数据增强能够增加训练样本的多样性,如通过翻转、添加噪声等基础图像处理操作或根据现有数据生成新的样本进行数据集扩充、数据质量的增强。使用数据增强方法后的数据集训练模型,以达到提升模型的稳健性、泛化能力的效果。
本文主要研究了基于图像的数据增强技术,并对其进行归类整理,着重介绍各类技术的特点及其解决的问题,对其存在的不足进行分析。对图像数据增强技术待解决问题进行总结,为相关研究人员提供详尽的技术发展状况报告。
数据增强,也叫数据增广。数据增强方法的本质实际上是在现有的有限数据的基础上,在不实际收集更多数据的前提下,而让数据产生等价于更大数据量的价值,即根据现有数据样本按照规则生成增量数据的过程。数据增强方法不仅是数据样本量的增多,更多的是数据本身特征的“增强”。样本数据是整体数据的抽样,当样本数据量足够大时,样本的分布情况和总体的分布情况应相似。但由于客观原因收集的样本数据不够完整,这时则可通过数据增强方法生成与真实数据分布更加相似的新样本的数据;深度学习网络模型拥有极强的学习能力,因此学习到的一些无用的信息特征对最终的结果会产生负面影响,而数据增强技术可实现按照需求针对数据施加约束来增加先验知识的前置过程,如将一些信息删除或补全,来减少负面影响对处理图像任务的模型性能的影响。
现阶段数据增强方法的使用方式主要被分为两种:离线增强和在线增强。离线增强是指对数据集执行一次性转换,该操作可成倍增加数据样本的数量。使用数据增强方法产生的样本数量为增强因子数与原始数据样本量的乘积。离线增强由于一次性处理全部数据集,因此适用于较小的数据集。在线增强使在获取批量的数据后就对其进行数据增强操作,随后增强后的数据就被送入机器学习模型进行训练,由于其批量处理的特性,因此一般适用于大数据集。
数据增强方法主要有作用于图像的和作用于文本的两类,本文主要介绍基于图像的数据增强方法 [
传统的图像数据增强方法,通常使用图像处理技术 [
针对数据集进行空间几何变换,常常会存在改变图像原始的标签信息或者增加一些不相关数据的情况,这称之为不安全的转换。例如对文字的识别任务中,对图像进行翻转操作是没有意义的。但对于存在位置偏差的数据集,用几何变换技术可以很好解决问题。但在真实情况下,训练集与测试集的数据的差异十分复杂,除了移位旋转等操作外,还包括其他复杂变换。因此几何变换的应用范围相对有限。
图像翻转操作包括对图片进行垂直和水平翻转,其中垂直翻转实现需要水平翻转后再图像进行180˚旋转处理,水平翻转比垂直翻转应用更为广泛。这种技术的优点是易于实现,此外图像翻转在CIFAR-10数据集上具有较好的效果,但对文本识别的数据集,如MNIST,使用图像翻转会更改其标签信息 [
图1. 基于图像的数据增强方法分类
进行图像旋转后得到的图像与原始图像的维数是否相同取决于图像的旋转度数以及原始图像的形状。当长方形的图像旋转180˚或者正方形的图像旋转90˚、180˚、270˚时,旋转后的图像与原始图像能够保持一致的维数。与图像翻转操作一样,在特定的数据集上,例如文本识别数据集MNIST,其图像变换的安全性取决于图像的旋转度数,随旋转度数的增加,转换后的图片不在保留原标签信息。
图像的随机剪裁可视为从原始图像上进行随机抽样,再将抽样获得的图像数据样本恢复为原始图像大小。
图像缩放分为向外缩放和向内缩放。图像缩放与图像剪裁不同的是向外缩放会得到比原始图像更大尺寸的图像,再从中剪裁出与原始图像大小相同的图像,向内缩放则缩小原始图像的大小,并针对其超出边界的部分进行填充操作从而获得与原始图像尺寸一致的图像。
图像移位是指不改变图像的尺寸而将图像在以坐标轴为移动参考进行横轴和纵轴的移动,并针对边缘部分进行填充处理。在进行了图像移位操作后,大部分的图像数据中对于图像任务有用的部分将位于图像的边缘部分,因此深度学习模型在进行计算机视觉任务训练时会将关注焦点转移到任意位置,而不是仅仅针对图像中心区域的学习,这种操作能够有效的提高模型的鲁棒性。
在对图像数据样本进行旋转、移位、缩放等操作后,需要将变换后的图像恢复到与原始图像尺寸一致的大小,恢复的过程通过对于图像的边缘部分进行填充操作实现。常用的图像填充方法包括:常数填充,使用常数值对图像的边缘部分进行填充,这种填充方式适用于单色背景的图像数;边界值填充,在原始图像边界的外部填充原始图像的边界的像素值,此方法适用于短距离移位。
数字图像数据通过使用长、宽和通道来表示数据。
常用的色彩空间包括:
1) 通过RGB通道的变化和叠加得到不同颜色的RGB色彩空间;
2) YUV色彩空间,其中Y表示亮度,UV表示色度;
3) HSV颜色模型,H表示色调,S表示饱和度,V表示明暗程度。
此外还包括I1I2I3,L*a*b* [
在色彩通道上进行图像亮度调节以及色度调剂是数据增强的一种有效方式。通常情况下,采集到的图像数据的亮度覆盖范围不足,为达到深度学习对亮度鲁棒性的基本要求,进行亮度转换操作成为基于色彩空间的数据增强技术中最常用的一种方法。在图像数据中,亮度偏暗的图像,亮度方差也更小,从而整体的亮度范围被压缩。Gamma变换通过非线性变换将过亮或过暗的图片进行调整。直方图均衡化是更加高级的色彩空间增强方式,对对比度相近的图像使用该技术可增强局部的对比度而不影响整体的对比度,这种方式对过亮或过暗的图像数据能够实现有效的数据增强。
色彩空间转换是色彩特征提取的一种非常有效的方式。不同的色彩空间表示形式虽各有特性,但由于其同构性,可以互相转换。图像通常位于三维RGB颜色空间中,但RGB颜色空间在感知上不均匀,颜色的接近度并不表示颜色相似性。色彩空间转换通过将图像在RGB、HSV、LAB等不同的颜色空间上转换,使以不同的方式对每个分量进行加权,对于不同的数据集,通常需要选择合适的颜色空间转换来提高模型的性能。
色彩空间转换的缺点除了会消耗大量内存空间和时间,其也会产生不好的效果,例如人脸识别需要的关键信息使黑白黄,但若出现大量红绿等颜色信息,则是不合理的。此外,颜色空间转换的图像增强效果是有限的,虽然比几何变换更具多样性,但不恰当的使用可能会使模型发生欠拟合。
Ze Lu等人 [
图像噪声是指在原始图像上随机叠加一些孤立的能够引起较强的视觉效果像素点或像素块,以扰乱图像的可观测信息,使其能够更好的提高卷积神经网络模型的泛化能力。常见的噪声有:椒盐噪声、高斯噪声、Coarse Dropout、Simplex Noise Alpha、Frequency Noise Alpha。它们都是以不同的方式生成以不同数值填充的不同大小像素遮掩点,再与原图混合,以扰乱原始图像的一些特征。
模糊的本质上可视为对原始图像进行卷积操作,常用的方法是高斯模糊,该方法服从的卷积核矩阵服从二维正态分布,以减少各像素点值的差异从而降低细节层次,使图像数据的像素平滑化,达到模糊图片的效果。模糊半径越大,图像就越模糊。
图像融合技术,通过求两张图像的像素值的均值将两张图片混合在一起,或者是随机裁剪图像并将裁剪后的图像拼接在一起形成新图像。当混合来自整个训练集的图像而不是仅来自同一类别的实例的图像时,可以获得更好的结果。图像融合方法从人的视角看毫无意义,但从实验的角度上观察,确实能够提升精度。
1) SMOTE [
采集到的数据集常存在的问题是样本类别不平衡问题,样本类别之间的较大差距会影响分类器的分类性能。SMOTE方法提出以小样本类别合成新的样本来解决样本不平衡问题,该方法将提取的图像特征映射到特征空间,确定好采样倍率后,选取几个最相邻的样本,从中随机选取一个连线,并在连线上随机选取一点作为新样本点,重复至样本均衡。杜金华 [
2) MIXUP [
ERM方法会在各个类间形成明确的决策边界,而Mixup方法是一种基于线性过渡的数据增强的方法,使用mixup能够使得数据样本之间像素点是渐变的,使样本分类边界模糊化,使得非0即1的预测变为较为平滑的预测效果,抑制模型在进行预测分类时的不稳定性,增强模型的泛化能力。这种方法从训练数据中随机抽取两条数据将抽取到的图像数据的像素值进行符合Beat分布的融合比例的线性加权求和,同时将样本对应的One-hot向量标签也对应加权求和,预测生成的新样本与加权求和后的标签的损失,进行反向求导并更新参数,同时抽取批量数据并进行随机打散后进行加权求和。在CIFAR、 ImageNet图像分类数据集语音数据集中使用该方法能够实现模型性能的提升,并且降低模型对不完整标签的记忆。mixup方法尽管再在程上取得很好地效果,但缺乏理论支撑,且该方法需要较长的时间才能收敛出较好的结果。ERM方法与Mixup方法的对比如图2所示。
图2. ERM与Mixup对比
3) CUTMIX [
CutMix是一种改进的随机擦除策略,随机擦除用一块矩形掩码覆盖原始图像,实现擦除图像上的一部分像素信息,但其缺点是减少了训练图像上的包含信息的像素比例,并且需要大量的计算,较为耗时。CutMix方法将随机选中的区域填充其他图像的补丁区域。这种方法与Mixup方法相比,改进了混合图像后,人眼无法主观辨别图像标签的情形。在擦除区域添加其他样本信息,进一步增强模型定位能力。CutMix在CIFAR和ImageNet分类任务以及对ImageNet上的弱监督的本地化任务领先于最新的数据增强策略,同时,在Pascal检测和MS-COCO图像字幕基准测试中获得了性能提升。这种方法改进了针对输入损坏及其模型失配检测性能的模型鲁棒性。
4) Sample Pairing [
Sample Pairing方法常用于图像分类任务中的数据增强,该方法首先从训练集中随机选择两张图片,与Mixup方法不同的是,随机选择图像的方式是从训练集中随机抽取两张图片并分别进行基础数据增强操作(如随机翻转等)处理后,再经像素取平均值,最后叠加合成一个新的样本。而标签为原样本标签中的一种,理论上新样本数量平方增加。这种方法能够显著提高所有测试数据集分类准确性。使用GoogleNet的ILSVRC 2012数据集的top-1错误率从33.5%降低到29.0%,而在CIFAR-10数据集中则从8.22%降低到6.93%。当训练集中的样本数量非常小时,SamplePairing技术大大提高了模型预测的准确性。因此该技术对于训练数据量有限的任务(例如医学成像任务)更有价值。SamplePairing方法实现简单,效率大大增加,但缺少相应的理论支撑。
1) 随机擦除 [
随机擦除方法与添加噪声方法相似,通过随机选取图像中的矩形区域,并使用随机像素值对其遮盖。该技术可以很容易嵌入大部分卷积神经网络模型中。随机擦除的好处在于迫使模型去学习有关图像的更多描述性特征,从而防止过拟合某个特定视觉特征,确保网络关注整个图像,而不只是其中的一部分。随机擦除的缺点是不一定会保留标签(例如文本8->6)。Zhun Zhongy等人将随机擦除方法用于图像分类、物体检测和人员重新识别任务,并通过该方法实现了性能的提升。使用随机擦除方法进行大量实验,在CIFAR、PASCAL VOC 2007、Fast-RCNN、re-ID、Market-1501、DukeMTMC-reID上表现出良好的效果。
2) CUTOUT [
与随机擦除相似,Cutout是在图像上的随机位置使用一定大小的正方形path进行0-mask剪裁。蒋芸等人提出了激活区域处理算法(Activation Region processing algorithm) [
图3. 随机擦除、Cutout和GridMask对比
3) GRIDMASK [
Pengguang等人提出的GridMask的信息删除方法平衡了删除区域与保留区域的面积,其本质是对图像进行网格覆盖,优化了cutout和随机擦除方法过度删除问题,并保持图像区域连续,易于实现且快速灵活,与以前的方法相比,GridMask在各种数据集上得到更优的效果,优于所有以前的无监督策略,包括AutoAugment [
在进行机器学习模型训练的过程中,优化模型的目标就是尽可能的实现模型的损失降低,因此为了完成这一优化目标,往往需要大量的训练数据作为支撑。传统的数据增强技术依靠对现有数据集的微小调整,包括翻转、旋转和平移等调整方法,通过这些方法对数据集的调整,会产生大量具有微小的或者巨大差别的数据集,使用这种数据集的实验方法将会把这些调整后的数据集视为与原始数据集不同的数据,从而进行模型的训练。数据增强的作用除了能够增加训练的样本数量之外,提高模型的泛化能力之外,还可以通过增加噪声数据,从而提高模型的鲁棒性。
除了传统的数据增强技术以外,近年来,随着机器学习的快速发展和广泛应用,研究人员开始将机器学习技术用于数据增强领域的研究,并取得了一定科研成果。
从数据自身的特点出发,搜索适合不同特点数据集的数据增强策略能够从体系结构搜索的角度重新定义了一种数据增强的新模式。
谷歌大脑的研究人员提出了一种自动搜索合适的数据增强策略的方法(AutoAugment) [
针对计算损耗巨大的问题,谷歌大脑的研究人员又提出了一种自动数据增强的方法,称为RandAugmentation [
自动数据增强是否或者何时需要作为一个单独的搜索阶段一直是困扰着研究人员,在该方面的突破也许能够从根本上解决自动数据增强和模型的训练过程之间的关系问题。此外
Yonggang Li等人 [
AutoAugment作为开创性的工作,提出了自动搜索策略用于数据增强,将策略的选择过程视作一个组合优化问题。但由于其需要消耗巨大的计算时间,导致其适用性较低,因此研究人员开始针对计算耗时问题提出不同的解决方案。除了上述的两种针对Autoaugment的改进方法之外,还有Population Based Augmentation [
通过基于生成对抗网络的生成建模的方式进行数据增强是现阶段较为常用的手段。生成对抗网络应用在数据增强任务上的思想主要是其通过生成新的训练数据来扩充模型的训练样本,通过样本空间的扩充实现图像分类任务效果的提升。研究人员在原始生成对抗网络框架的基础上又提出了多种不同的改进方案,通过设计不同的神经网络架构和损失函数等手段不断提升生成对抗网络的变体的性能。
DCGAN [
CycleGAN [
CycleGAN实际上是由两个对称的生成对抗网络组成的环形网络,将该模型与DCGAN进行比较后发现,该模型能够控制图像生成,而DCGAN模型则输入一个噪声后输出一张无法控制的图片。CycleGAN的结构如图4所示。
图4. CycleGAN结构:(a) 该模型由两个映射函数组成 G : X → Y 和 F : Y → X ,并包括两个对抗判别器DY和DX,DY鼓励G将X转换为与Y无法区分的输出,DX则鼓励F将Y转换为与X无法区分的输出。为了进一步的将映射规范化,该模型定义了两个“循环一致性损失”,这两个损失函数保证了将一个域转换为另一个域并再次转换回来的时候,与原始的域尽可能保持一致。(b) 前向循环一致性损失: x → G ( x ) → F ( G ( x ) ) ≈ x ,(c) 反向循环一致性损失 y → F ( y ) → G ( F ( y ) ) ≈ y [
2014年,Mehdi Mirza等人提出了Conditional GAN [
图5. Conditional GAN 的结构
尽管生成对抗网络在生成图像领域被广泛的应用,但其训练的不稳定性,以及要求大量训练数据的不适用性将导致其不同的变体方法在一些时候并不能有效的实现数据增强的任务。
自动编码器通过将其网络结构的一般用于编码,获得图像的低维向量表示,将网络结构的另一半用于解码,获得根据低维向量表示重新构造的图像数据,这种编码解码的方式能够实现训练数据样本和噪声数据样本的容量扩充,实现了利用数据增强技术提高神经网络的泛化能力和鲁棒性。
在生成对抗网络被广泛应用到生成数据任务之后,研究人员开始提出生成对抗网络与自动编码器的结合形式,通过将变体的生成对抗网络和变体的自动编码器结合而形成一个通用的学习框架来生成细粒度类别的图像,这种新颖的图像生成方式同样能够有效的完成数据增强任务。Jianmin Bao等人 [
CVAE-GAN首先使用编码器将给定的训练图像数据和类别标签编码为符合给定概率分布的隐变量,再通过生成器将从隐变量中采样得到的数据和对应的类别标签生成图像数据,将该图像数据输入到分类器和判别器中从而输入分类标签和判别标签,生成器和判别器构成了一个生成对抗网络,其中生成器尝试通过已经学会了区分真实样本和虚假样本的判别器提供的的梯度来学习真实数据分布。作者还在其论文中证明了均值特征匹配也可以用于条件图像生成任务中。CVAE-GAN方法能够在多种图像任务中取得较好的性能,包括图像生成任务、图像修复任务等,但在生成位置类别的样本方面还存在一定的可探索性。
在自动编码器和生成对抗网络的组合应用方面,Yang He等人 [
将图像生成技术用于数据增强任务的方法除了生成对抗网络以及自动编码器和生成对抗网络的组合形式之外,研究人员还提出了一些其他的方法。Qifeng Chen等人 [
针对图像数据集的数据增强技术可以分为两种类型:对数据集进行变换操作达到扩充数据集的目的;对数据集进行过采样或欠采样达到样本与真实分布相似效果。
随着深度学习技术的不断发展,应用于计算机视觉领域的深度模型也在不断的被提出。基于深度学习的数据增强技术主要从数据扩充的角度对模型进行性能上的提升,而不是改变深度模型的网络结构。现阶段的传统图像数据增强和基于深度学习的数据增强技术都在不断的发展和提出,将数据增强技术用于计算机视觉任务也正在成为学术研究的主流做法。传统图像处理方法有几何变换、颜色变换和像素变换等,而基于深度学习的图像数据增强技术主要包括:自动数据增强通过设计一种不改变深度网络架构的数据增强方法来实现具有更多不变性的数据增强策略,通过创建一个搜索空间用来保存数据增强策略,并针对不同的任务根据搜索算法的运行进行适当子策略(例如剪裁、翻转)的选择,从而实现自动数据增强的目的;而基于生成对抗网络的数据增强主要是基于生成对抗网络的机制进行生成器和判别器的设计,以及生成对抗网络的算法框架的设计;而基于自动编码器和生成对抗网络组合形式的数据增强方法则是通过编码器、解码器、生成器和判别器的设计实现数据增强任务。本文总结了传统图像处理方法和基于深度学习数据增强方法两方面技术,讨论了不同图像数据增强技术的优缺点。
随着深度学习技术的不断革新,更多的深度模型将会被提出,而针对数据集优化的数据增强技术也会随之发展,未来研究人员将可能更多的通过改进基于深度学习的数据增强技术来适应模型算法的结构,实现模型试验效果的提升。
冯晓硕,沈 樾,王冬琦. 基于图像的数据增强方法发展现状综述A Survey on the Development of Image Data Augmentation[J]. 计算机科学与应用, 2021, 11(02): 370-382. https://doi.org/10.12677/CSA.2021.112037
https://arxiv.org/abs/1712.04621
https://doi.org/10.1186/s40537-019-0197-0
https://doi.org/10.1051/e3sconf/201913202004
https://doi.org/10.1016/j.procs.2010.12.016
https://doi.org/10.1109/ICIVC.2017.7984554
https://doi.org/10.1613/jair.953
https://arxiv.org/abs/1710.09412
https://doi.org/10.1109/ICCV.2019.00612
https://arxiv.org/abs/1801.02929
https://doi.org/10.1609/aaai.v34i07.7000
https://arxiv.org/abs/1708.04552
https://arxiv.org/abs/2001.04086
https://doi.org/10.1109/CVPR.2019.00020
https://doi.org/10.1109/CVPRW50498.2020.00359
https://doi.org/10.1007/978-3-030-58542-6_35
https://arxiv.org/abs/1511.06434
https://arxiv.org/abs/1502.03167
https://doi.org/10.1109/ICCV.2017.244
https://arxiv.org/abs/1411.1784
https://doi.org/10.1109/ICCV.2017.299
https://doi.org/10.1007/978-3-030-01270-0_25
https://doi.org/10.1109/ICCV.2017.168
https://doi.org/10.1007/978-3-319-46475-6_43