传染性肺病是一种在世界范围流行的具有高发病率和高死亡率的疾病,2019年爆发的新冠肺炎病毒(COVID-19)就是由一种名为SARS-Cov-2的病毒引发的。COVID-19传播速度快、致死率高
[1]。
许多确诊的COVID-19病例出现了肺炎放射学特征,放射学检查有助于判断患者是否感染以及感染程度。常见的放射学检查手段包括X射线
[2]、计算机断层扫描(computed tomography,CT)
[3]、磁共振成像(magnetic resonance imaging,MRI)
[4]等。X射线一般用来检查肺部是否有纹理增生或大块肿块,CT是在X射线基础上发展起来的,其检测灵敏度和准确性都优于X射线,而运动伪影的干扰使得MRI在肺部疾病诊断中的应用非常有限。因此,利用肺部CT图像研究智能诊断算法辅助提升COVID-19的诊断具有一定的研究价值。
现有肺部CT诊断算法通常需要大量标注数据集来对模型进行训练。然而,由于医疗图像数据的特殊性,建立大规模医学数据集有困难;同时,医疗图像需要经验丰富的影像科医师花费大量时间来标注。因此,有监督学习方法的应用存在较大局限性。相比之下,自监督学习(self supervised learning, SSL)
[5]不需要标注数据就可以学习数据的特征表达,可有效节省标记数据的人力和时间成本。因此,自监督学习可以用来提取和表征肺部CT图像的特征,并通过下游任务实现对图像的分类。
对比学习是一种自监督学习方法,能够在没有标签的情况下,利用模型学习同类数据的共同特征、区分非同类数据的不同之处
[5]。自监督对比学习在自然图像处理任务上已经表现出了优越性能。宁重阳等
[6]提出了一种基于视觉变换网络的自监督识别模型,同时设计了一种基于傅里叶低频混合变换的数据增强方法,实验结果表明,该模型在森林火灾识别任务中有较好的识别效果。张益天等
[7]提出了一种基于轻量级胶囊网络的自监督检测方法,该方法在5个真实SAR数据集上运行效率更高、鲁棒性特征更强。Tu等
[8]提出了一种采用辅助增强策略和GNT-Xent损失函数的自监督学习方法,在CIFAR和SVHN数据集均有良好的表现。Han等
[9]提出了一种自监督的嵌入式方法,在粗/细粒度数据上有出色表现。
除了自然图像处理领域,现有文献中也可见对医学图像的自监督算法研究。曹春萍等
[10]提出了一种融合片内语义和片间结构特征的自监督CT图像分类方法,实验结果表明,标注数据有限时该方法有更好的分类性能和标签利用效率。曹达等
[11]提出了一种基于自监督学习网络的多层同时扫描扩散张量成像去噪方法,实验结果表明,该方法可以有效去噪并提高图像质量。Han等
[12]提出了一种半监督端对端的对比学习模型,在X射线图像分类和定位任务中表现良好。Zhang等
[13]提出了一种基于向心对比学习视觉表征的网络框架,该框架在有限的COVID-19 CT数据集上有较好的表现。
本文提出了一种基于对比学习的阶段式自监督模型来解决肺部新冠肺炎CT图像识别分类问题。该模型由3个阶段组成:预训练阶段利用自然图像数据集对模型进行预训练,训练好的网络权重信息通过迁移进行利用;自监督对比训练阶段由数据增强模块、编码器模块和多层感知器模块组成,对未标记的肺部CT图像进行特征学习与表征;微调阶段使用一定数量的标注数据集进行全连接层参数的调整。最终,实验结果表明,本文提出的阶段式自监督对比学习模型具有良好的性能。