Page 90 - 中国全科医学2022-14
P. 90
http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn ·1751·
肠病毒。WEN 等 [12] 建立了一种通过多尺度主成分分
析方法提取病毒特征的病毒识别模型。但是这些方法仅
考虑病毒图像样本类别与图像特征之间的关系,忽视了
图像样本特征中的群体相似问题,因此在实际应用中效
果还不理想。
1.2 GCN 由于 GCN 具有挖掘样本特征之间关系的独
特能力,许多研究采用 GCN 作为特征学习方法 [13-18] 。
如 SAHBI 等 [13] 为图像特征建立了一个正交的连接矩阵,
通过邻域最优地聚集特征节点,并结合轻量级 GCN 进
行手势识别;MIN 等 [14] 提出了一种基于注意力图网络
的车位检测方法,其根据标记点周围视图的图像建立图
结构,用单元化的图神经网络来聚合样本之间的邻近信
息。ZHOU 等 [15] 通过 GCN 将动作特征和微表情特征联 图 1 EGCN 算法模型整体结构
合表示,实现微表情识别;XIAO 等 [16] 提出了一种利 Figure 1 Overall structure of EGCN algorithm model
用 GCN 将类间相似度知识整合到 CNN 模型的方法来解 5 个阶段组成,每个阶段使用多个 卷积,不存在池化模
决图像识别问题。此外,ADNAN 等 [17] 通过两阶段表
块。每个阶段的第一层通过设置 stride=2 来改变图像的
征学习框架识别了两种肺癌亚型,该方法通过基于颜色
大小。RepVGG 的详细信息见表 1。
的算法和图神经网络将原始图像映射为向量表示,并在
为解决内部协变量移位问题,在每个卷积层后加入
图池中引入注意力机制来推断样本之间的相关性。BAO 批归一化公式:
等 [18] 提出的掩码图注意力网络,该网络通过 CNN 特 x- (x )
E
b
b+1
征表示节点之间的相互信息传输,更有效地实现行人的 x = V(x )+ε (2)
b
再识别。 其中 x ,x b+1 分别表示第 b 层批标准化层的输入和
b
为了更好地解决病毒形态诊断问题,首先利用 CNN 输出,ε(·)表示期望,V(·)表示方差,ε>0。
提取图像特征表示,然后将 CNN 特征和样本之间的关
系输入 GCN 模块,整个网络由群体超分类损失和病毒 表 1 RepVGG 模型
Table 1 The model of Rep VGG network
分类交叉熵损失进行联合优化,进而提出了 EGCN。
阶段 输出尺寸(像素) 层数
2 EGCN 1 32×32 1
2.1 方法总述 为了解决病毒形态分类问题,首先, 2 16×16 4
使用 CNN 从原始图像中提取视觉特征。然后,通过 3 8×8 6
KNN 算法计算一个邻接矩阵来表示 CNN 特征的相关性。 4 4×4 16
最后,将 CNN 特征和其他的相关性输入到 GCN 中学习 5 2×2 1
图特征表示,并利用群体超分类和病毒分类损失进行网
2.3 超分类图嵌入学习 在提取 CNN 特征后,将这些
络优化,提出了一种端到端的 EGCN。模型整体结构如
特征作为 GCN 的输入,并结合样本之间的关系进行图
图 1 所示。首先,EGCN 通过 CNN 对病毒图片提取像
特征表示,最终经过分类层预测分类结果。该模块包括
素级特征,然后通过图学习建立样本特征之间的关系,
两部分,首先计算 CNN 特征之间的相关性构建邻接矩
并引入图卷积神经网络进行图特征学习,利用超分类损
阵,然后通过超分类 GCN 计算预测的概率分布。
失提高网络的特征提取能力,实现在像素级特征上提取
2.3.1 图构建算法 为了确定 CNN 特征之间的关系,
更具鲁棒性的样本鉴别特征,最终通过主分类损失进行
采用 KNN 算法建立一个图结构 G(V,E),其中 V 表
病毒形态识别。
示图的节点,E 表示图的边。具体来说,将每个图像的
2.2 像素级特征提取 CNN 可以根据像素间的关系挖
CNN 特征假设为一个节点。KNN 算法中对于每个节点,
掘图像的像素级特征信息,在分类问题上解决了许多 将其连接到最接近该节点的前 K 个节点,计算邻接矩阵
挑战性的问题 [19] 。因此,本文使用经典的 CNN 模型 A=(A ij ):
RepVGG [20] 作为像素级的特征提取器。给定原始数据
X={x 1 ,…,x i ,…,x n },包括病毒图像,通过以下公式 A ij = 1,y i ∈N j (3)
0,其他
提取 CNN 特征:Y=F(X)(1)。其中 F(·)表示 其中 N j 表示样本 j 的 K 个近邻点的集合。样本的近
RepVGG-B3 模型,Y 表示像素级特征集合。RepVGG 由 邻点由欧几里得距离决定: