Page 90 - 中国全科医学2022-14

P. 90

http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn ·1751·

肠病毒。WEN 等［12］建立了一种通过多尺度主成分分
析方法提取病毒特征的病毒识别模型。但是这些方法仅
考虑病毒图像样本类别与图像特征之间的关系，忽视了
图像样本特征中的群体相似问题，因此在实际应用中效
果还不理想。
1.2 GCN 由于 GCN 具有挖掘样本特征之间关系的独
特能力，许多研究采用 GCN 作为特征学习方法［13-18］。
如 SAHBI 等［13］为图像特征建立了一个正交的连接矩阵，
通过邻域最优地聚集特征节点，并结合轻量级 GCN 进
行手势识别；MIN 等［14］提出了一种基于注意力图网络
的车位检测方法，其根据标记点周围视图的图像建立图
结构，用单元化的图神经网络来聚合样本之间的邻近信
息。ZHOU 等［15］通过 GCN 将动作特征和微表情特征联图 1 EGCN 算法模型整体结构
合表示，实现微表情识别；XIAO 等［16］提出了一种利 Figure 1 Overall structure of EGCN algorithm model
用 GCN 将类间相似度知识整合到 CNN 模型的方法来解 5 个阶段组成，每个阶段使用多个卷积，不存在池化模
决图像识别问题。此外，ADNAN 等［17］通过两阶段表
块。每个阶段的第一层通过设置 stride=2 来改变图像的
征学习框架识别了两种肺癌亚型，该方法通过基于颜色
大小。RepVGG 的详细信息见表 1。
的算法和图神经网络将原始图像映射为向量表示，并在
为解决内部协变量移位问题，在每个卷积层后加入
图池中引入注意力机制来推断样本之间的相关性。BAO 批归一化公式：
等［18］提出的掩码图注意力网络，该网络通过 CNN 特 x- （x ）
E
b
b+1
征表示节点之间的相互信息传输，更有效地实现行人的 x = V（x ）+ε （2）
b
再识别。其中 x ，x b+1 分别表示第 b 层批标准化层的输入和
b
为了更好地解决病毒形态诊断问题，首先利用 CNN 输出，ε（·）表示期望，V（·）表示方差，ε>0。
提取图像特征表示，然后将 CNN 特征和样本之间的关
系输入 GCN 模块，整个网络由群体超分类损失和病毒表 1 RepVGG 模型
Table 1 The model of Rep VGG network
分类交叉熵损失进行联合优化，进而提出了 EGCN。
阶段输出尺寸（像素）层数
2 EGCN 1 32×32 1
2.1 方法总述为了解决病毒形态分类问题，首先， 2 16×16 4
使用 CNN 从原始图像中提取视觉特征。然后，通过 3 8×8 6
KNN 算法计算一个邻接矩阵来表示 CNN 特征的相关性。 4 4×4 16
最后，将 CNN 特征和其他的相关性输入到 GCN 中学习 5 2×2 1
图特征表示，并利用群体超分类和病毒分类损失进行网
2.3 超分类图嵌入学习在提取 CNN 特征后，将这些
络优化，提出了一种端到端的 EGCN。模型整体结构如
特征作为 GCN 的输入，并结合样本之间的关系进行图
图 1 所示。首先，EGCN 通过 CNN 对病毒图片提取像
特征表示，最终经过分类层预测分类结果。该模块包括
素级特征，然后通过图学习建立样本特征之间的关系，
两部分，首先计算 CNN 特征之间的相关性构建邻接矩
并引入图卷积神经网络进行图特征学习，利用超分类损
阵，然后通过超分类 GCN 计算预测的概率分布。
失提高网络的特征提取能力，实现在像素级特征上提取
2.3.1 图构建算法为了确定 CNN 特征之间的关系，
更具鲁棒性的样本鉴别特征，最终通过主分类损失进行
采用 KNN 算法建立一个图结构 G（V，E），其中 V 表
病毒形态识别。
示图的节点，E 表示图的边。具体来说，将每个图像的
2.2 像素级特征提取 CNN 可以根据像素间的关系挖
CNN 特征假设为一个节点。KNN 算法中对于每个节点，
掘图像的像素级特征信息，在分类问题上解决了许多将其连接到最接近该节点的前 K 个节点，计算邻接矩阵
挑战性的问题［19］。因此，本文使用经典的 CNN 模型 A=（A ij ）：
RepVGG ［20］作为像素级的特征提取器。给定原始数据
X={x 1 ，…，x i ，…，x n }，包括病毒图像，通过以下公式 A ij = 1，y i ∈N j （3）
0，其他
提取 CNN 特征：Y=F（X）（1）。其中 F（·）表示其中 N j 表示样本 j 的 K 个近邻点的集合。样本的近
RepVGG-B3 模型，Y 表示像素级特征集合。RepVGG 由邻点由欧几里得距离决定：

85 86 87 88 89 90 91 92 93 94 95