Page 90 - 中国全科医学2022-14
P. 90

http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn  ·1751·


           肠病毒。WEN 等      [12] 建立了一种通过多尺度主成分分
           析方法提取病毒特征的病毒识别模型。但是这些方法仅
           考虑病毒图像样本类别与图像特征之间的关系,忽视了
           图像样本特征中的群体相似问题,因此在实际应用中效
           果还不理想。
           1.2 GCN 由于 GCN 具有挖掘样本特征之间关系的独
           特能力,许多研究采用 GCN 作为特征学习方法                  [13-18] 。
           如 SAHBI 等 [13] 为图像特征建立了一个正交的连接矩阵,
           通过邻域最优地聚集特征节点,并结合轻量级 GCN 进
           行手势识别;MIN 等       [14] 提出了一种基于注意力图网络
           的车位检测方法,其根据标记点周围视图的图像建立图
           结构,用单元化的图神经网络来聚合样本之间的邻近信
           息。ZHOU 等   [15] 通过 GCN 将动作特征和微表情特征联                              图 1 EGCN 算法模型整体结构
           合表示,实现微表情识别;XIAO 等              [16] 提出了一种利                Figure 1 Overall structure of EGCN algorithm model
           用 GCN 将类间相似度知识整合到 CNN 模型的方法来解                       5 个阶段组成,每个阶段使用多个 卷积,不存在池化模
           决图像识别问题。此外,ADNAN 等              [17] 通过两阶段表
                                                               块。每个阶段的第一层通过设置 stride=2 来改变图像的
           征学习框架识别了两种肺癌亚型,该方法通过基于颜色
                                                               大小。RepVGG 的详细信息见表 1。
           的算法和图神经网络将原始图像映射为向量表示,并在
                                                                   为解决内部协变量移位问题,在每个卷积层后加入
           图池中引入注意力机制来推断样本之间的相关性。BAO                           批归一化公式:
           等 [18] 提出的掩码图注意力网络,该网络通过 CNN 特                                x- (x )
                                                                           E
                                                                               b
                                                                    b+1
           征表示节点之间的相互信息传输,更有效地实现行人的                                x =  V(x )+ε   (2)
                                                                            b
           再识别。                                                    其中 x ,x  b+1  分别表示第 b 层批标准化层的输入和
                                                                        b
               为了更好地解决病毒形态诊断问题,首先利用 CNN                        输出,ε(·)表示期望,V(·)表示方差,ε>0。
           提取图像特征表示,然后将 CNN 特征和样本之间的关
           系输入 GCN 模块,整个网络由群体超分类损失和病毒                                           表 1 RepVGG 模型
                                                                          Table 1 The model of Rep VGG network
           分类交叉熵损失进行联合优化,进而提出了 EGCN。
                                                                     阶段         输出尺寸(像素)             层数
           2 EGCN                                                     1              32×32             1
           2.1 方法总述 为了解决病毒形态分类问题,首先,                                  2              16×16             4
           使用 CNN 从原始图像中提取视觉特征。然后,通过                                  3              8×8               6
           KNN 算法计算一个邻接矩阵来表示 CNN 特征的相关性。                              4              4×4              16
           最后,将 CNN 特征和其他的相关性输入到 GCN 中学习                              5              2×2               1
           图特征表示,并利用群体超分类和病毒分类损失进行网
                                                               2.3 超分类图嵌入学习 在提取 CNN 特征后,将这些
           络优化,提出了一种端到端的 EGCN。模型整体结构如
                                                               特征作为 GCN 的输入,并结合样本之间的关系进行图
           图 1 所示。首先,EGCN 通过 CNN 对病毒图片提取像
                                                               特征表示,最终经过分类层预测分类结果。该模块包括
           素级特征,然后通过图学习建立样本特征之间的关系,
                                                               两部分,首先计算 CNN 特征之间的相关性构建邻接矩
           并引入图卷积神经网络进行图特征学习,利用超分类损
                                                               阵,然后通过超分类 GCN 计算预测的概率分布。
           失提高网络的特征提取能力,实现在像素级特征上提取
                                                               2.3.1 图构建算法 为了确定 CNN 特征之间的关系,
           更具鲁棒性的样本鉴别特征,最终通过主分类损失进行
                                                               采用 KNN 算法建立一个图结构 G(V,E),其中 V 表
           病毒形态识别。
                                                               示图的节点,E 表示图的边。具体来说,将每个图像的
           2.2 像素级特征提取 CNN 可以根据像素间的关系挖
                                                               CNN 特征假设为一个节点。KNN 算法中对于每个节点,
           掘图像的像素级特征信息,在分类问题上解决了许多                             将其连接到最接近该节点的前 K 个节点,计算邻接矩阵
           挑战性的问题      [19] 。因此,本文使用经典的 CNN 模型                 A=(A ij ):
           RepVGG  [20] 作为像素级的特征提取器。给定原始数据
           X={x 1 ,…,x i ,…,x n },包括病毒图像,通过以下公式                    A ij =  1,y i ∈N j   (3)
                                                                       0,其他
           提取 CNN 特征:Y=F(X)(1)。其中 F(·)表示                           其中 N j 表示样本 j 的 K 个近邻点的集合。样本的近
           RepVGG-B3 模型,Y 表示像素级特征集合。RepVGG 由                   邻点由欧几里得距离决定:
   85   86   87   88   89   90   91   92   93   94   95