Page 94 - 中国全科医学2022-14
P. 94

http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn  ·1755·


           4.0                               3.000                             3.10
                                             2.975
           3.8                                                                 3.05
                                             2.950
           3.6                                                                 3.00
                                             2.925
           3.4                               2.900                             2.95
                                             2.875
           3.2                                                                 2.90
                                             2.850
           3.0                                                                 2.85
                                             2.825
           2.8                               2.800                             2.80
              0.1    0.2   0.3    0.4   0.5      0.6    0.7   0.8   0.9    1.0    0.05   0.10  0.20   0.30  0.40
                          (a)λ 1                             (b)λ 2                         (c)λ 3
              注:横轴表示参数值,纵轴表示 top-1 错误率;以 L cp 为主要损失函数,λ 1 ,λ 2 和 λ 3 和 分别为 L ca 、L gc 和 L con 的平衡参数
                                            图 5 损失函数中平衡参数 对 EGCN 算法的影响
                                 Figure 5 The influence of balance parameters in loss function on our EGCN algorithm


           力,降低了 0.56% 的错误率。最后,本部分验证了图归                        点研究半监督学习和迁移学习在病毒分类问题中的应用
           一化方法,结果表明,归一化图有效地防止了梯度爆炸                            问题,以便能够在无标记样本或标记样本较少的情况下
           的问题,降低了 29.14% 的 top-1 错误率。                         达到较好的病毒形态分类的效果。
                                                                   针对电子显微镜下的病毒形态识别,本文提出了一
                       表 4 EGCN 方法的消融实验结果                      个改进的 EGCN 来解决病毒形态分类问题。该方法首先
                Figure 4 Ablation experimental results of EGCN method.
                                                               采用 CNN 提取原始图像的特征,然后采用 KNN 建图方
                   消融模块                 top-1 错误率(%)
                                                               法连接相关样本构建图结构关系,最后将图结构与提取
                   无数据增强                     4.17
                                                               的 CNN 特征相结合,输入超分类 GCN 进行最终的病毒
                  无 GCN 模块                   12.27
                                                               形态分类。实验结果表明,EGCN 在病毒识别方面优于
                  无超分类技巧                     3.96
                   无图归一化                     32.54             所有的对比方法,提高了识别准确率。从理论和实际应
                   EGCN 模型                   3.40              用的角度均综合验证了 EGCN 对于病毒形态识别的重要
                                                               应用价值和研究意义,对病毒传播过程中的早期诊断具
           4 讨论                                                有重要的实际应用潜力。
               本文针对多种病毒形态分类任务,设计了 EGCN 进                           作者贡献:哈艳、孟翔杰进行文章的构思与设计,
           行病毒 TEM 图像分类特征的学习和样本关系的挖掘,                          研究的实施与可行性分析,数据整理;哈艳、田俊峰进
           结合超分类损失提高模型的鉴别能力,达到了 3.4%                           行数据收集,论文的修订,结果的分析与解释;孟翔杰
           的 top-1 错误率,1.88% 的 top-2 错误率,并且获得了                 进行统计学处理;田俊峰撰写论文,对文章整体负责,
           96.65% 的精确度和 96.6% 的召回率。对于病毒形态分                     监督管理;哈艳负责文章的质量控制及审校。
           类任务,已有相关文献展开过研究,比如文献[28]                                本文无利益冲突。
           对电子图像中的自动病毒鉴别任务设计了深度学习算                             参考文献
           法,结合病毒的形态属性和网络的损失函数来对 SRS、                          [1]SPURGEON S R,OPHUS C,JONES L,et al. Towards data-driven
           MERS、HIV 和 COVID-19 四种病毒进行分类识别;文                        next-generation transmission electron microscopy[J]. Nat Mater,
           献[29]通过引入 CNN 来检测和识别病毒,实现数据                             2021,20(3):274-279. DOI:10.1038/s41563-020-00833-z.
           标注、样本成像和图像增强,并提高模型的运行速度,                            [2]HOPFER  H,HERZIG  M  C,GOSERT  R,et  al.  Hunting
           取得了不错的研究进展。与上述相关文献相比,本文模                                coronavirus by transmission electron microscopy - a guide to
                                                                   SARS-CoV-2-associated ultrastructural pathology in COVID-19
           型主要针对类别相似性较高的病毒种类识别,并设计了
                                                                   tissues[J]. Histopathology,2021,78(3):358-370. DOI:
           超分类损失来促进网络对类别之间差异特征的学习,重
                                                                   10.1111/his.14264.
           点解决了多种病毒分类的复杂任务。
                                                               [3]GIBBS  A  J,HAJIZADEH  M,OHSHIMA  K,et  al.  The
               虽然本方法可以有效解决病毒类别分类问题,但
                                                                   potyviruses:an evolutionary synthesis is emerging[J]. Viruses,
           在模型训练过程中需要大量标注样本,在实际应用中
                                                                   2020,12(2):E132. DOI:10.3390/v12020132.
           TEM 病毒图像的标注工作十分复杂,且耗时、耗力。                           [4]YANG X L,TAN C W,ANDERSON D E,et al. Characterization
           本文提出的 EGCN 在无标记数据或者标记样本较少的情                             of a filovirus (Měnglà virus) from Rousettus bats in China[J].
           况下效果如何有待进一步验证。在未来的研究中,将重                                Nat Microbiol,2019,4(3):390-395. DOI:10.1038/s41564-
   89   90   91   92   93   94   95   96   97   98   99