当前位置: 开发笔记 > 编程语言 > 正文

ImageNet和CNN怎样帮助医学图像的识别

作者：koujj | 来源：互联网 | 2023-06-30 16:35

ImageNet和CNN怎样帮助医学图像的识别原创2016年06月27日17:25:144566从ImageNet和CNN说起图像的分类和识别一直是计算机视觉的热门研究领域

ImageNet和CNN怎样帮助医学图像的识别
原创 2016年06月27日 17:25:14
4566

从ImageNet和CNN说起
图像的分类和识别一直是计算机视觉的热门研究领域&＃xff0c;在医学图像领域&＃xff0c;很多方法也都是从计算机视觉领域借鉴过来的&＃xff0c;而计算机视觉的许多方法又离不开机器学习和人工智能的基础。
在典型的图像分类和识别问题中&＃xff0c;通常有两个重要的步骤&＃xff0c;一个是特征提取&＃xff0c;常见的有GLCM, HOG, LBP, Haar Wavelet, 一个是分类器&＃xff0c; 例如SVM, Random Forest, Neuron Network等。特征提取过程中通常是人工选取某些特征&＃xff0c;但是难以确定这些特征是否真正准确地描述了不同类别的差异&＃xff0c;怎样才能得到最好的特征呢&＃xff1f;
于是卷积神经网络应运而生。其思想是通过一些卷积层的参数来描述特征&＃xff0c;这些参数的值不是人工设定&＃xff0c;而是通过大量的训练数据通过训练自动得到。再配合传统的Neuron Network可以同时训练特征的参数和分类器的参数。这就是卷积神经网络&＃xff08;Convolution Neuron Network, CNN&＃xff09;。下图简要归纳了它的结构与传统Neuron Network的联系与区别。
CNN的成功主要起源于它在ImageNet大规模视觉识别挑战赛&＃xff08;ILSVRC&＃xff09;上的成就。ImageNet是一个斯坦福大学Fei-fei Li教授发起的图像数据库&＃xff0c;包含120万以上的训练数据和1000种不同的类别&＃xff0c;其识别一直比较困难&＃xff0c;直到2012年AlexNet的提出&＃xff0c;从此以后几乎每年ILSVRC的赢家都使用了CNN&＃xff0c;相比以往的方法大幅提高了识别的准确率。
CNN在ImageNet上的成功源于三个主要因素&＃xff1a;一是大规模的训练数据。二是更为复杂的模型&＃xff08;CNN&＃xff09;。网络结构更加复杂&＃xff0c;更深&＃xff0c;参数更多。三是GPU对计算的加速&＃xff0c;使以往需要数周的训练过程只需一天甚至数小时以内就可以完成。
医学图像识别的问题
如果将CNN应用于医学图像&＃xff0c;首要面对的问题是训练数据的缺乏。因为CNN的训练数据都需要有类别标号&＃xff0c;这通常需要专家来手工标记。要是标记像ImageNet这样大规模的上百万张的训练图像&＃xff0c;简直是不可想象的。
因为CNN的参数多&＃xff0c;必须依靠大规模的训练数据才能防止过度拟合&＃xff08;Over Fitting&＃xff09;。在数据量少的情况下&＃xff0c;有两种解决方案&＃xff1a;一个叫Data Augmentation。就是依赖现有的图像&＃xff0c;通过旋转&＃xff0c;平移&＃xff0c;变形等变化&＃xff0c;产生更多的图像。二是使用转移学习(Transfer Learning)。其思想是通过在另一种大规模的数据集上面训练&＃xff0c;得到CNN的参数作为初始值&＃xff0c;再在目标数据集上训练对参数进行调优&＃xff08;Fine-tuning&＃xff09;。
转移训练的原理是某些特征在不同的训练数据集上是具有通用性的。对于CNN而言&＃xff0c;其第一层是提取局部的特征&＃xff0c;在后续层通过下采样扩大感知区域, 再往后的层感知区域更大&＃xff0c;得到的特征也更加抽象。在前几层的特征通常并不与某一个具体的分类任务直接相关&＃xff0c;而是类似于Gabor Filter, 边缘&＃xff0c;与方向有关的特征等。这些特征都是比较通用的&＃xff0c;因此可以在一个数据集上训练得到而应用在一个与之类似的数据集上。当然&＃xff0c;如果训练出的特征对某个训练数据集或者识别任务具有特异性&＃xff0c;用它做转移学习就未必有好的效果。
对于医学图像而言&＃xff0c;得到大规模的训练数据是比较不容易的&＃xff0c;那么可否使用Transfer Learning利用现成的ImageNet的图像来帮助医学图像的识别呢&＃xff1f;ImageNet里面的图像&＃xff08;二维&＃xff0c;彩色&＃xff09;没有医学图像&＃xff0c;包含一些诸如鸟类、猫、狗、直升机等物体的识别&＃xff0c;与医学图像&＃xff08;二维或三维&＃xff0c;非彩色&＃xff09;相差很大。如果回答是肯定的话&＃xff0c;是一件令人非常振奋的事情。
使用ImageNet做转移学习的效果
在NIH的Hoo-Chang Shin ; Holger R. Roth等人最近的一篇文章中研究了这个问题&＃xff08;下载链接&＃xff09;。其全名为&＃xff1a;Deep Convolutional Neural Networks for Computer-Aided Detection: CNN Architectures, Dataset Characteristics and Transfer Learning。
该文章除了研究上述问题&＃xff0c;还比较了CifarNet &＃xff08;2009年&＃xff09;, AlexNet(2012年)和GoogleNet(2014年)这三个一个比一个复杂的网络结构在不同的训练数据量的情况下的性能。这三个网络的结构简图如下&＃xff1a;
该文章研究的医学图像应用为CT图像中胸腹部淋巴结&＃xff08;三维&＃xff09;的检测和肺部疾病的分类&＃xff08;二维&＃xff09;。如何让彩色二维图像与医学图像相结合呢&＃xff1f;该文采用了两个小技巧&＃xff1a;
对于三维CT图像&＃xff0c;将通过某一点的冠状面、矢状面和横断面的三个二维图像组合在一起&＃xff0c;作为RGB的三个通道&＃xff0c;使之与彩色图像兼容。对二维CT图像&＃xff0c;分别采用三种不同的CT灰度窗口&＃xff0c;得到三张图像&＃xff0c;组合成彩色图像。
实验的结果如上图。可以看出&＃xff0c;在不使用Transfer Learning的情况下&＃xff08;Random Initialization, RI&＃xff09;&＃xff0c;AlexNet虽然比GoogleNet简单&＃xff0c;但是效果比GoogleNet好&＃xff0c;这是因为GoogleNet参数太多&＃xff0c;训练数据不够导致过度拟合&＃xff0c;使其泛化能力下降&＃xff0c;从而分类精度降低。使用了Transfer Learning &＃xff08;TL&＃xff09;后&＃xff0c;GoogleNet的性能提高很多&＃xff0c;效果比AlexNet要好。
Random Initialization和Transfer Learning 在训练过程中的性能比较如下图&＃xff1a;

可见Transfer Learning减少了测试数据上的误差&＃xff0c;提高了分类的准确率。
再来看看Transfer Learning学到了那些特征&＃xff1a;
上图显示了在CNN的第一层中学习到的特征。可以看出在不使用Transfer Learning的情况下&＃xff0c;单从CT图像上学习到的特征都表现出比较模糊的样子&＃xff0c;而使用Transfer Learning的CNN相应的特征中包含一些和边缘有关的特征&＃xff0c;这些实际上是从ImageNet中学习过来的&＃xff0c;但有助于CT图像的分类和识别。

推荐阅读

filter
鄂维南：从数学角度，理解机器学习的「黑魔法」，并应用于更广泛的科学问题...

作者|Hertz来源|科学智能AISI北京时间2022年7月8日晚上22:30，鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenarytalk)。今 ... [详细]

蜡笔小新 2023-10-15 23:41:17
python
脑机接口和卷积神经网络的初学指南(一)

脑机接口和卷积神经网络的初学指南(一) ... [详细]

蜡笔小新 2023-10-13 11:11:52
process
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
python
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
python
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
python
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
python
都会|可能会_###haohaohao###图神经网络之神器——PyTorch Geometric 上手 & 实战

篇首语：本文由编程笔记#小编为大家整理，主要介绍了###haohaohao###图神经网络之神器——PyTorchGeometric上手&实战相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 18:30:35
python
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
python
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
python
TensorFlow入门上

前置准备在阅读本文之前，请确定你已经了解了神经网络的基本结构以及前向传播、后向传播的基本原理，如果尚未了解，可以查看下文。神经网络初探chrer.com也可以直接在我博客阅读Te ... [详细]

蜡笔小新 2023-10-16 10:25:39
python
开源真香离线识别率高 Python 人脸识别系统

本文主要介绍关于python,人工智能,计算机视觉的知识点，对【开源真香离线识别率高Python人脸识别系统】和【】有兴趣的朋友可以看下由【000X000】投稿的技术文章，希望该技术和经验能帮到 ... [详细]

蜡笔小新 2023-10-14 15:43:38
utf-8
分类与聚类

一：分类1：定义分类其实是从特定的数据中挖掘模式，做出判断的过程。分类是在一群已经知道类别标号的样本中，训练一种分类器 ... [详细]

蜡笔小新 2023-10-13 05:29:06
main
navicat生成er图_实践案例丨ACL2020 KBQA 基于查询图生成回答多跳复杂问题

摘要：目前复杂问题包括两种：含约束的问题和多跳关系问题。本文对ACL2020KBQA基于查询图生成的方法来回答多跳复杂问题这一论文工作进行了解读 ... [详细]

蜡笔小新 2023-10-16 15:31:07
main
Two Sigma人均22万英镑~

近期原创文章： ... [详细]

蜡笔小新 2023-10-16 14:54:24
main
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03

koujj

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章