热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文浏览(13)ResourceEfficient3DConvolutionalNeuralNetworks

文章目录0.前言1.要解决什么问题2.用了什么方法3.效果如何4.还存在什么问题0.前言相关资料:arxivgithub论文解读论文基本信息领域:行为

文章目录

    • 0. 前言
    • 1. 要解决什么问题
    • 2. 用了什么方法
    • 3. 效果如何
    • 4. 还存在什么问题




0. 前言


  • 相关资料:
    • arxiv
    • github
    • 论文解读
  • 论文基本信息
    • 领域:行为识别
    • 作者单位:慕尼黑工业大学&英特尔欧洲实验室
    • 发表时间:2019.4



1. 要解决什么问题


  • 3D卷积发展迅猛,2D轻量化卷积神经网络发展也很快,但3D轻量化网络却没有太多研究。



2. 用了什么方法


  • 把2D轻量化卷积神经网络转换为3D的形式。
  • 在以下三个数据集上测试3D卷积网络的性能
    • Kinetics-600:测试模型容量
    • Jester:测试模型提取动作特征的能力
    • UCF-101:测试模型的迁移能力
  • 常用block的3D版
    • image_1ec212nfe1uga1399q6l1dm91ot39.png-281kB
    • 3D-SqueezeNet
      • 最主要的就是Fire模块,如下图所示。一个类似于分组分组卷积+concat的操作,不同组的卷积核不同。
      • image_1ec220knm7h313463eu1k0d1tr5m.png-101.7kB
    • 3D-MobileNetV1
      • 本质就是加入了Depthwise Convolution,3D版的就是把2D Depthwise改为3D Depthwise。
    • 3D-MobileNetV2
      • 在使用Depthwise Convolution的基础上设计一个类似于resnet block的结构,改变了relu的位置。
      • image_1ec22d75l1j1gd56es11pf91ln913.png-70.7kB
    • 3D-ShuffleNetV1
      • 本网络的主要特点在于使用了 pointwise group convolution 以及 channel shuffle 操作。
      • image_1ec22ept71ien1nq5isq7072ef1g.png-89.5kB
    • 3D-ShuffleNetV2
      • 主要是改变了channel shuffle的位置。
      • image_1ec22i6rb13k7mg1o0ij3v1cnv1t.png-103kB
  • 上述网络总体architecture与2D网络的差不多



3. 效果如何


  • 在Kinetics-600 Jester UCF-101 上的性能对比
    • 3D卷积网络没有使用一些(2+1)D啥的其他操作。
    • image_1ec1vm9ro1pem18s91ugpudr1d979.png-234.8kB



4. 还存在什么问题


  • 都是一些最朴素的2D转3D。

  • 最大的好处就是有开源代码,可以直接用到其他地方(比如slowfast里)。


推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 本文介绍了Linux系统中正则表达式的基础知识,包括正则表达式的简介、字符分类、普通字符和元字符的区别,以及在学习过程中需要注意的事项。同时提醒读者要注意正则表达式与通配符的区别,并给出了使用正则表达式时的一些建议。本文适合初学者了解Linux系统中的正则表达式,并提供了学习的参考资料。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
author-avatar
侯贵聪_680
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有