热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

计算机如何处理伯努利函数,行人检测深度学习篇

樊恒徐俊等基于深度学习的人体行为识别J武汉大学学报2016414492-497引言行为识别整体流程前景提取行为识别过程实验分析芮挺等基于深度卷积神经网络的行人检测计算机工程与应用2

樊恒徐俊等基于深度学习的人体行为识别J武汉大学学报2016414492-497

引言

行为识别整体流程

前景提取

行为识别过程

实验分析

芮挺等 基于深度卷积神经网络的行人检测 计算机工程与应用 2015

引言

卷积神经网络结构与特点

行人检测卷积神经网络结构

实验对比总结

张 阳 基于深信度网络分类算法的行人检测方法J 计算机应用研究 20163302

引言

改进的深信度网络分类算法

1 带 T 分布函数显层节点的 BM

2 深信度网络搭建及预训练

3 微调

基于深信度网络的行人特征分类

1 预处理

2 行人特征分类器

性能评价

总体来说大部分浏览下就行。

樊恒,徐俊等.基于深度学习的人体行为识别[J].武汉大学学报,2016,41(4):492-497.

0 引言

目前研究行为识别的方法一般分为基于模型方法和基于相似性度量的方法,前者首先建立某种准则,然后从运动图像序列中提取目标的外形、运动等特征,根据所获得的特征信息,通过人工或半监督的方法来定义正常行为的数学模型。而基于相似度量的方法考虑到人体行为难定义、易发现的特点,避免显示定义人体行为的数学模型。其基本原理是自动从运动图像序列数据中学习各种人体行为,根据学习结果判断测试视频中的行为类型。

本文提出了一种基于深度信念网络(deep belief networks)的人体行为识别方法。

1 行为识别整体流程

流程图如下:

adfe612d9092614e0556d79e53896701.png

左侧分支为模型训练,右侧模型为识别过程。

2 前景提取

目前,目标检测方法主要有背景减法、光流法以及时间差分法等。为了实现检测的自适应性和实时性,本文选择基于高斯混合模型的背景减法,该方法实现简单、运算速度快,同时能够适应背景变化。(时间差分法一般较难提取出完整的运动目标,在运动目标内部容易产生空洞。光流法的计算相对复杂,抗噪能力较差。)具体数学运算,博客里不再详述,下图是效果:

bd65bb5e8a79fb35c9e2f41a0924122b.png

(背景要不要这么单纯~~)

3 行为识别过程

行为识别过程中用到的深度学习相关内容这里不再详述,后面会有单独的博客的讨论。可先借鉴这篇http://blog.csdn.net/zouxy09/article/details/8781396

深度学习常用的模型有自动编码器、稀疏编码、深度信念网络等,本文选择DBNs模型。

在深度神经网络中,任意两个相邻的隐含层构成一个受限玻尔兹曼机(Restricted Boltzmann Machine RBM),深度信念网络是一个包含多个隐含层的概率模型,每一层从前一个隐含层获取高度相关的关联,可以看作多个RBM 的累加,每个低层的RBM 输出结果作为输入数据用于训练下一个RBM,通过贪婪学习得到一组RBM,这一组RBM 可以构成一个DSNs,如下图

54302e4b8a7fd7e582222cd949cf8db5.png

本文选择贪婪的逐层训练算法。在贪婪学习的过程中,采用了wake-sleep算法思想。学习过程如下:

dbe29084275798a8aa3da0cdde880ced.png

4 实验分析

本文对比了不同的隐含层数,隐含层单元数及迭代次数与训练误差的关系。

同时与其他文献对比得到的结果显示较好。

芮挺等 基于深度卷积神经网络的行人检测 计算机工程与应用 2015

通过本文可以熟悉普通卷积神经网络应用的过程

0 引言

与hog+svm或adaboost对比,得到的更好的结果

1 卷积神经网络结构与特点

卷积神经网络的讲解,下面这篇文章讲的比较好

http://www.36dsj.com/archives/24006

2 行人检测卷积神经网络结构

经典卷积神经网络不能有效完成行人检测任务,网络深度、卷积核大小、最终提取特征维数,是影响结果的主要因素。因此需要针对行人检测问题的具体特点,对卷积神经网络的结构进行重新的设计。主要考虑一下问题:

1. 卷积核的影响。卷积核是卷积神经网络模型中最具特性的部分,可以理解为生物视觉中感受野的模型化表示。它的性质直接决定了特征提取的好坏、网络收敛的速度等。卷积核的大小决定了感受野的大小,感受野过大,提取的特征超出卷积核的表达范围,而感受野过小,则无法提取有效的局部特征。因此,卷积核大小对整个网络的性能有着至关重要的影响。

2. 通过增加网络的层数,其特征信息表达能力逐步增强,但层数过多也会致使网络结构过于复杂,训练时间增加,易出现过拟合现象

3. 分类器输入特征维数的影响

基于上述分析,对行人检测卷积神经网络进行了重新设计,并通过实验对上述思想及网络结构参数进行了验证。最终确定深度卷积神经网络结构共分7 层,卷积核大小为9x9,隐含层输出特征维数为360 维左右。

3 实验对比总结

还是老样子,实验结果很好,方法很好……

张 阳 基于深信度网络分类算法的行人检测方法[J] 计算机应用研究 2016,33(02)

0 引言

通过搭建带 T 分布函数显层节点的受限波兹曼机输入端改进深信度网络的输入方式,将行人特征提取信息通过输入端的显层结构转换为分类器可以识别的伯努利分布方式; 搭建多隐层受限波兹曼机中间层结构,实现隐层结构间的数传递,保留关键信息。最后,利用 BP 神经网络搭建分类结构的输出端,实现分类误差信息反向传播并对分类结构的参数进行微调,不断优化分类器结构。

1 改进的深信度网络分类算法

1.1 带 T 分布函数显层节点的 RBM

由于利用深信度网络实现特征分类时,输入一般为二值向量信息,而行人检测领域中,行人特征值信息的数值属性为连续整数或实数值。所以,直接使用 DBN 算法实现行人特征分类和识别势必会造成信息数据的丢失而影响分类效果。本文对深信度网络深度学习算法进行改进,通过引入带 T 分布函数显层节点的输入层使其能够更好地处理行人特征信息,进而通过网络预训练和网络微调实现信息分类和行人识别。

c2760df90d8643cee7fd0d463179bb53.png

如上图 所示,显层结构 v 和隐层结构 h 共同构建一个 RBM结构,通过比较显层结构单元与隐层结构单元之间的关联差异性,可调整各单元权值。由于本文采用的行人特征近似服从 T分布函数(LABH 算法提取行人特征,该特征的累积概率分布近似满足 T 分布),本文搭建一种新的带 T 分布函数显层节点的 RBM,在显层结构和隐层结构之间实现将 T 分布函数转换成伯努利分布的功能。在带 T 分布函数显层节点的 RBM 中,显层结构服从 T 分布,隐层结构服从伯努利分布,其能量函数表达式如下:

1537f25da09b22cabfcf8446d7e0bb4f.png

u为 T 分布函数的自由度,用于控制分布形态变化,uu−2为 T 分布函数的方差值.

和传统的 RBM 类似,带 T 分布函数显层节点的 RBM 的联合分布与能量函数的关系表达式为:

6a6e59c745fba01e0b6212d02e76f9d0.png

带 T 分布函数显层节点的 RBM 中,显层和隐层节点对应的条件概率可表示为

53f90d222b8113557e64e8eaa1642ca5.png

1.2 深信度网络搭建及预训练

本文搭建的深信度网络由一层带 T 分布函数显层节点的RBM、多层传统的隐层 RBM 和一层 BP 网络构成。其中,带 T分布函数显层节点的 RBM 为数据输入层,将行人特征信息转换为深信度网可以识别的伯努利数据,数据经过转换后,在多层 RBM 中经过提取和抽象,保留关键信息并剔除冗余信息,最后一层 BP 网络是系统的输出层,经多层 RBM 转换后的信息进入 BP 层,利用 BP 网络的反向传播能力,对输出结构进行监督,反向微调整个深信度网络模型参数,达到优化模型分类效果的目的。本文搭建的深信度网络模型示意图如下图 所示。该示意图由一层带 T 分布函数显层节点的 RBM、两层隐层RBM 和一层 BP 网络构成,数据由底部的带 T 分布函数显层节点的 RBM 输入,由顶部 BP 网络输出,顶部 BP 网络有反向转播和微调整个深信度网络模型的能力,从而优化模型结构。

cf35aac0be24cfe9e978c5d53eb071d9.png

1.3 微调

深信度网络微调阶段的实现过程分两个步骤: a) 利用 BP 网络的向前传播性能,将连接 BP 网络的RBM 处理后的信息经进一步处理后,将分类结果输出; b) 反向传播,通过比较 BP 网络输出结果与真实结果,得出两者之间的误差值,将其反向传播至输入端,利用共轭梯度法优化分类模型的参数。

2 基于深信度网络的行人特征分类

2.1 预处理

本文使用 LABH 算法提取行人特征,该特征的累积概率分布近似满足 T 分布。将行人样本库进行如下处理: a) 利用 LABH 算法提取行人特征; b) 确定 T 分布的自由度参数取值,拟合行人特征分布; c) 根据行人特征分布区间计算特征项的权重值。

2.2 行人特征分类器

1a48e50479cc584c57c3a0d5948997aa.png

3 性能评价

其结构特征对性能影响

ea91ab5b5d54f6adae3affd33cf1e529.png

现有的深信度网络分类器多采用高斯( 显层) —伯努利( 隐层) RBM 实现语音、图像等数据的分类识别。本节通过实验对传统的高斯( 显层) —伯努利( 隐层) RBM 和本文提出的带 T 分布( 显层) —伯努利( 隐层) 的 RBM 检测结果加以对比,并对本文所提出算法的检测性能进行分析和评估。

94bfe38b64a339ef840af783065299da.png

对各分类的比较

e7a81d7883dfcf3dee76d8a15ee911dc.png



推荐阅读
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 本文讨论了读书的目的以及学习算法的重要性,并介绍了两个算法:除法速算和约瑟夫环的数学算法。同时,通过具体的例子和推理,解释了为什么x=x+k序列中的第一个人的位置为k,以及序列2和序列3的关系。通过学习算法,可以提高思维能力和解决问题的能力。 ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
crazyuzy327
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有