热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

CV北邮鲁鹏老师全连接神经网络(下)learningdialog(6)

https:www.bilibili.comvideoBV1V54y1B7K3?p6https:www.bilibili.comvideoBV1V54y1B7K3?p6https:

https://www.bilibili.com/video/BV1V54y1B7K3?p=6https://www.bilibili.com/video/BV1V54y1B7K3?p=6icon-default.png?t=L9C2https://www.bilibili.com/video/BV1V54y1B7K3?p=6

回顾:

基于动量法的GD:注意他是直接改变梯度值 g = f(g)

        减少震荡:震荡的时候梯度是正负值依次出现,因此用上一次的梯度值来抵消这一次的梯度

        加速平坦:累加

基于自适应思想的GD:这种方法没有利用震荡时梯度正负值交替出现的特点,而是利用平方运算(平方梯度)放  大梯度的大小,改造学习率,从而达到有效梯度下降的目的

关于loss

(1)一般的loss计算

(2)带正则损失的loss计算

(3)softmax交叉熵

过拟合与欠拟合

overfit:参数过多,过于复杂的模型掩盖了真正重要的参数,相当于只是牢牢记住训练集。比如说学习识别猫,有些图像猫只有三只脚,模型就记住了这一点

underfit:参数过少,没有触及到多数真正重要的参数

总的来说,两者都没能很好地学习到数据特征

由此,ML的根本问题就是模型的优化和泛化

 大框可以叫训练前期,小框可以叫训练后期

处理overfit

最优方案:增加数据集。比如说获取全世界所有的猫图片

次优方案:1.缩小网络  2.增加正则损失,因为他使模型朝向权值分散修正,尽量使用所有特征

                  3.随即失活,丢弃学习。一方面缩小了网络,一方面间接起到了分散权值的作用 ,最后可以看作多个小网络的集成

随机失活的评估

假设dropout = 0.5,可以计算出训练阶段输出层某个神经元的期望,比较测试阶段该神经元的期望,就会发现两者不匹配,需要乘上一个dropout

那么我们就设置一个dropout层,在做随机失活的同时先除掉这个dropout.

dropout层的计算不是按照矩阵乘法的规则,而是按位相乘

超参数调优

法一:排列组合,网格法

法二:随机搜索。感觉上还是要在跟网格法一样的取值范围内

 

如何进行随机搜索?

1.粗搜索。在较大范围内采样,训练一个周期,选择验证集正确率小的范围

2.精搜索:在上步骤训练5-10个周期,选择在验证机上精度最高的 

搜索的范围如何确定?超参数的标尺空间?

这个值要涉及到不同量级,所以是在log空间中选取

 


推荐阅读
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • Android源码中的Builder模式及其作用
    本文主要解释了什么是Builder模式以及其作用,并结合Android源码来分析Builder模式的实现。Builder模式是将产品的设计、表示和构建进行分离,通过引入建造者角色,简化了构建复杂产品的流程,并且使得产品的构建可以灵活适应变化。使用Builder模式可以解决开发者需要关注产品表示和构建步骤的问题,并且当构建流程发生变化时,无需修改代码即可适配新的构建流程。 ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了一些好用的搜索引擎的替代品,包括网盘搜索工具、百度网盘搜索引擎等。同时还介绍了一些笑话大全、GIF笑话图片、动态图等资源的搜索引擎。此外,还推荐了一些迅雷快传搜索和360云盘资源搜索的网盘搜索引擎。 ... [详细]
  • HTML学习02 图像标签的使用和属性
    本文介绍了HTML中图像标签的使用和属性,包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项,帮助读者更好地理解和应用图像标签。 ... [详细]
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
  • 带添加按钮的GridView,item的删除事件
    先上图片效果;gridView无数据时显示添加按钮,有数据时,第一格显示添加按钮,后面显示数据:布局文件:addr_manage.xml<?xmlve ... [详细]
  • 抽空写了一个ICON图标的转换程序
    抽空写了一个ICON图标的转换程序,支持png\jpe\bmp格式到ico的转换。具体的程序就在下面,如果看的人多,过两天再把思路写一下。 ... [详细]
  • 读手语图像识别论文笔记2
    文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)一、前言一句:“做完了&#x ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 本篇文章笔者在上海吃饭的时候突然想到的这段时间就有想写几篇关于返回系统的笔记,所以回家到之后就奋笔疾书的写出来发布了事先在网上找了很多方法,发现有 ... [详细]
author-avatar
爱文小宝的贇
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有