热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【DeeplearningAI】结构化机器学习项目(机器学习策略)

正交化

在我们对算法进行改进时,我们希望我们可以获得一个正交化的“旋钮”对每个不同的特征使用不同的“旋钮”进行调节


假如我们的算法在以下几个情况表现得不太好:

1.对训练集拟合的效果很好

        假如拟合的不好的话,那可能是欠拟合问题。加大神经网络深度或者使用别的梯度下降法

2.对验证集拟合的效果很好

        假如拟合的不好的话,使用正则化或者增大训练样本也许会有帮助

3.对测试集拟合的效果很好

        假如不好,那么增大验证集的样本数也许会有帮助

4.对现实应用效果很好

        假如不好,那就有可能是因为Cost function 不太正确或者是测试集和验证集没挑选好。


单一数字评估指标

当我们对不同的分类器进行评估时,往往会得到很多很多数值。这时候不能很直观地看出来哪个分类器的效果更好,我们需要使用单一数字评估指标。以分类器的召回率和准确率为例:

【Deep learning AI】结构化机器学习项目(机器学习策略)

Precision 和 Recall 的定义如上。

A和B我们不能很好地区分其分类效果,这时候我们就要用到“平均"的概念:F1-score   (harmonic mean)

【Deep learning AI】结构化机器学习项目(机器学习策略)

这样就能很好地区分A,B分类器的优劣了


满足指标和优化指标

分类器通常有许多个指标,类似准确率,召回率,速度等等。我们或许并不想要一个平均值,而是某个指标能够到达最大值,而其他指标能达到忍受范围之内


【Deep learning AI】结构化机器学习项目(机器学习策略)

如上,我们想要选取最高准确率的分类器,但是运行时间不得超过100ms。

准确率就是满足指标,其余的便是优化指标。

我们从N个指标中选出一个指标作为我们的满足指标,其他指标设置一个阈值作为优化指标。


训练集/开发集/测试集


对开发集和测试集的归类务必在同一分布之下,不然会变成(Zip code问题)

【Deep learning AI】结构化机器学习项目(机器学习策略)


什么时候开始改变开发集或者测试集的指标?

第一种情况

假设我们拥有两个分类器A,B


【Deep learning AI】结构化机器学习项目(机器学习策略)

看起来我们的A分类器误差更小,更加适合我们应用。但是假如A分类错误时会把色情图片推送给客户,而B虽然误差较大但不会把色情图片产生错误分类。这时我们就要改变开发集和测试集的指标了。

【Deep learning AI】结构化机器学习项目(机器学习策略)

重新定义Error函数如上。当是色情图片时,w的取值很大,使得Error增加很多。对色情图片的分类进行加权。


第二种情况

当我们的开发集与测试集都是高质量的图片,但当在现实应用中的图片都是低质量的,和开发测试集不是同一个分布之下的时候。我们就要考虑改变开发集与测试集了(eg:猫分类器)



根据人类的表现来和神经网络进行比较

【Deep learning AI】结构化机器学习项目(机器学习策略)


推荐阅读
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量,或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频,只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量,只有使用JAVA编写Android客户端才能实现压缩。此外,作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因,并提供了解决方法。最后,作者还介绍了一个用于处理图片的类,可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • MACElasticsearch安装步骤及验证方法
    本文介绍了MACElasticsearch的安装步骤,包括下载ZIP文件、解压到安装目录、启动服务,并提供了验证启动是否成功的方法。同时,还介绍了安装elasticsearch-head插件的方法,以便于进行查询操作。 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
author-avatar
木马
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有