热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

AIAutoKeras

前言在数据集上训练神经网络时,主要有两个目标:定义符合数据集特性的神经网络架构。在许多试验中对一组超参数进行调优,从而使得模型具有较高的准

前言

在数据集上训练神经网络时,主要有两个目标:

  • 定义符合数据集特性的神经网络架构。
  • 在许多试验中对一组超参数进行调优,从而使得模型具有较高的准确率并且能够泛化至训练集和测试集之外的数据。

针对不同的数据集和问题,往往需要进行几十至上百次的实验,花费几百到上千小时的计算时间,才能找到神经网络架构和超参数之间的平衡。
期间需要专业的深度学习人员全程参与,因此实现一个可用的深度学习模型,对于非专业人员难度很大。

Google AutoML简介

HomePage: https://cloud.google.com/automl/

  • 基于Google最新的图像识别技术神经架构搜索( Neural Architecture Search ,NAS)的一套机器学习工具。
  • NAS会根据特定数据集搜索最佳神经网络架构,以在该数据集上执行特定任务,本质上来说,NAS就是用一套能够自动对模型进行调优的算法。
  • 利用AutoML可以轻松训练高性能深度网络,而无需用户掌握深度学习或AI知识,所需要的只是处理和组织数据(标记数据)。
  • 也就是说,使用AutoML的程序员或工程师无需定义其神经网络架构或对超参数调优,AutoML会自动完成这些工作。
  • 但AutoML是收费的,价格昂贵。

在Google AutoML框架下,将如下的算法迭代:

  • 在一个训练集上训练一个网络
  • 在一个测试集上评估上一步训练出的网络
  • 修正神经网络架构
  • 对超参数调优
  • 重复以上过程

AutoKeras简介
  • 可以认为是Google AutoML的开源替代方案, 是用于自动化机器学习的开源软件库,提供自动搜索深度学习模型的架构和超参数的功能。
  • 基于非常易用的深度学习数据库 Keras,使用NAS的最新版本ENAS(Efficient Neural Architecture Search),因此具有高效、安装简单、参数可调、案例丰富、易于修改等特点。
  • 使用Auto-Keras实现自动化深度学习,自动训练模型,几乎不需要干预,但通常是一个非常耗时的过程。
  • 不仅能帮助开发人员快速准确地创建模型,而且允许研究人员深入研究架构搜索。

AutoKeras官网信息
  • HomePage: https://autokeras.com/
  • GitHub:https://github.com/keras-team/autokeras
  • Getting Started: https://autokeras.com/start/

AutoKeras安装与示例

安装

通过pip install autokeras快速安装,然后就可以在准备好在的数据集上做自己专属的架构搜索。
注意:

  • 截止当期时间(2019-06-25),AutoKeras还处于“Pre-release“阶段,在实际安装和使用中还有很多问题。
  • 例如:https://github.com/keras-team/autokeras/issues/622
  • 具体版本发布信息可查看Releases:https://github.com/keras-team/autokeras/releases

示例 - MNIST

from keras.datasets import mnist
from autokeras.image.image_supervised import ImageClassifierif __name__ == '__main__':(x_train, y_train), (x_test, y_test) = mnist.load_data()x_train = x_train.reshape(x_train.shape + (1,))x_test = x_test.reshape(x_test.shape + (1,))clf = ImageClassifier(verbose=True)clf.fit(x_train, y_train, time_limit=12 * 60 * 60)clf.final_fit(x_train, y_train, x_test, y_test, retrain=True)y = clf.evaluate(x_test, y_test)print(y)

其他

一个合格的深度学习工程师,需要根据需求使用恰当的工具,这样可以事半功倍。
类似Google AutoML和Auto-Keras等自动机器学习技术和框架,实际上只是作为工具充实了工具箱,不应该也不能过度依赖。
更重要的是相关领域的专业知识,对于提高模型准确率非常关键。

转:https://www.cnblogs.com/anliven/p/6354593.html



推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • SpringBoot整合SpringSecurity+JWT实现单点登录
    SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
author-avatar
~~~
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有