开发笔记:赠书|图解机器学习算法，看这文就够了！

作者：skysky001 | 来源：互联网 | 2023-09-17 18:48

篇首语：本文由编程笔记#小编为大家整理，主要介绍了赠书|图解机器学习算法，看这文就够了！相关的知识，希望对你有一定的参考价值。

篇首语：本文由编程笔记#小编为大家整理，主要介绍了赠书 | 图解机器学习算法，看这文就够了！相关的知识，希望对你有一定的参考价值。

机器学习指的是计算机根据给定的问题、课题或环境进行学习&＃xff0c;并利用学习结果解决问题或课题等的一整套机制&＃xff08;图 1-1&＃xff09;。

图 1-1　分类的示意图

与机器学习共同成为热门话题的还有人工智能和深度学习。这里梳理一下它们之间的关系&＃xff08;图 1-2&＃xff09;。人工智能的含义很广泛&＃xff0c;是一个综合性系统。机器学习是实现人工智能的一种方法。也就是说&＃xff0c;机器学习并非实现人工智能的唯一方法&＃xff0c;但是近年来人工智能的研究一般使用机器学习。实现人工智能的方法还有很多&＃xff0c;比如根据事先定好的规则进行数理统计预测等方法。

近年来&＃xff0c;一种被称为深度学习的机器学习算法备受关注&＃xff0c;以至于出现了这样的误解&＃xff1a;提起人工智能&＃xff0c;人们想到的就是深度学习。然而&＃xff0c;深度学习只不过是机器学习算法的其中一种而已。深度学习在图像识别领域取得了划时代的成果&＃xff0c;是当前热门的算法。目前在图像识别领域之外&＃xff0c;深度学习也取得了许多成绩。

在进行机器学习时会用到各种各样的算法&＃xff0c;需要根据机器学习对象的不同进行选择。本书的目标就是帮助读者学会选择合适的算法。在理解了各算法的特性后&＃xff0c;读者就能实际处理机器学习问题了。

图 1-2　机器学习的包含关系

机器学习的种类

机器学习包含不同的种类。根据不同的输入数据&＃xff0c;分类如下。

有监督学习
无监督学习
强化学习

下面我们依次详细地看一下。

有监督学习

有监督学习是将问题的答案告知计算机&＃xff0c;使计算机进行学习并给出机器学习模型的方法。这种方法要求数据中包含表示特征的数据和作为答案的目标数据。

如图 1-3 所示&＃xff0c;已有表示特征的身高和体重数据&＃xff0c;作为答案的数据是性别&＃xff08;男 / 女&＃xff09;。我们向计算机提供这些数据的组合&＃xff0c;使计算机进行学习并给出预测模型。然后&＃xff0c;将新的身高和体重数据提供给模型&＃xff0c;由模型预测出性别。

预测性别这样的类别的问题叫作分类问题。由于这次是将数据分类到两个类别中&＃xff0c;所以叫二元分类&＃xff1b;还有将数据分类到更多类别&＃xff0c;比如 10 个类别的情况&＃xff0c;这样的情况叫作多元分类。这种答案变量不是连续值&＃xff0c;而是作为类别数据的离散值的问题就是分类问题&＃xff08;图 1-4&＃xff09;。

此外&＃xff0c;表示特征的数据叫作特征值或者特征变量&＃xff0c;作为答案的数据叫作目标变量或者标签。

我们身边的一个分类问题的例子就是垃圾邮件过滤。用户判断邮件是否为垃圾邮件的过程就是打标签的过程&＃xff0c;标签数据就是目标变量&＃xff0c;邮件的发件人和内容则为特征值。打了标签的数据越多&＃xff0c; 机器学习的效果就越好&＃xff0c;得到的结果的精度越高。

除了分类问题之外&＃xff0c;有监督学习还包括回归问题。如图 1-5 所示&＃xff0c;已有表示特征的性别和身高数据&＃xff0c;以及答案数据——鞋的尺码。在分类问题中&＃xff0c;男和女的标签分别被数值化为 0 和 1&＃xff0c;这两个数值之间的大小关系是没有意义的。与之相对&＃xff0c;鞋的尺码 26.5 cm 和 24 cm 之间的大小关系则是有意义的。对这样的数据进行预测的问题就是回归问题。在回归问题中&＃xff0c;目标变量是作为连续值处理的&＃xff0c;所以预测值有可能是 23.7 cm 这种不存在的尺码。

第 2 章将详细介绍如表 1-1 所示的有监督学习的算法。

无监督学习

有监督学习是将特征值和目标变量&＃xff08;答案&＃xff09;作为一套数据进行学习的方法&＃xff0c;而无监督学习的数据中没有作为答案的目标变量。

有人可能会产生疑问&＃xff1a;没有答案&＃xff0c;该如何去学习呢&＃xff1f;无监督学习将表示特征的数据作为输入&＃xff0c;通过将数据变形为其他形式或者找出数据中的部分集合&＃xff0c;来理解输入数据的构造。此外&＃xff0c;与有监督学习相比&＃xff0c;无监督学习的结果难以解释&＃xff0c;或者要求分析者基于经验加以主观的解释。有监督学习以 “能否正确预测目标变量”为指标&＃xff0c;相比之下&＃xff0c;为了能够对结果进行解释&＃xff0c;在进行无监督学习时&＃xff0c;用户需要对输入数据的前提知识有一定程度的了解。

这里举一个无监督学习的例子。我们思考一下对某个中学的学生成绩进行分析的场景。假设各科目之间存在着这样的关联性&＃xff1a;擅长数学的学生也擅长理科&＃xff0c;但不擅长语文和文科。

对于这样的输入数据&＃xff0c;在使用无监督学习的代表性算法主成分分析&＃xff08;Principal Component Analysis&＃xff0c;PCA&＃xff09;时&＃xff0c;我们引入了新的轴&＃xff0c;以说明被称为第一主成分的数据&＃xff08;关于 PCA&＃xff0c;详见 3.1 节&＃xff09;。在第一主成分上的坐标可以解释为“小值表明该生擅长理科&＃xff0c;大值表明该生擅长文科”&＃xff0c;如表 1-2 所示&＃xff0c;可以将数学、理科、语文、文科这 4 个特征值归纳在 1 个轴上加以展示。

这个例子使用 PCA 通俗易懂地解释了分析结果&＃xff0c;但是需要根据输入数据选择合适的算法。近年来&＃xff0c;无监督学习的研究在图像和自然语言处理方面取得了进展&＃xff0c;是当前备受瞩目的领域 &＃xff08;图 1-6&＃xff09;。这里介绍的 PCA 属于降维算法。降维是以更少的特征值来理解数据的算法。无监督学习中也包括聚类算法。聚类是将数据分类为几个簇&＃xff08;相似数据的集合&＃xff09;的算法。人类很难直接理解多变量数据&＃xff08;由 3 个以上的变量构成的数据&＃xff09;&＃xff0c;通过聚类&＃xff0c;数据能够以簇这种简单的形式进行展现。

第 3 章将详细介绍如表 1-3 所示的无监督学习的算法。通过表 1-3&＃xff0c;还可以了解每个算法适合的任务。

强化学习

强化学习是以在某个环境下行动的智能体获得的奖励最大化为目标而进行学习的方法。本书未涉及强化学习。

这里简单地介绍一下强化学习。在主机游戏&＃xff08;环境&＃xff09;中&＃xff0c;玩家&＃xff08;智能体&＃xff09;为了获得赛点&＃xff08;奖励&＃xff09;并取得最终的胜利&＃xff0c;会无数次地重复尝试。我们也可以把强化学习看作有监督学习的目标变量被作为奖励提供的情况。拿主机游戏的例子来说&＃xff0c;由于全部场景下所有操作的组合实在太多&＃xff0c;很难通过人力进行评估&＃xff0c;所以可以将游戏的场景和操作作为特征值&＃xff0c;将游戏赛点作为目标变量&＃xff0c;玩家无须依赖人力&＃xff0c;通过无数次的游戏即可自行收集特征值和目标变量的数据组。强化学习在重复地玩游戏、查看结果中不断学习更恰当的行动。

机器学习的应用

机器学习在各领域的应用都取得了较大进展&＃xff0c;比如自动驾驶领域的研究就很有名。在文章的自动分类和自动翻译方面&＃xff0c;机器学习成果颇丰。在医疗领域&＃xff0c;机器学习对 X 射线影像的分析有助于疾病的早期发现。

此外&＃xff0c;很早之前人们就将机器学习应用在气象信息领域了。近年来&＃xff0c;随着计算机越来越便宜&＃xff0c;数量越来越多&＃xff0c;机器学习的研究也在不断加速。互联网产业的发达和物联网&＃xff08;Internet of Things&＃xff0c;IoT&＃xff09;等技术的应用也为机器学习带来了丰富的数据。

本文来自《图解机器学习算法》。

《图解机器学习算法》

[日]秋庭伸也&＃xff0c;杉山阿圣&＃xff0c;寺田学著

郑明智译

赠书福利

你对深度学习感兴趣吗&＃xff1f;

欢迎与我们分享

AI科技大本营将选出三名优质留言

携手【图灵出版社】送出

《图解机器学习算法》一本

截止 2021 年 7 月 2 日 14&＃xff1a;00

更多精彩推荐赠书 | GNN 模型在生物化学和医疗健康中的典型应用什么&＃xff1f;我要对AI礼貌&＃xff1f;人机交互面临的道德漏洞几经沉浮&＃xff0c;人工智能前路何方&＃xff1f; 点分享点收藏点点赞点在看

推荐阅读

js
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
web
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
web
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
web
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
object
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
object
老牌医药收割AI红利：先投个15亿美元抢中国人才

萧箫发自凹非寺量子位报道|公众号QbitAI没想到，一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场，能看见不少熟悉的身影， ... [详细]

蜡笔小新 2023-10-17 17:40:25
get
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
get
SLAM优秀开源工程最全汇总

https:zhuanlan.zhihu.comp145750808 1、CartographerCartographer是一个系统，可跨多个平台和传感器配置以2D和3D形式提供实 ... [详细]

蜡笔小新 2023-10-16 11:09:06
get
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
get
开源真香离线识别率高 Python 人脸识别系统

本文主要介绍关于python,人工智能,计算机视觉的知识点，对【开源真香离线识别率高Python人脸识别系统】和【】有兴趣的朋友可以看下由【000X000】投稿的技术文章，希望该技术和经验能帮到 ... [详细]

蜡笔小新 2023-10-14 15:43:38
get
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
get
脑机接口和卷积神经网络的初学指南(一)

脑机接口和卷积神经网络的初学指南(一) ... [详细]

蜡笔小新 2023-10-13 11:11:52
get
谈谈对大数据的八个观点分析

越来越多程序员也涌入大数据行业，但是仔细问一些从业人员什么是大数据?鲜有人知道?就算知道的，最常引用Victor的4V理论，大量(Volume)，快速(Velocity)，种类多( ... [详细]

蜡笔小新 2023-10-13 06:24:46
get
《关于我的那些面经》——百度后端（附答案）

作者保证，本系列全是纯干货真实记录，绝对不是某些营销号瞎编乱造的面试。一、公司的简介百度是全球最大的中文搜索引擎，是中国最大的以信息和知 ... [详细]

蜡笔小新 2023-10-12 16:12:15
get
2017亚马逊人工智能奖公布：他们的AI有什么不同？

事实上，在我们周围，“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊，我们的世界正在变成一个机器 ... [详细]

蜡笔小新 2023-10-16 19:50:15

skysky001

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章