热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

2019.6.1日关于图书馆借来的基本数据分析和挖掘的书

目前借了5本,在读3本。《数据挖掘你必须知道的32个经典案例》任昱衡李倩星米晓飞著中国工信出版社2016年1月第1版目前已经出版第二版2018年10月本书通过丰富的案例

目前借了5本,在读3本。

《数据挖掘 你必须知道的32个经典案例》  

任昱衡 李倩星 米晓飞 著 中国工信出版社 2016年1月第1版  目前已经出版第二版2018年10月

本书通过丰富的案例简要介绍数据挖掘相关算法及实际应用,除了部分算法推导需要一定数学知识,主要内容比较直白生动,贴近现实实用。适合初学者,但是还要结合一定的基础知识。最好是学了数据挖掘相关课程后,作为案例加强深入理解的入门级书籍。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。

泛读一遍,最大的感触是数据挖掘在现在社会的各行各业应用真是太多了,但是有些也有一定的局限性,所以要与时俱进,多多更新知识,勤加思索,做到整合后有思索有创新。

以下是主要目录:

第1章 经典的探索性数据分析案例 1
1.1 探索性数据分析综述 2
1.2 数据巧收集――红牛的大数据营销案例 4
1.2.1 状况百出的红牛企业 4
1.2.2 红牛企业巧妙收集消费者数据 6
1.2.3 数据收集小结 8
1.3 数据可视化――数据新闻促使英军撤军 9
1.3.1 维基解密带来的海量数据 9
1.3.2 百花齐放的数据新闻 11
1.3.3 数据可视化小结 15
1.4 异常值分析――Facebook消灭钓鱼链接 16
1.4.1 Facebook和广告商之间的拉锯战 17
1.4.2 异常值分析指导排名算法工作 18
1.4.3 异常值分析小结 22
1.5 对比分析――TrueCar指导购物者寻找最合算的车价 24
1.5.1 火中取栗的TrueCar网站 24
1.5.2 数据对比赢得消费者信赖 26
1.5.3 对比分析小结 29
第2章 经典的相关分析与回归分析案例 31
2.1 相关回归综述 32
2.2 皮尔逊相关值――纽约市政府利用相关分析监控违法建筑 34
2.2.1 简约而不简单的消防检测系统 34
2.2.2 使用相关分析洞察60个变量的关系 36
2.2.3 相关分析小结 39
2.3 时间序列分析――人寿保险的可提费用预测 41
2.3.1 人寿保险公司和可提费用 41
2.3.2 使用四种时间序列回归预测模型解决问题 43
2.3.3 时间序列分析小结 46
2.4 线性回归分析――梅西百货公司的十二项大数据策略 48
2.4.1 从“一亿豪赌”说起的零售商困境 48
2.4.2 SAS公司帮助梅西百货构建模型 50
2.4.3 线性回归分析小结 53
2.5 Logistic回归分析――大面积流感爆发的预测分析 56
2.5.1 究竟谁才是流感预测算法之王 56
2.5.2 向Logistic算法中引入更多变量 58
2.5.3 Logistic回归分析小结 61
第3章 经典的降维数据分析案例 63
3.1 降维分析算法综述 64
3.2 粗糙集算法――协助希腊工业发展银行制定信贷政策 66
3.2.1 银行信贷政策的制定原则 66
3.2.2 粗糙集算法原理和应用 67
3.2.3 粗糙集算法小结 71
3.3 因子分析――基于李克特量表的应聘评价法 73
3.3.1 源于智力测试的因子分析 73
3.3.2 使用因子分析解构问卷 75
3.3.3 因子分析小结 78
3.4 最优尺度分析――直观评估消费者倾向的分析方法 80
3.4.1 市场调查问题催生的最优尺度分析 80
3.4.2 六种经典的最优尺度分析解读方法 82
3.4.3 最优尺度分析小结 86
3.5 PCA降维算法――智能人脸识别的应用与拓展 88
3.5.1 刷脸的时代来了 88
3.5.2 使用PCA算法完成降维工作 90
3.5.3 PCA算法小结 93
第4章 经典的模式识别案例 95
4.1 模式识别综述 96
4.2 图像分析――谷歌的超前自动驾驶技术 98
4.2.1 以安全的名义呼吁自动驾驶技术 98
4.2.2 快速成熟的无人驾驶技术 100
4.2.3 图像分析小结 103
4.3 遗传算法――经典的人力资源优化问题 105
4.3.1 使用有限资源实现利益最大化 105
4.3.2 遗传算法的计算过程 107
4.3.3 遗传算法小结 110
4.4 决策树分析――“沸腾时刻”准确判断用户健康水平 111
4.4.1 打造我国最大健身平台 111
4.4.2 信息增益和决策树 113
4.4.3 决策树小结 116
4.5 K均值聚类分析――HSE24通过为客户分类降低退货率 118
4.5.1 在电子商务市场快速扩张的HSE24 119
4.5.2 使用K均值聚类为客户分类 120
4.5.3 K均值聚类小结 123
第5章 经典的机器学习案例 127
5.1 机器学习综述 128
5.2 语义搜索――沃尔玛搜索引擎提升15%销售额 130
5.2.1 注重用户体验的沃尔玛公司 130
5.2.2 语义搜索引擎的底层技术和原理 132
5.2.3 语义搜索技术小结 135
5.3 顺序分析――搜狗输入法的智能纠错系统 137
5.3.1 搜狗输入法的王牌词库和智能算法 137
5.3.2 频繁树模式和顺序分析算法 140
5.3.3 顺序分析小结 143
5.4 文本分析――经典的垃圾邮件过滤系统 144
5.4.1 大数据时代需要文本分析工作 145
5.4.2 垃圾邮件过滤中的分词技术和词集模型 146
5.4.3 文本分析小结 149
5.5 协同过滤――构建个性化推荐系统的经典算法 151
5.5.1 协同过滤算法为什么这么流行 151
5.5.2 基于用户和基于产品的协同过滤 153
5.5.3 协同过滤算法小结 155
第6章 经典的深度学习案例 159
6.1 深度学习综述 160
6.2 支持向量机――乔布斯利用大数据对抗癌症 162
6.2.1 乔布斯和胰腺癌的八年抗战 162
6.2.2 医学统计学和支持向量机 164
6.2.3 支持向量机小结 168
6.3 感知器神经网络――最佳的房产价格预测算法 169
6.3.1 如何在我国预测房价 170
6.3.2 多层感知器和误差曲面 171
6.3.3 感知器神经网络小结 175
6.4 自组织神经网络――如何又快又好地解决旅行商问题 177
6.4.1 最优路径问题的典型模式和解决方法 177
6.4.2 自组织神经网络的拓扑结构和权值调整 178
6.4.3 自组织神经网络小结 182
6.5 RBM算法――为新闻报道智能分类 183
6.5.1 新闻报道智能分类的难与易 183
6.5.2 RBM算法的学习目标和学习方法 185
6.5.3 RBM算法小结 188
第7章 经典的数据挖掘案例 191
7.1 数据挖掘综述 192
7.2 判别分析――美国运通构建客户流失预测模型 194
7.2.1 美国运通公司的旧日辉煌 194
7.2.2 判别分析的假设条件和判别函数 196
7.2.3 判别分析小结 200
7.3 购物篮分析――找出零售业的最佳商品组合 201
7.3.1 名动天下的“啤酒和尿布”案例 202
7.3.2 购物篮分析的频繁模式 203
7.3.3 购物篮分析小结 207
7.4 马尔可夫链――准确预测客运市场占有率 208
7.4.1 复杂的客运市场系统 209
7.4.2 概率转移矩阵的求解方法 210
7.4.3 马尔可夫链小结 213
7.5 AdaBoost元算法――有效侦测欺诈交易的复合算法 215
7.5.1 弱分类器和强分类器之争 215
7.5.2 AdaBoost元算法的分类器构建方法 217
7.5.3 AdaBoost元算法小结 220
第8章 经典的商业智能分析案例 223
8.1 商业智能分析综述 224
8.2 KXEN分析软件――构建欧洲博彩业下注预测平台 226
8.2.1 现代博彩业背后的黑手 226
8.2.2 集体智慧和庄家赔率的联系 228
8.2.3 KXEN软件小结 231
8.3 数据废气再利用――物流公司数据成功用于评估客户信用 233
8.3.1 数据废气和黑暗数据的异同 234
8.3.2 论如何充分利用物流公司数据 235
8.3.3 数据废气再利用小结 239
8.4 必应预测――使用往期信息预测自然灾害 240
8.4.1 预测自然灾害的必要性 241
8.4.2 微软大数据预测的优与劣 242
8.4.3 必应预测小结 245
8.5 点球成金――助力NBA大数据分析的多种神秘软件 246
8.5.1 NBA的有效球员数据 247
8.5.2 有关点球成金的靠谱方法 249
8.5.3 点球成金小结 251


推荐阅读
  • 应用场景当遇到数据分类,聚类,预测等场景问题,普通的SQL方法无法解决,需要借助算法这件武器,比如聚类算法,分类算法,预测算法等等,但是手动去研究一个算法比较吃力,有没有那种工具, ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • JavaScript和Python是用于构建各种应用程序的两种有影响力的编程语言。尽管JavaScript多年来一直是占主导地位的编程语言,但Python的迅猛发展有 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • 今天凌晨开始苹果正式开始了iOS10的推送工作,使用iPhone和iPad的用户可 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 数据结构与算法的重要性及基本概念、存储结构和算法分析
    数据结构与算法在编程领域中的重要性不可忽视,无论从事何种岗位,都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外,还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]
  • Python入门后,想要从事自由职业可以做哪方面工作?1.爬虫很多人入门Python的必修课之一就是web开发和爬虫。但是这两项想要赚钱的话 ... [详细]
  • 支持向量机训练集多少个_25道题检测你对支持向量机算法的掌握程度
    介绍在我们学习机器算法的时候,可以将机器学习算法视为包含刀枪剑戟斧钺钩叉的一个军械库。你可以使用各种各样的兵器,但你要明白这些兵器是需要在合适的时间合理 ... [详细]
  • plt python 画直线_机器学习干货,一步一步通过Python实现梯度下降的学习
    GradientDescent-梯度下降梯度下降法(英语:Gradientdescent)是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找 ... [详细]
  • OAuth2.0指南
    引言OAuth2.0是一种应用之间彼此访问数据的开源授权协议。比如,一个游戏应用可以访问Facebook的用户数据,或者一个基于地理的应用可以访问Foursquare的用户数据等。 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
author-avatar
陈宏儒64721
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有