热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习折腾记(0):开启从ScikitLearn入门机器学习算法之旅

到2018年,AI其实都没有这么火了,因为区块链更火,一个是改变生产力,一个是改变生产关系,社区如是说。当然

到2018年,AI其实都没有这么火了,因为区块链更火,一个是改变生产力,一个是改变生产关系,社区如是说。

当然,技术社区从来对去中心化都是特别热衷的,这也就见怪不怪了,2019年,什么技术又会更火?拭目以待。

最近,短视频被降火,这真的是计划没有变化快。

学习机器学习,我的建议是,有空就去看《深度学习》这本书,能够从基础打牢AI相关知识。再了解了解业界最新进展什么的,很多人都不知道机器学习该如何入门,而很多文章一上来就说要学数学,要看大牛们的公开课等等,吓退了一波又一波人。

简单说,机器学习不过是一种计算机算法,只因他是我们认知里的智能有了联系,加上需要大量数据的计算,才让我们觉得有点高大上。实际上,人工智能还有很长的路要走。

后续,我会基于《机器学习系统设计》这本书,分小结来具体实战带你入门机器学习,只要你有一点点基础就行,书名有点高大上,而实际上就是一些算法分章节的介绍而已,不要被名字吓到。

希望你在撸代码的同时,对机器学习能渐渐有更深入的了解,虽然DL4j和TensorFlow对于真实项目来说更好用,但我还是建议你从纯python入门,知其然并知其所以然,而平时有空闲时还能快速用python学习并验证一下,甚至写写别的什么应用,况且TensorFlow就是基于python的。


环境配置

一台电脑(window或mac os)


工具版本

主要工具:
Python 2.7.14(32位,足够)
NumPy 1.14.2
SciPy 1.0.1
Scikit-learn 0.19.1

辅助工具:
Matplotlib: 2.2.2(是Python编程语言及其数值数学扩展包 NumPy的可视化操作界面。它为利用通用的图形用户界面工具包,如Tkinter, wxPython, Qt或GTK+向应用程序嵌入式绘图提供了应用程序接口(API)。此外,matplotlib还有一个基于图像处理库(如开放图形库OpenGL)的pylab接口,其设计与MATLAB非常类似–尽管并不怎么好用。SciPy就是用matplotlib进行图形绘制。所以基本上都是附带引用。)
Ipython:5.6.0(是一种基于Python的交互式解释器。相较于原生的Python Shell,IPython提供了更为强大的编辑和交互功能。)
pandas:0.22.0(是一个开源的库,为Python编程语言提供了高性能,易用的数据结构和数据分析工具。其实就是用来读文件,清洗数据用的。)
Sympy:1.1.1(是一个符号计算的Python库。支持符号计算、高精度计算、模式匹配、绘图、解方程、微积分、组合数学、离散数学、几何学、概率与统计、物理学等方面的功能。)
nose :1.3.7(Python的测试工具框架)


第1步:安装python

双击.exe文件,mac os安装我也不太清楚,请查搜索引擎。


第2步:安装NumPy及SciPy

一句命令就搞定:

python -m pip install --user numpy scipy matplotlib ipython jupyter
pandas sympy nose

第3步:安装Scikit-learn

python -m pip install -U scikit-learn

第4步:安装IDE

推荐使用pycharm,使用Wing也不错(因为曾经很长一段时间项目中都用它,有点个人感情)
用惯了idea,用pycharm会很顺手,界面如下图:
这里写图片描述


小结

今天的文章主要说了配置python的机器学习环境,为了后续的学习先配好基础环境。


闲谈一分钟

很多人之所以觉得编程难学,一方面是学习本身的时间成本,而另一反面就是工具能不能用顺心,再就是大多数人并不重视配置环境而造成的。·

不要小看配置环境的这个过程,不同的版本可能会出现各种各样奇奇怪怪的编译问题,所以能够快速的配置好一个可供学习的编程环境尤其重要,特别对于初学者来说。

过去部署过程中踩过巨坑的人请举手!

个人认为,甚至影响了对学习编程兴趣程度,我过去使用Exclipse,觉得编程好难好难(新版其实好用多了,也有很多人喜欢用),而自从用了idea后,我才发现,原来哪怕只是一步的效率提升都能让感受完全不一样,也可能因为我是个感性重于理性的人才会这样,后来才明白只不过是一个偏好选择问题罢了。

当然python的环境配置比较简单了,而要是让你配置一个AIX下的Oracle RAC呢?而找到一件喜欢的工具,对于学习本身是会起很大作用的。


参考资源:

1、https://scipy.org/install.html
2、https://www.python.org/
3、http://scikit-learn.org/stable/install.html


推荐阅读
  • Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本)安装教程 ... [详细]
  • 通过Anaconda安装tensorflow,并安装运行spyder编译器的完整教程
    本文提供了一个完整的教程,介绍了如何通过Anaconda安装tensorflow,并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统,并提供了相关的网址供参考。通过本教程,读者可以轻松地安装和配置tensorflow环境,以及运行spyder编译器进行开发。 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • Python实现变声器功能(萝莉音御姐音)的方法及步骤
    本文介绍了使用Python实现变声器功能(萝莉音御姐音)的方法及步骤。首先登录百度AL开发平台,选择语音合成,创建应用并填写应用信息,获取Appid、API Key和Secret Key。然后安装pythonsdk,可以通过pip install baidu-aip或python setup.py install进行安装。最后,书写代码实现变声器功能,使用AipSpeech库进行语音合成,可以设置音量等参数。 ... [详细]
  • Python已成为全球最受欢迎的编程语言之一,然而Python程序的安全运行存在一定的风险。本文介绍了Python程序安全运行需要满足的三个条件,即系统路径上的每个条目都处于安全的位置、"主脚本"所在的目录始终位于系统路径中、若python命令使用-c和-m选项,调用程序的目录也必须是安全的。同时,文章还提出了一些预防措施,如避免将下载文件夹作为当前工作目录、使用pip所在路径而不是直接使用python命令等。对于初学Python的读者来说,这些内容将有所帮助。 ... [详细]
  • 本文介绍了iOS开发中检测和解决内存泄漏的方法,包括静态分析、使用instruments检查内存泄漏以及代码测试等。同时还介绍了最能挣钱的行业,包括互联网行业、娱乐行业、教育行业、智能行业和老年服务行业,并提供了选行业的技巧。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • 使用eclipse创建一个Java项目的步骤
    本文介绍了使用eclipse创建一个Java项目的步骤,包括启动eclipse、选择New Project命令、在对话框中输入项目名称等。同时还介绍了Java Settings对话框中的一些选项,以及如何修改Java程序的输出目录。 ... [详细]
  • 单页面应用 VS 多页面应用的区别和适用场景
    本文主要介绍了单页面应用(SPA)和多页面应用(MPA)的区别和适用场景。单页面应用只有一个主页面,所有内容都包含在主页面中,页面切换快但需要做相关的调优;多页面应用有多个独立的页面,每个页面都要加载相关资源,页面切换慢但适用于对SEO要求较高的应用。文章还提到了两者在资源加载、过渡动画、路由模式和数据传递方面的差异。 ... [详细]
  • Python操作MySQL(pymysql模块)详解及示例代码
    本文介绍了使用Python操作MySQL数据库的方法,详细讲解了pymysql模块的安装和连接MySQL数据库的步骤,并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作,帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]
  • Python使用Pillow包生成验证码图片的方法
    本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号,并添加干扰象素,生成一幅验证码图片。需要配置好Python环境,并安装Pillow库。代码实现包括导入Pillow包和随机模块,定义随机生成字母、数字和字体颜色的函数。 ... [详细]
  • 本文介绍了协程的概念和意义,以及使用greenlet、yield、asyncio、async/await等技术实现协程编程的方法。同时还介绍了事件循环的作用和使用方法,以及如何使用await关键字和Task对象来实现异步编程。最后还提供了一些快速上手的示例代码。 ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
  • 有什么3D框架或者插件值得学习的?推荐一个前端开发者的常用工具列表:1.lodash:一个一致性、模块化、高性能的JavaScript实用工具库。2.ramda:一个很重要的库,提 ... [详细]
author-avatar
蓝星星空
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有