初学python和机器学习,想知道怎样才能达到自己独立编写程序的能力?
作者:他w与他说 | 来源:互联网 | 2017-05-14 02:43
我正在学习python。以前大学学过一点C.但是只能应付考试的水平。现在从事零售业,但是确实太热爱计算机和编程。买了一本python学习手册和一本python核心编程在看。但是把字符串,字典,列表看完以后感觉很困惑。因为虽然上面的习题都能做,但是不知道怎样用这些来构建一个程序很多代码和函数定义都一知半解,即使明白算法的运作原理但是却无法独立不看书写出属于自己的代码。只能单纯照着书上的代码写。我想知
我正在学习python。以前大学学过一点C.但是只能应付考试的水平。现在从事零售业,但是确实太热爱计算机和编程。买了一本python学习手册和一本python核心编程在看。但是把字符串,字典,列表看完以后感觉很困惑。因为虽然上面的习题都能做,但是不知道怎样用这些来构建一个程序很多代码和函数定义都一知半解,即使明白算法的运作原理但是却无法独立不看书写出属于自己的代码。只能单纯照着书上的代码写。我想知道怎样才能将这些知识转变成能够自己写出属于自己的代码的能力。我想以后从事机器学习或者数据挖掘的工作。
回复内容:
先把Python练好,第一遍过完教程之后,可以从生活中拿一些小需求来练手,找一些别人的代码看看,尝试重写一遍。知乎上相关的问题可以关注一下:
Python 有哪些一千行左右的经典练手项目? - 编程
你是如何自学 Python 的? - 调查类问题
Python 的练手项目有哪些值得推荐? - 编程
在学Python期间,可以看看机器学习或数据挖掘的书,比如:
在数据分析、挖掘方面,有哪些好书值得推荐? - 书籍推荐
如何系统地学习数据挖掘? - 数据挖掘
然后慢慢试着实现一些算法,参加阿里的天池比赛或kaggle练练手,就算入门了吧,再想办法找个相关的工作,慢慢的就能进入大道了
有部分从事机器学习,科学计算的研究生,编程不大会,直接上python 第三方库,硬写代码,会碰到很多困难,建议补补基础知识。
自己能不能写代码解决问题,是衡量有没有学会编程的方法。
建议不能只学语法,需要学习计算思维,编程思路,解决问题的方法。
请看黄哥本人写的文章
如何捅破python编程的那层纸
article/pythonstudy.md at master · pythonpeixun/article · GitHub
剪刀石头布小习题三种语言python2、php、go代码
article/jdstb.md at master · pythonpeixun/article · GitHub
一段小代码说明@property装饰器的用法
一段小代码说明@property装饰器的用法
如何捅破python编程的那层纸之二
如何捅破python编程的那层纸之二
如何捅破python编程的那层纸之三
如何捅破python编程的那层纸之三
黄哥python远程视频培训班
article/index.md at master · pythonpeixun/article · GitHub
黄哥python培训试看视频播放地址
article/python_shiping.md at master · pythonpeixun/article · GitHub
推荐给你一本书《集体智慧编程》。
里面所有的例子都是用python写的,由浅入深,不要看一遍就过,把所有的代码敲一遍,你会从中学到很多东西。
相对于python,这本书给我的感觉更像是你需要的那种思想,利用编程解决问题的那种思想。
最后说一句,在你成长的过程中或许会受到质疑,不要去理会,做自己想做的事,你的成功就是消灭质疑最有力的武器。
加油
不是打击你自信心
在中国,想做机器学习这一行的,基本都要研究生
而且你都工作了,只能社招,阿里大数据竞赛可能你就参加不了
面试时候,面试官问你个快速排序,二叉树什么的,估计你就写不出来
面试官再问你,操作系统啊,计算机网络啊,海量数据啊等等知识,你觉得你该怎么应对呢
既然是机器学习,起码面试时候会来几个推导一下机器学习数学过程吧,然后再扯一点统计学概率论什么的,再问几个C++或者Java知识也不为过吧,然后再聊聊现在很热的Hadoop/Spark/Storm等等
如果你想去小公司做数据挖掘机器学习当我没说(但是小公司去做机器学习基本直接从大公司挖人过来的),想去中等或者大公司的话,我觉得除非你在KDD或者Kaggle上做出很好的成绩了,否则,还是准备考研把,或者就平时想想就算了吧(毕竟全中国在做和数据挖掘相关岗位的人也不多,岗位需求也不大)
最后建议,真的很喜欢Python和机器学习的话,去做个数据运营挺不错的
用python写一写机器学习实战里面的代码,了解一些简单的聚类分类算法原理,能写kmeans,朴素贝叶斯啥的就行了,因为这些都有第三方库,如果不做数据量太大的话直接用sklearn这个库,特别方便。如果数据量大的话要分布式的话我只用mapreduce写过不分布式也有很多现成的库,所以机器学习算法这方面主要是要懂原理,知道每个算法怎么去应用。
分类的算法那么多,遇到具体数据集应该用那种就需要理解每种算法的原理和联系,比如遇到非正态分布的数据分类时用LDA不可以,遇到离散数据分类时可能用决策树,这些都不是绝对的,哪个好用哪个。机器学习算法那么多,想了解所有的太困难,每个大类了解一些基础的baseline,用到哪块再具体研究。比如推荐系统这方面,基础的算了解之后,做比赛发现仍然不能出好的效果,因为数据预处理是很重要的,无论在比赛还是在项目中,而数据预处理就要用到很多很多机器学习算法。
至于工作里面,不是很了解,但是经过实习3个月了解到的就是,机器学习用的不多,多的是找规则,筛选数据,无穷无尽。。。
你的水平连Python的门都没入,建议不要想着写程序,机器学习,先把Py语法弄懂,一些OOP语言的特性熟练以后再去做打算。
你刚把列表字典看完,路还远着呢,可以看看慕课网教程,每个知识点都有习题
感觉好像是没有任何基础,都不知道该从哪里说起了。
你可以用sklearn,先在小规模数据上应用机器学习算法试试。
或者你可以看看《机器学习实战》和《集体编程智慧》
重在练习,可以上checkio做题,挺适合初学者的,难度适中,完成一道题后,看看别人的答案,还是挺有收获的。
推荐阅读
-
本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章,第1.2节Spark的重要扩展,作者于俊向海代其锋马海平,更多章节内容可以访问云栖社区“华章社区”公众号查看1. ...
[详细]
蜡笔小新 2023-10-16 18:07:56
-
全文共3744字,预计学习时长7分钟本文将介绍21个你可能没使用过的机器学习开源工具。每个开源工具都为数据科学家处理数据库提供了不同角度。本文将重点介绍五种机器学习的 ...
[详细]
蜡笔小新 2023-10-15 15:52:17
-
-
来源:AI前线本文约6700字,建议阅读10分钟。本文分析了建设分布式训练平台的过程中的痛点所在,为你介绍Kubeflow与其核心组件及其 ...
[详细]
蜡笔小新 2023-10-14 16:58:41
-
一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ...
[详细]
蜡笔小新 2023-10-17 16:06:09
-
公众号后台回复关键词:pyspark,获取本项目github地址。MLlib是Spark的机器学习库,包括以下主要功能。实用工具ÿ ...
[详细]
蜡笔小新 2023-10-14 16:50:50
-
Python入门后,想要从事自由职业可以做哪方面工作?1.爬虫很多人入门Python的必修课之一就是web开发和爬虫。但是这两项想要赚钱的话 ...
[详细]
蜡笔小新 2023-10-17 16:29:09
-
MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型,MapReduce的计算过程被封装的很好,我们只用使用Map和Reduce函数,所以对其整体的计算过程不是太 ...
[详细]
蜡笔小新 2023-10-16 14:14:27
-
深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ...
[详细]
蜡笔小新 2023-10-16 05:57:42
-
二、回顾整理阿里面试题基本就这样了,还有一些零星的问题想不起来了,答案也整理出来了。自我介绍JVM如何加载一个类的过程,双亲委派模型中有 ...
[详细]
蜡笔小新 2023-10-15 19:48:25
-
目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ...
[详细]
蜡笔小新 2023-10-15 12:16:30
-
大家好,今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数 ...
[详细]
蜡笔小新 2023-10-14 14:20:07
-
朱熹读书之法,在循序渐进,熟读而精思。2019年转眼就要过去了,这一年,你读了哪些书,得到了哪些收获ÿ ...
[详细]
蜡笔小新 2023-10-14 10:40:34
-
GradientDescent-梯度下降梯度下降法(英语:Gradientdescent)是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找 ...
[详细]
蜡笔小新 2023-10-17 14:30:10
-
最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ...
[详细]
蜡笔小新 2023-10-17 10:01:37
-
总体来说大概有以下2个大的步骤1.连接集群(yarnrunner或者是localjobrunner)2.submitter.submitJobInternal()在该方法中会创建 ...
[详细]
蜡笔小新 2023-10-16 13:03:18
-