热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据分析_年薪50万的大数据分析师养成记

篇首语:本文由编程笔记#小编为大家整理,主要介绍了年薪50万的大数据分析师养成记相关的知识,希望对你有一定的参考价值。以下是一位在数据分析领域打滚了N年后的

篇首语:本文由编程笔记#小编为大家整理,主要介绍了年薪50万的大数据分析师养成记相关的知识,希望对你有一定的参考价值。


以下是一位在数据分析领域打滚了N年后的分析师写下的一些总结和体会大家可以借鉴学习!

 

一、成为数据分析师有哪些要求?

1、理论知识要宽泛,涉及数学、市场和技术。要求及对数据敏感,包括统计知识、市场研究、模型原理等。

2、常规分析工具的使用,包括数据库、数据挖掘、统计分析工具,常用办公软件(Excel、PPT、思维导图)等等。

3、有一定的业务理解能力,能理解业务背后的商业逻辑。因为只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。

4、数据报告和数据可视化的能力。数据分析得再好,如果不能以漂亮的方式“表达”,成效也会大打折扣。

 

二、把数据分析当做一种能力来培养

现在大多工作都需要你拥有逻辑分析能力,尤其是对数据的分析理解。在数据化运营理念深入的今天,BAT这样的大型互联网公司强调全员参与数据化运营,把数据分析当作一种能力在培训,也必定是未来趋势。

 

三、数据分析师所需具备的能力和知识(从数据分析的4个步骤来理解)

数据分析的四个步骤:数据获取、数据处理、数据分析、数据呈现。

1、数据获取

数据获取看似简单,但是需要把握对问题的商业理解,转化成数据问题来解决,直白点讲就是需要哪些数据,从哪些角度来分析,界定问题后,再进行数据采集。此环节,需要数据分析师具备结构化的逻辑思维。

推荐书籍:《金字塔原理》、麦肯锡三部曲:麦肯锡意识、工具、方法;

推荐工具:思维导图工具(Xmind\百度脑图等);

2、数据处理

数据的处理需要掌握有效率的工具:

Excel及高端技能:日常工作通用,容易掌握,处理10万级别的数据很轻松。

学习高端Excel需要哪些技能?

学习excel是个循序渐进的过程

 

基础:简单的表格数据处理、打印、查询、筛选、排序

函数和公式:常用函数、高级数据计算、数组公式、多维引用、function

可视化图表:图形图示展示、高级图表、图表插件

数据透视表、VBA程序开发

按照我习惯的方法,先过一遍基础,知道什么是什么,然后找几个case练习。多逛逛excelhome论坛,平常多思考如何用excel来解决问题,善用插件,还有记得保存。

帆软FineReport:专业的报表工具,日常做报表设计一个模板可通用,只要会写SQL就可上手。相比excel做报表,开发的技术要求较少,能很快地开发常规报表、动态报表,并可以放在移动端和大屏查看。

 

 技术分享

 

 技术分享

 

Oracle和SQL sever:企业最常用的千万级别的数据库,熟练掌握SQL语言。

保持不断的技术学习,比如学习新流行的Hadoop之类的分布式数据库来提升个人能力,对求职有帮助。

3、分析数据

分析数据往往需要各类统计分析模型,如关联规则、聚类、分类、预测模型等等。

因此,熟练掌握一些统计分析工具不可免:

SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。

SAS:经典挖掘软件,需要编程。

R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。

各类BI工具:

 

Tableau:可视化工具的鼻祖,对于处理好的数据可作自由的可视化分析,图表效果惊人

大数据BI工具FineBI:类同Tableau,可在前端做任意维度分析;数据可在前端继续处理(计算、筛选过滤等),可对接hadoop之类的大数据平台,数据处理性能较好。

 

 技术分享

 

推荐书籍:

1、《说菜鸟不会数据分析》系列,入门级书,初学者最适。

2、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,内容很系统很全面。

3、《市场研究定量分析方法与应用》,简明等编着,中国人民大学出版社。

4、数据可视化呈现

很多数据分析工具已经涵盖了数据可视化部分,只需要把数据结果进行有效的呈现和演讲汇报,可用word\PPT\H5等方式展现。

 

四、关于数据分析师的职业发展

1、数据分析师通常分两类,技术型分析师和业务型分析师,分工不同,但各有优势。

技术型分析师是在专门的挖掘团队里面从事数据挖掘和分析工作的。如果你能在这类专业团队学习成长,那是幸运的,但进入这类团队的门槛较高,需要扎实的数据挖掘知识、挖掘工具应用经验和编程能力。该类分析师更偏向技术线条,未来的职业通道可能走专家的技术路线。技术型分析师的角色包括数据工程师、挖掘工程师、数据科学家、建模工程师、数据架构师、ETL工程师等,这些称谓都或多或少代表了其工作性质。

业务型分析师是下沉到各业务团队或者运营部门的数据分析师,成为业务团队的一员。他们工作是支撑业务运营,包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等。该类型分析师偏向产品和运营,可以转向做运营和产品。

2、数据分析师的理想行业在互联网,但条条大道通罗马,走合适你的路线。

从行业的角度来看:

1)互联网行业是数据分析应用最广的行业,其中的电商企业,更是目前最火的,而且企业也更重视数据分析的价值,是数据分析师理想的成长平台。

2)其次是咨询公司(比如专门的数据挖掘公司Teradata、尼尔森等市场研究公司),他们需要数据分析人才,而且相对来说,数据分析师在咨询公司成长的速度更快,专业也会更全面。

3)再次是金融行业,比如银行和证券等行业,该行业对数据分析的依赖需求,越来越大。

4)最后是电信行业(中国移动、联通和电信),它们拥有海量的数据,在严峻的竞争下,也越来越重视数据分析,但进入这些公司的门槛比较高。

 

五、什么人适合学习数据分析?

这个问题之前有详细写过一篇文章哪些人能做好数据分析?就好比学功夫一样,既要有天赋也要有后天的努力,但我想后者占大部分,铁杵也能磨成针。

六、如何系统地学习数据分析?

学习方法千万种,关键是找到适合自己的,最好能够结合你的工作遇到的问题来学习。

这里我列举一个经典的从0到1的入门方法

第一周:Excel学习掌握

第二周:数据可视化

第三周:分析思维的训练

第四周:数据库学习

第五周:统计知识学习

第六周:业务学习

第七周:Python/R学习

 

七、最后

请再次问问自己,是否真的喜欢数据分析,能否忍受处理数据时的寂寞?如果是,那就宜早不宜迟,马上开始行动吧。

再次强调:

1、把数据分析作为一种能力培养,让自己在现在的团队中展现出良好的数据分析能力,为你以后内部转岗做好准备。如果内部转岗不成,你可以考虑跳槽到我之前分析的行业中,但我强烈建议你还是需要把系统开发的编程能力学习好,并且对商业智能系统(BI和CRM)有一定了解,这也许是应聘数据分析的优势。如果没有数据分析经验去应聘,相对会难一些,用人单位会考你统计和数据挖掘模型方面的知识,以及工具使用情况。

2、扎实学好一、两门数据挖掘软件,基于你已有得编程基础,可以学SAS或者R,基本能够满足很大部分企业的需求。

3、多看多想多观察,学习业务职能是这样,细水长流,还需要不断工作积累和广泛的阅读。

最后,希望你能够成为你想成为的人!



推荐阅读
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • Metasploit攻击渗透实践
    本文介绍了Metasploit攻击渗透实践的内容和要求,包括主动攻击、针对浏览器和客户端的攻击,以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码,以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • Voicewo在线语音识别转换jQuery插件的特点和示例
    本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件,该插件具有快速、架构、风格、扩展和兼容等特点,适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]
  • 本文介绍了通过ABAP开发往外网发邮件的需求,并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定,可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度:184字。 ... [详细]
  • 成功安装Sabayon Linux在thinkpad X60上的经验分享
    本文分享了作者在国庆期间在thinkpad X60上成功安装Sabayon Linux的经验。通过修改CHOST和执行emerge命令,作者顺利完成了安装过程。Sabayon Linux是一个基于Gentoo Linux的发行版,可以将电脑快速转变为一个功能强大的系统。除了作为一个live DVD使用外,Sabayon Linux还可以被安装在硬盘上,方便用户使用。 ... [详细]
  • 本文介绍了django中视图函数的使用方法,包括如何接收Web请求并返回Web响应,以及如何处理GET请求和POST请求。同时还介绍了urls.py和views.py文件的配置方式。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 如何提高PHP编程技能及推荐高级教程
    本文介绍了如何提高PHP编程技能的方法,推荐了一些高级教程。学习任何一种编程语言都需要长期的坚持和不懈的努力,本文提醒读者要有足够的耐心和时间投入。通过实践操作学习,可以更好地理解和掌握PHP语言的特异性,特别是单引号和双引号的用法。同时,本文也指出了只走马观花看整体而不深入学习的学习方式无法真正掌握这门语言,建议读者要从整体来考虑局部,培养大局观。最后,本文提醒读者完成一个像模像样的网站需要付出更多的努力和实践。 ... [详细]
  • HTML5网页模板怎么加百度统计?
    本文介绍了如何在HTML5网页模板中加入百度统计,并对模板文件、css样式表、js插件库等内容进行了说明。同时还解答了关于HTML5网页模板的使用方法、表单提交、域名和空间的问题,并介绍了如何使用Visual Studio 2010创建HTML5模板。此外,还提到了使用Jquery编写美好的HTML5前端框架模板的方法,以及制作企业HTML5网站模板和支持HTML5的CMS。 ... [详细]
  • 一次上线事故,30岁+的程序员踩坑经验之谈
    本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间,作为一个在线医疗项目,他们进行了优惠折扣活动的升级改造。然而,在上线前的最后一天,由于大量数据请求,导致部分接口出现问题。作者通过部署两台opentsdb来解决问题,但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]
  • Sleuth+zipkin链路追踪SpringCloud微服务的解决方案
    在庞大的微服务群中,随着业务扩展,微服务个数增多,系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来,实现请求链路跟踪。通过Feign调用和Request传递TraceId,将整个调用链路的服务日志归组合并,提供定位和追踪的功能。 ... [详细]
  • PHP组合工具以及开发所需的工具
    本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件,包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境,包括推荐的AppServ等版本。 ... [详细]
  • Firefox火狐浏览器关闭到http://detectportal.firefox.com的流量问题解决办法
    本文介绍了使用Firefox火狐浏览器时出现关闭到http://detectportal.firefox.com的流量问题,并提供了解决办法。问题的本质是因为火狐默认开启了Captive portal技术,当连接需要认证的WiFi时,火狐会跳出认证界面。通过修改about:config中的network.captive-portal-service.en的值为false,可以解决该问题。 ... [详细]
  • Python开源库和第三方包的常用框架及库
    本文介绍了Python开源库和第三方包中常用的框架和库,包括Django、CubicWeb等。同时还整理了GitHub中最受欢迎的15个Python开源框架,涵盖了事件I/O、OLAP、Web开发、高性能网络通信、测试和爬虫等领域。 ... [详细]
author-avatar
自行脑补
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有