热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

大学刚毕业,零基础大数据如何入门?

这篇文章中,本文作者将针对三种不同的、想要进入数据科学领域的人群,给出自己的经验,帮助他们迅速有效入行。无论是软件工程师、应届毕业生,还是完全初学者,都要问自己一个关键问题:什么样

这篇文章中,本文作者将针对三种不同的、想要进入数据科学领域的人群,给出自己的经验,帮助他们迅速有效入行。无论是软件工程师、应届毕业生,还是完全初学者,都要问自己一个关键问题:什么样的职业轨迹最接近你。如果你是想成功入门数据分析师或数据可视化专家,那么这将是协助你走上正确的职业轨迹的最好方法。

webp

虽然没有适合每个人的万能解决方案,但这三类建议值得想转行的你一看。

一、如果你是零基础小白新手上路

如果你刚刚进入数据科学领域,请记住这一点:这个领域发展很快,我在这里给出的建议基本上在你工作时已经过时了。能满足2017年招聘岗位要求的建议策略,在如今可能就不满足,而今天的数据科学领域招聘标准与一两年后的标准之间的差异可能更大。

对大数据以及人工智能概念都是模糊不清的,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。从java和linux入手,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相关知识一一分享!

因此,如果你打算在数据科学领域发展事业,并且没有编程经验和STEM(科学Science,科技Technology,工程Engineering,数学Mathematics四门学科英文首字母的缩写)背景,那么这里有一些建议:

首先要保持开放的心态。如果你是一个新手,那么你实际上并不知道什么是数据科学,所以它完全有可能不是你想要的工作领域。请与LinkedIn上的一些数据科学家进行联系,请他们喝咖啡并向他们请教;并关注数据科学播客。要成为数据科学家需要花费大量的时间和精力,如果仅因你自认为驾驭数据科学很酷,然后就一头扎进去,这并不是冒险的好理由。请确保充分了解数据科学中不好的方面,比如数据整理,以及构建数据生产流水线,而这些工作占了数据科学家日常工作的大部分时间。

如果你决定要从事数据科学领域的工作,那太好了!你首先要做的是学习Python。尽快在MOOC(大规模网络公开课平台即慕课)上选择相关的课程项目。当熟悉Python基本用法后,请学习如何使用Jupyter otebooks工具,并选学一些数据科学领域的网络公开课。

如果你是完全从零开始的,一开始就以高级的数据科学职位为目标可能不太好,选择一些入门级的职位比较好,比如数据可视化或数据分析职业的需求量很大,并且市场需求也大。这些岗位的人员通常与数据科学家一起工作,一旦你积累了相关经验,就为今后的胜任更高级的数据科学相关职位奠定了基础。

如何包装个人品牌:如果你已经准备好申请工作,你可能会惊讶地发现个人品牌在数据科学中非常重要。由于你没有任何专业经验,或者没有计算机科学专业的研究生学位,你也许会担心个人亮点不足。但实际上这可能是最大的优势所在:如自学成才的开发人员/数据科学家,这些将成为公司可以利用的快速学习和努力工作的优点。但问题是,你背负着去实现那个形象的重担:这是一座陡峭的山需要你去攀登,但是回报肯定是值得的。

二:如果你已经是一枚软件工程师

在我遇到的专业数据科学家中约有20%是软件工程师,一方面,他们有从编写程序到形成产品的工作经验,是开发团队中难得的经验人才。另一方面,对于全栈开发人员的需求很多,使得公司比较愿意朝着全栈工程师方向培养软件工程师,即使他们的录用通知上写的职位是“数据科学”。所以你要避免被当作软件工程师而不是数据科学家。

其他一些建议:

首先可以先往更注重后端/数据库的方向上靠。把深化对数据生成线流水线的认识作为良好的开端,可以帮助你建立关键的数据处理技能;当然也可以帮你重塑自己,把自己塑造成一个经验丰富的数据管理者。

机器学习工程可能是更容易过渡到数据科学领域的,因为它和该领域的研究内容最接近。你可以先着手部署模型或将它们集成到现有应用程序,因为这可以充分利用你的现有技能,这是迈出第一步的好方法,反正以后你总是可以投入更多精力到模型开发中的。

为了让招聘人印象深刻,你很可能需要建立机器学习或数据科学项目。那么利用你的软件工程技能,把这些项目集成到可以向招聘人员和技术主管展示的应用程序中。这会特别有效,因为它很直观,并体现了你作为一个全栈数据科学家的潜力。

要记住的是:在过渡期,你的薪资极大可能会变少。即使是高级软件工程师换到数据科学领域时,通常也是要先过渡到初级职位的,但令人惊讶的是,他们中的很多人在做决定时并没有考虑这个因素,然而拿到的薪资少了,却又失望。

如何包装个人品牌:一个最简单的方法就是充分利用你的软件开发经验。作为初级职员,已经知道如何编写干净、文档齐全的代码,以及如何与他人协作,这是大多数职位申请者不具备的。如果要真正做到善于写“干净的产品代码”,你还需要尽可能多的去学习数据科学领域中类似的好案例。

三、如果你是相关专业的应届毕业生,新CS、数学或物理学毕业生

如果你是应届理科本科,硕士或博士毕业生,那么你统计学和数学基础可能很好。但你可能从来没有申请过真正的工作职位,也不知道如何准备面试。而且就算你在读期间一直有编码,但很可能无法编写干净、组织良好的代码。

所以要记住以下几点:

你在读期间所学的R是不够的。如果你是一名物理学家,并且赌定要用MATLAB或Mathematica的技能找到工作,那这可能不太会如愿;所以学习Python吧。

你可能需要尽快学习这些你没接触过的东西:协作版本控制(学习如何用GitHub与其他人一起工作)、容器化(学习如何使用Docker)和开发(学习如何用AWS或类似的服务在云上部署模型)。另外,sql也是必须的。

学习Python中的测试驱动开发,如何使用文档字符串,如何对代码进行模块化,以及如何使用Jupyter笔记本(如果还不会的话)。

如果你的领域特别注重数学,那么深度学习可能是一个很好的探索方向。但你可能会发现,从更传统的“scikit-learn”类型的数据科学开始起步,再过渡到深度学习可能更容易。最重要的是要入行,并尽快开始编程。

如何包装个人品牌::特别是如果你学的是数学或物理专业,那么最好的策略是要呈现出自己是具有深厚理论知识的人。要做到这一点,你需要能够自信地解释各种模型是如何工作的,最好要熟悉文献中最新的热点(特别是如果你的目标是深度学习的话)。

当然我所提供的建议并不能涵盖所有职业。对于软件工程师而言,他们确实比其他人走的远一些,一些有数学基础的初学者可能是最适合的深度学习的研究者。但是以上这些建议能为你的技能精进提供一个好的起点。对大数据以及人工智能概念都是模糊不清的,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。从java和linux入手,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相关知识一一分享!



推荐阅读
  • 数据对比分析图PPT(127.0.0.1表示什么)的使用方法和意义
    本文介绍了数据对比分析图PPT的使用方法和意义,解释了127.0.0.1的含义,并提供了相关资源下载。同时还讨论了目标管理的概念和MBO的实施方法。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 腾讯安全平台部招聘安全工程师和数据分析工程师
    腾讯安全平台部正在招聘安全工程师和数据分析工程师。安全工程师负责安全问题和安全事件的跟踪和分析,提供安全测试技术支持;数据分析工程师负责安全产品相关系统数据统计和分析挖掘,通过用户行为数据建模为业务决策提供参考。招聘要求包括熟悉渗透测试和常见安全工具原理,精通Web漏洞,熟练使用多门编程语言等。有相关工作经验和在安全站点发表作品的候选人优先考虑。 ... [详细]
  • 本文总结了使用不同方式生成 Dataframe 的方法,包括通过CSV文件、Excel文件、python dictionary、List of tuples和List of dictionary。同时介绍了一些注意事项,如使用绝对路径引入文件和安装xlrd包来读取Excel文件。 ... [详细]
  • 数据分析的组成部分及其商业价值
    本文介绍了数据分析的组成部分,包括数据采集、数据挖掘和数据可视化,并强调了数据挖掘的商业价值和数据可视化的重要性。数据分析是通过挖掘数据中的规律来指导业务的过程,而数据可视化则可以直观地呈现数据分析的结果。 ... [详细]
  • PHP组合工具以及开发所需的工具
    本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件,包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境,包括推荐的AppServ等版本。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • 本文介绍了如何对PHP二维数组进行排序以及如何获取最大值。同时还提到了在数据分析系统中使用排序的实例,以及如何统计角色等级和创建角色总数。 ... [详细]
  • 建站ABC智能电销机器人的功能特点及应用优势
    近年来,人工智能化运用越来越普及,各大科技公司为了能够引领市场抢占商机,开发出了多款产品,像建站ABC的电话机器人就是其中之一。电话机器人又名智能电销机器人,是当下各大企业常用的一种工具软件,他能高效率工作、低成本管理,是企业的AI智能外呼助手,功能强大且使用率高。建站ABC智能电销机器人拥有降低人工成本、提高工作效率、提升销售业绩等特点,无论大小型企业均可使用,并可以定制化服务,保障不同企业的不同需求。 ... [详细]
  • tableau 倒序都倒了_Tableau|可视化报表设计详细操作步骤
    承接上篇文章,本文主要讲可视化报表中常用图表的具体操作步骤,及搭建仪表盘的方法经验。Tableau的模块分为三个:图表、仪表盘、故事。在底 ... [详细]
  • AI行业的下一个风口是医疗?创业者们这样说
    ▼点击上方蓝字关注网易智能为你解读AI领域大公司大事件,新观点新应用编者按:4月10日,鲸准AI产业价值峰会在北京举行。本次大会除了邀请A ... [详细]
  • 转化率低?应该这样做数据分析!
    在互联网业务中,转化率无处不在:投放转化率:有多少人从广告链接,进到我们的商品页面?购买转化率: ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
author-avatar
手机用户2502876011
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有