热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

爬取6874条数据,告诉你数据分析师的薪资待遇~!

公众号:中国统计网01报告背景随着互联网大数据的日益火热,各大企业对于数据的需求逐日增加。大数据浪潮的袭来,带来了数据分析师岗位的就业。基

公众号:中国统计网

01 报告背景

随着互联网大数据的日益火热,各大企业对于数据的需求逐日增加。大数据浪潮的袭来,带来了数据分析师岗位的就业。基于此,对前程无忧关于数据分析师岗位招聘的数据进行系统的分析。
02 分析目的
本分析报告解决以下三个问题:
1. 数据分析师岗位在哪些城市需求量较大?
2. 数据分析师岗位的薪资待遇情况是如何?
3. 数据分析师岗位薪资待遇的发展趋势如何?
03 分析报告

1. 准备数据源
利用爬虫工具对前程无忧进行数据分析岗搜索结果进行爬虫,提取分析字段:职位名称、公司名称、工作城市、薪资待遇、学历要求、工作经验以及公司规模。
640?wx_fmt=jpeg
2. 数据清洗
2.1. 清洗学历要求字段
因前程无忧学历项不是必填项,在爬虫过程中会抓取错误数据,需要清洗掉。结果如下。
处理过程:将包含“招”的单元格直接替换为“无要求”
640?wx_fmt=jpeg
2.2. 清洗工作城市
将类似于“广州-天河区”调整为“广州”,便于后期统计城市数据。
处理过程:利用数据分列直接调整。
640?wx_fmt=jpeg
2.3. 删除数据重复项
职位ID是唯一识别码,所以对职位ID进行排重。
处理过程:利用删除重复项功能进行删除。

640?wx_fmt=jpeg
2.4. 清洗薪资待遇
  • 将日薪直接删除,日薪234个数据均为同一家公司发布的招聘信息,对整体数据会存在一定的干扰性。

  • 将年薪直接删除,年薪234个数据均为同一家公司发布的招聘信息,对整体数据会存在一定的干扰性。

  • 将月薪的区间范围调整为最低值和最高值。

处理过程:
最低薪资:利用FIND函数求得“-”从左开始第几位,然后利用LEFT函数从左开始取值,取值范围比“-”位数少1即可;加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
最高薪资:利用LEN函数求得单元格字符总长度,再减去利用FIND函数求得“-”的位数,即可求得“-”以后的字符总长度。利用MID函数取值“-”以后的字符再减去3(3即为千/月)。加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
平均薪资:利用AVERAGE函数直接求平均值。
删除【薪资待遇】列
640?wx_fmt=jpeg
2.5. 清洗异常值
将不包含“数据分析”、“数据运营”和“分析师”等字符的职位删除掉。

处理过程:利用FIND函数查找特殊字符并返回结果值,利用COUNT函数计数,利用IF函数判定,如果计数成功则为“是”,表示符合数据分析师岗位;如果计数失败则为“否”,表示不符合,可以删除。
剩余2293条数据。
640?wx_fmt=jpeg
3. 数据结果可视化
3.1. 数据分析师岗位在哪些城市需求量较大?

640?wx_fmt=jpeg
640?wx_fmt=jpeg

  • 依据柱形图所示,数据分析师岗位在上海、广州、深圳和北京需求是偏多的。

  • 依据饼形图所示,数据分析师在上海、广州、深圳和北京的需求量接近总数的67%。

小结,如果从事数据分析师岗位,在北上广深可以提升成功的概率。
3.2. 数据分析师岗位的薪资待遇情况是如何?

640?wx_fmt=jpeg

依据柱形图所示,数据分析师岗位大部分集中在1-3年和3-5年,属于年轻化和朝阳化的行业。5-10年的岗位急剧下降,也就是意味着如果5年后没有能力的提升,那么你的就业竞争就会很大。

640?wx_fmt=jpeg

依据柱形图所示,数据分析师薪资待遇深圳和北京最高,其次是上海和杭州。追求高薪可以去这些城市发展。
3.3. 数据分析师岗位薪资待遇的发展趋势如何?
640?wx_fmt=jpeg
依据折线图所示,随着工作年限的逐步增加,薪资待遇也会逐步增加。

报告总结

1)从就业需求来讲,大量的工作机会集中在北上广深和新一线城市。如果想从事数据分析工 作,去这些城市将提升你成功的条件概率。

2)从薪资待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。

3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年和3-5年。对于数据分析师来说,5年的就业岗位数量急剧下降,如果在5年之内没有提升自己的能力,以后的竞争压力会比较大。

4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。


注:因特殊原因,数据图表均未标识数据来源以及爬虫工具名称,请忽略此点。

请扫码关注:

640?wx_fmt=other



推荐阅读
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 本文介绍了新款奇骏的两个让人上瘾的功能,分别是智能互联系统和BOSE音响。通过对新款奇骏的配置和功能进行评测,探讨了这两个新增功能的使用体验和优势。此外,还介绍了新款奇骏的其他配置和改进,如增加的座椅和驾驶辅助系统,以及内饰的舒适性提升。对于喜欢音响的消费者来说,BOSE音响的升级也是一个亮点。最后,文章提到了BOSE音响的数字还原能力,以及7座版无法配备BOSE音响的原因。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 2022年的风口:你看不起的行业,真的很挣钱!
    本文介绍了2022年的风口,探讨了一份稳定的副业收入对于普通人增加收入的重要性,以及如何抓住风口来实现赚钱的目标。文章指出,拼命工作并不一定能让人有钱,而是需要顺应时代的方向。 ... [详细]
  • Python开源库和第三方包的常用框架及库
    本文介绍了Python开源库和第三方包中常用的框架和库,包括Django、CubicWeb等。同时还整理了GitHub中最受欢迎的15个Python开源框架,涵盖了事件I/O、OLAP、Web开发、高性能网络通信、测试和爬虫等领域。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • 开发笔记:Python之路第一篇:初识Python
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python之路第一篇:初识Python相关的知识,希望对你有一定的参考价值。Python简介& ... [详细]
  • ORACLE空间管理实验5:块管理之ASSM下高水位的影响
    数据库|mysql教程ORACLE,空间,管理,实验,ASSM,下高,水位,影响,数据库-mysql教程易语言黑客软件源码,vscode左侧搜索,ubuntu怎么看上一页,ecs搭 ... [详细]
  • 本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题,并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息,同时也提到了相关的警告信息和函数的替代方案。通过阅读本文,读者可以了解到如何解决Python连接服务器失败的问题,并对aiohttp模块有更深入的了解。 ... [详细]
  • 006_Redis的List数据类型
    1.List类型是一个链表结构的集合,主要功能有push,pop,获取元素等。List类型是一个双端链表的结构,我们可以通过相关操作进行集合的头部或者尾部添加删除元素,List的设 ... [详细]
  • Ubuntu安装常用软件详细步骤
    目录1.GoogleChrome浏览器2.搜狗拼音输入法3.Pycharm4.Clion5.其他软件1.GoogleChrome浏览器通过直接下载安装GoogleChro ... [详细]
author-avatar
家有吃货_魏ranran
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有