热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

漫谈京东(一)——自营手机类商品数据分析

前言

这几天,为了给我的网站(https://pricemonitor.online/ )提供数据,我爬取了京东手机数码类产品的大部分自营商品以及部分非自营商品数据,总共11162条。——2018.3.8

包括如下类别:(运营商类除外)
漫谈京东(一)——自营手机类商品数据分析

其中,
自营商品:4616条。
非自营商品:6546条。

数据分析

今天,让我们先来看看人们(我)最为关心的手机类别吧!

在排除了非自营手机和合约机后,我们得到了129部京东自营手机的产品信息:
漫谈京东(一)——自营手机类商品数据分析

接下来是一些数据:

在129部手机中,只有4个手机有PLUS会员价格,他们是:

漫谈京东(一)——自营手机类商品数据分析

根据店铺将手机分类,得到如下手机所属店铺条形图:

漫谈京东(一)——自营手机类商品数据分析

前三名分别是:华为小米三星。如果算上华为旗下荣耀系列,那么华为的产品线实属庞大。值得注意的是,魅族在产品数量上排名第四,超过了vivo和oppo。

价格区间分布:

漫谈京东(一)——自营手机类商品数据分析

可以看出,目前最热门的手机价格区间是1100-1600这个区间段,有29部之多。

当价格来到3500以上时,手机的数量大幅度下降,大概只有几个品牌才能在这个价格区间拥有竞争力。

总体来看,600-2000元这个价位的竞争相当激烈。

各品牌手机累计销量:

京东的累计销量是否将全部历史数据都统计在内我们不得而知,当该图依然具有很大参考价值。

漫谈京东(一)——自营手机类商品数据分析

小米凭借惊人的557w勇夺销量冠军。而这两年有上升势头的锤子手机也取得了很好的成绩,位列小米苹果之后。
oppo/vivo蓝绿大厂在电商的销量显然不占据优势,但是架不住人家实体店多呀。

漫谈京东(一)——自营手机类商品数据分析

接下来,让我们看看商品名称词云:

我们将所有自营手机的商品名称使用python的jieba库进行分词,用wordcloud进行词云绘制,并经过一系列排重和优化后,得到了下图。

漫谈京东(一)——自营手机类商品数据分析

词云给我们带来的信息还是很多的,并且十分有趣。

电信移动联通三大关键词,几乎每个手机的名称里都包含。

可以看出很多热词,例如:全网通/4GB/64GB/双卡。(把这些组合起来,就是一部标配手机啊哈哈)

我一直以为会有很多‘全面屏’相关的关键词,现在看来这种趋势还没有显现。

商品副标题词云

我们再将商品的副标题单独拿出来看看,副标题一般会包含一些促销信息。

漫谈京东(一)——自营手机类商品数据分析

可以看出,很多副标题都会卖力的介绍手机的特点,比如快充,尺寸,配置,摄像头像素等。当然,也少不了优惠信息,那个大大的100可是画在那呢。

后记

今天就先这么多,如果小伙伴们有什么好的想法,或者想要看到什么样的数据信息,都可以在下方留言讨论。

当然,我也欢迎你们与我交流爬虫与数据相关技术。
本文京东爬虫项目地址:https://github.com/qqxx6661/Price-monitor(求Star)
我做了一个京东商品监控网站:https://pricemonitor.online/
纯粹兴趣,完全免费。

功能为:
- 用户设置商品监控:自定义提醒价格,价格低于预期收到提醒邮件。
- 品类商品监控:监控整个品类商品价格,一但某些低于指定折扣,收到商品信息提醒邮件。
漫谈京东(一)——自营手机类商品数据分析

咱们有缘再见。

转载请注明本文地址!


推荐阅读
  • Python开源库和第三方包的常用框架及库
    本文介绍了Python开源库和第三方包中常用的框架和库,包括Django、CubicWeb等。同时还整理了GitHub中最受欢迎的15个Python开源框架,涵盖了事件I/O、OLAP、Web开发、高性能网络通信、测试和爬虫等领域。 ... [详细]
  • 开发笔记:Python之路第一篇:初识Python
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python之路第一篇:初识Python相关的知识,希望对你有一定的参考价值。Python简介& ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 2022年的风口:你看不起的行业,真的很挣钱!
    本文介绍了2022年的风口,探讨了一份稳定的副业收入对于普通人增加收入的重要性,以及如何抓住风口来实现赚钱的目标。文章指出,拼命工作并不一定能让人有钱,而是需要顺应时代的方向。 ... [详细]
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • 学习笔记(34):第三阶段4.2.6:SpringCloud Config配置中心的应用与原理第三阶段4.2.6SpringCloud Config配置中心的应用与原理
    立即学习:https:edu.csdn.netcourseplay29983432482?utm_sourceblogtoedu配置中心得核心逻辑springcloudconfi ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 求职屡屡碰壁,埋头苦学5个月斩获16000元offer,终于懂了没有人能随随便便成功
    求职屡屡碰壁,埋头苦学5个月斩获16000元offer,终于懂了没有人能随随便便成功-我以前一直认为,只要有耐心,有决心,有信心,就可以在社会上立足,干出一番事业。但是经历了社会的 ... [详细]
author-avatar
龙争虎斗石榴agj
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有