热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据分析真实案例:excel&sql&pandas实现数据透视表功能

使用excel&sql&panda

image.png


一、案例背景





  • 接到需求



事情是这样的,一个眼光明媚的早上,领导看到昨天PV增长明显,于是就提出了如下需求:

image.png

ok,get到需求后,立马行动起来!



  • 分析需求



为什么pv会增长明显呢?首先,依据拆分的思想,网站有很多个板块,所以将总体pv拆分成n个板块(可以根据经验选择主要的板块进行分析),对这n个板块逐个进行分析;接着,由于孤数不立的原则:单看一天数据,无法判断具体哪个板块增长,哪个板块降低,因此,主要从日期、板块这两个维度进行分析。



  • 根据分析结果提数



”无情的提数机器“来了!首先确定需要用到的表:只需要访问日志表。

原始数据形式

简单看一下日志表中我们需要的两个主要字段(日期、网页链接):

image.png

目标数据形式

我们需要提出来的效果是这样的(数据当然不能给别人看咯):

image.png



  • 提数sql



太年轻的小菜我,紧急情况下,没想到用数据透视表,像个沙雕一样,写了屎一样的sql。(为了让大家引以为戒,我脸也不要了,展示出来吧)

image.png

没错,查9天的数据,我用了8个left join…



  • 数据可视化形成报告



为了让别人一眼就能从这近1000条数据中看出来谁增高了,谁降低了,那必须画个图,然后根据图进行描述分析,得出结果。(这段不重要,就略过了)


二、使用数据透视表



用又臭又长的sql得出报告后,总觉得心里不舒服,怎么能写这么烂的sql,于是,突然想到了数据透视表。



  • excel实现数据透视表



excel实现数据透视表就比较理所当然啦,因为数据透视表就是excel里面的概念。

第一步:先直接简单的select查出近9天的数据并保存为excel

第二步:数据透视表的使用

image.png

image.png

好了,excel的数据透视表就是这么简单好用,顺便也出来图了,但是很丑,可以直接改改,或者copy数据自己用工具作图分析。



  • pandas实现数据透视表



第一步:先直接简单的select查出近9天的数据并保存为excel(如果本地可以直接连生产的数据库,可以直接pd.read_sql()一步到位获取数据)

第二步:实现pandas的数据透视表功能

import pandas as pd
data = pd.read_excel('xxx.xlsx')
data_result = pd.pivot_table(data, index=["page"], columns=["date"], values=["page"], aggfunc={"page": "count"})
print(data_result)

image.png



  • sql实现数据透视表功能



sql一步到位,为了保护隐私和更方便大家看方法,我就简化了一下sql,如下:

select page,
count(case when date = '2020-07-01' then page end) as "2020-07-01",
count(case when date = '2020-07-02' then page end) as "2020-07-02",
count(case when date = '2020-07-03' then page end) as "2020-07-03",
from table_test
group by page

image.png

over!



推荐阅读
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了如何在MySQL中将零值替换为先前的非零值的方法,包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]
  • 本文讨论了如何优化解决hdu 1003 java题目的动态规划方法,通过分析加法规则和最大和的性质,提出了一种优化的思路。具体方法是,当从1加到n为负时,即sum(1,n)sum(n,s),可以继续加法计算。同时,还考虑了两种特殊情况:都是负数的情况和有0的情况。最后,通过使用Scanner类来获取输入数据。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 如何在php中将mysql查询结果赋值给变量
    本文介绍了在php中将mysql查询结果赋值给变量的方法,包括从mysql表中查询count(学号)并赋值给一个变量,以及如何将sql中查询单条结果赋值给php页面的一个变量。同时还讨论了php调用mysql查询结果到变量的方法,并提供了示例代码。 ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • 本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型,其中DDL语句用于定义、删除和修改数据表,关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外,还介绍了常见的数据库数据类型,包括integer、text和real。 ... [详细]
  • MySQL外键1对多问题的解决方法及实例
    本文介绍了解决MySQL外键1对多问题的方法,通过准备数据、创建表和设置外键关联等步骤,实现了用户分组和插入数据的功能。详细介绍了数据准备的过程和外键关联的设置,以及插入数据的示例。 ... [详细]
  • 本文介绍了在MySQL8.0中如何查看性能并解析SQL执行顺序。首先介绍了查询性能工具的开启方法,然后详细解析了SQL执行顺序中的每个步骤,包括from、on、join、where、group by、having、select distinct、union、order by和limit。同时还介绍了虚拟表的概念和生成过程。通过本文的解析,读者可以更好地理解MySQL8.0中的性能查看和SQL执行顺序。 ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有