热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【数据可视化】第三章——数据可视化综合实践

Matplotlib作业数据.csv文件查看百度网盘:链接:https:pan.baidu.coms1oFB_KwhiJNlJAgXg7RaYuw?pw





Matplotlib作业数据.csv文件查看百度网盘:链接:https://pan.baidu.com/s/1oFB_KwhiJNlJAgXg7RaYuw?pwd=abcd
提取码:abcd



1.作业描述

作业:根据Matplotlib作业数据.csv做出4种不同类型的组合图像

要求:根据情况适当添加信息,如:标题,坐标轴信息,图例信息,特殊值标注等。

可参考制作内容包括并不限于:
评分最高的20部电影的投票人数分布(柱状图,条形图)
不同国家2012-2016年发行电影数量(折线图,簇状柱形图)
不同类型电影2012-2016年发行数量(簇状柱形图)
不同类型电影所占比值(饼图)
电影时长分布分析(直方图)
电影时长,豆瓣评分与投票人数的相关关系(气泡图)




2.参考代码:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import pandas as pd
import seaborn as sbn
matplotlib.rcParams['font.family'] = 'SIMHEI'
matplotlib.rcParams['font.size'] = 18

提示:如果报错,请检查包是否下载完成,在python环境中输入:
pip install xxx

df = pd.read_csv(r"E:/Matplotlib作业数据.csv",encoding="gbk",index_col="名字").dropna()
# 评分最高的20部电影的投票人数分布(柱状图,条形图)
df1 = df.sort_values(by="评分",ascending=False)
df2 = df1.iloc[0:20,:]
# 不同国家2012-2016年发行电影数量
df3 = df["产地"].value_counts()
# 不同类型电影2012-2016年发行数量(簇状柱形图)
df4 = df["类型"].value_counts()
# 计算相关系数
df5 = df[["时长","评分","投票人数"]].corr()

plt.figure(figsize = (25,35),dpi = 150)
plt.subplot2grid(shape=(3,3),loc=(0,0),colspan=3)
# 第一个图 评分最高的20部电影的投票人数分布(柱状图,条形图)
a = [s[:5] for s in df2.index]
b = df2["投票人数"]
plt.barh(a, width =b,height = 0.5,color = 'orange',edgecolor = 'silver',linewidth = 3)
plt.yticks(a,fontsize = 12)
plt.grid(True)
plt.title('评分最高的20部电影的投票人数分布',fontweight="bold") #图标题
plt.ylabel('电影名称')
plt.xlabel('人数')
plt.subplot2grid((3,3),(1,0),colspan=2)
# 第二个图 不同国家2012-2016年发行电影数量 折线图
a = df3.index
b = df3.to_list()
plt.plot(a,b,color = 'g', linestyle = '-.',linewidth = 3,
marker = 'h', markerfacecolor = 'c', markersize = 15)
bm = np.argmax(b)
plt.text(a[bm],b[bm],'最大值', fontproperties = 'Kaiti', fontsize = 15)
plt.xticks(a,rotation = 45)
plt.title('不同国家2012-2016年发行电影数量',fontweight="bold") #图标题
plt.xlabel('国家')
plt.ylabel('电影数量')
plt.grid(True)
plt.subplot2grid((3,3),(1,2),rowspan=2)
# 第三个图
# 不同电影时长分布
a = df["时长"]
d = 20
num_bins = np.ceil((np.ptp(a))/d).astype(np.int64)
b = np.arange(min(a),max(a)+d,d)
plt.hist(a,num_bins,range = (min(a),min(a)+d*num_bins),density = False,color="coral")
plt.xticks(b)
plt.grid()
plt.xlabel("分钟")
plt.ylabel("数量")
plt.title("不同电影时长分布",fontweight="bold")
plt.subplot2grid((3,3),(2,0),colspan=1)
sbn.heatmap(df5,cmap='GnBu',annot=True,linewidths=0.3, linecolor='gray')
plt.title("相关关系热力图",fontweight="bold")
plt.subplot2grid((3,3),(2,1),colspan=1)
# 第五个图
sizes = df4.to_list() #设置每部分大小
labels = df4.index
explode = [0.05,0,0,0,0,0,0,0,0,0,0] #设置每部分凹凸
# colors = ['c','g','b','m']
colors = matplotlib.cm.rainbow(np.arange(len(sizes))/len(sizes))
plt.pie(sizes,
labels = labels,
explode = explode,
colors = colors,
labeldistance = 1,
autopct = '%.1f%%',
counterclock = False,
startangle = 170,
shadow = False)
plt.title('不同类型电影所占比值',fontweight="bold");#设置标题

最终效果如图:
在这里插入图片描述







推荐阅读
  • 基于词向量计算文本相似度1.测试数据:链接:https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码:f4vx2.实验代码:imp ... [详细]
  • EzPP 0.2发布,新增YAML布局渲染功能
    EzPP发布了0.2.1版本,新增了YAML布局渲染功能,可以将YAML文件渲染为图片,并且可以复用YAML作为模版,通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片,让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子,介绍了使用ezpp的基本渲染方法,以及如何使用canvas、text类元素、自定义字体等。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 动量|收益率_基于MT策略的实战分析
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了基于MT策略的实战分析相关的知识,希望对你有一定的参考价值。基于MT策略的实战分析 ... [详细]
  • 用pandas库修改excel文件里的内容,并把excel文件格式存为csv格式,再将csv格式改为html格式
    假设有Excel文件data.xlsx,其中内容为:     ID age height    sex weight张三  1  39    181 female     85李四  2  40    180   male     80王五  3  38    178 female     78赵六  4  59    1 ... [详细]
  • 本文介绍了Python对Excel文件的读取方法,包括模块的安装和使用。通过安装xlrd、xlwt、xlutils、pyExcelerator等模块,可以实现对Excel文件的读取和处理。具体的读取方法包括打开excel文件、抓取所有sheet的名称、定位到指定的表单等。本文提供了两种定位表单的方式,并给出了相应的代码示例。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 无损压缩算法专题——LZSS算法实现
    本文介绍了基于无损压缩算法专题的LZSS算法实现。通过Python和C两种语言的代码实现了对任意文件的压缩和解压功能。详细介绍了LZSS算法的原理和实现过程,以及代码中的注释。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • 树莓派语音控制的配置方法和步骤
    本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助,文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行,然后使用Eoman的控制方法,即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]
  • 十大经典排序算法动图演示+Python实现
    本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序,常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念,并提供了相关的名词解释。 ... [详细]
  • 超级简单加解密工具的方案和功能
    本文介绍了一个超级简单的加解密工具的方案和功能。该工具可以读取文件头,并根据特定长度进行加密,加密后将加密部分写入源文件。同时,该工具也支持解密操作。加密和解密过程是可逆的。本文还提到了一些相关的功能和使用方法,并给出了Python代码示例。 ... [详细]
  • 本文总结了使用不同方式生成 Dataframe 的方法,包括通过CSV文件、Excel文件、python dictionary、List of tuples和List of dictionary。同时介绍了一些注意事项,如使用绝对路径引入文件和安装xlrd包来读取Excel文件。 ... [详细]
  • Python脚本编写创建输出数据库并添加模型和场数据的方法
    本文介绍了使用Python脚本编写创建输出数据库并添加模型数据和场数据的方法。首先导入相应模块,然后创建输出数据库并添加材料属性、截面、部件实例、分析步和帧、节点和单元等对象。接着向输出数据库中添加场数据和历程数据,本例中只添加了节点位移。最后保存数据库文件并关闭文件。文章还提供了部分代码和Abaqus操作步骤。另外,作者还建立了关于Abaqus的学习交流群,欢迎加入并提问。 ... [详细]
  • 如何在mysqlshell命令中执行sql命令行本文介绍MySQL8.0shell子模块Util的两个导入特性importTableimport_table(JS和python版本 ... [详细]
author-avatar
手机用户2502870863
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有