热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

面向初学者的PythonPandas–完整指南(第1部分)

面向初学者的PythonPandas-完整指南(第1部分)本系列文章PythonPandasforBeginner将是初学者学习pandas库的最佳起点

面向初学者的 Python Pandas - 完整指南(第 1 部分)

本系列文章Python Pandas for Beginner 将是初学者学习 pandas 库的最佳起点。您将学习一些最重要的 pandas 功能,例如探索、清理、转换和可视化数据。

Pandas是 Python 中的一个开源库。它是当今用于数据分析的最流行的 Python 库。强大的机器学习和可视化工具,它为您提供分析大数据集的高性能工具。

在这篇文章中,我们将介绍有关 pandas 的基本信息,从安装到优势。你应该给自己泡杯咖啡,拿你最喜欢的饼干。之后,慢慢享受和阅读这篇文章。随意停止并稍后继续,不要在短时间内被大量信息压倒。只要仔细一步一步,熊猫就会来找你。

初学者的 Python 熊猫

你好熊猫
(熊猫 - 来源:壁纸播放)

什么是熊猫?

Pandas是一个用于分析、数据处理和数据科学的库。这是一个拥有 1,500 多名贡献者的大型开源项目。这是GitHub 上 Pandas项目的链接

安装

安装 Pandas 的最简单方法是使用 Anaconda 发行版。您还没有安装 Anaconda,请阅读我们的 Anaconda 安装指南帖子。

如果不想安装 Anaconda,可以通过 pip 安装。

pip install pandas

Pandas 的数据结构

Pandas 的两个主要数据结构是SeriesDataFrame。当我们加入多个系列(列)时, ASeries只是一个列,所以我们有一个DataFrame.

Python Pandas 数据结构

Pandas 中的 Series 和 DataFrame

创建您的系列和数据框

系列入门

首先,通过传递值列表来创建系列数据。Pandas 默认从 0 开始计算索引。

import numpy as np
import pandas as pddata_series = pd.Series([1, 9, 3, np.nan, 8])
print(data_series)""" Output:
0 1.0
1 9.0
2 3.0
3 NaN
4 8.0
dtype: float64
"""

以最简单的方式创建 DataFrame

要创建 DataFrame,Python 中有很多方法。但是,最简单的方法是创建一个dict. 之后,将字典数据传递给 DataFrame 构造函数,它将完成这项工作。

import pandas as pddata = {'Paris': [3, 2, 0, 1], 'Berlin': [0, 3, 7, 2]
}purchases = pd.DataFrame(data)
print(purchases)""" Output:Paris Berlin
0 3 0
1 2 3
2 0 7
3 1 2
"""

使用 Numpy 创建 DataFrame

将 Numpy 数组、日期时间数据作为索引和列标签传递给 DataFrame 构造函数:

import numpy as np
import pandas as pddates = pd.date_range('20191001', periods=6)
dataframe = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(dataframe)""" Output:A B C D
2019-10-01 0.304466 -0.699206 -2.090317 1.564566
2019-10-02 -0.876682 0.876720 1.275542 -0.757827
2019-10-03 0.029740 -1.282535 -0.420332 -1.176261
2019-10-04 -0.153740 -0.087788 1.314169 -1.835564
2019-10-05 0.301839 0.036301 0.138372 1.755769
2019-10-06 1.546020 -0.148291 0.781045 -1.789371
"""

在示例中,我们可以看到index它将表示行标签。换句话说,column参数用于列标签。

参考

我们在创建系列时使用了以下文档作为参考。如果您喜欢使用 Pandas,也许您应该阅读它。

  • 熊猫官方文档

第 1 部分总结

通过本系列的第一部分 Python Pandas for Beginners,你基本了解了什么是 pandas 以及如何通过 pip 或 Anaconda 安装它。此外,您可以创建数据系列或数据框。

在第 2 部分中,您将学习如何从 JSON 文件中读取 pandas 数据,以及 pandas 的一些重要操作。

下一篇文章见,如果你喜欢这个系列,请分享给其他 Python Geeks。给我们留下评论,以帮助我们在下一篇文章中改进。

如果对Python有兴趣,想了解更多的Python以及AIoT知识,解决测试问题,以及入门指导,帮你解决学习Python中遇到的困惑,我们这里有技术高手。如果你正在找工作或者刚刚学校出来,又或者已经工作但是经常觉得难点很多,觉得自己Python方面学的不够精想要继续学习的,想转行怕学不会的, 都可以加入我们,可领取最新Python大厂面试资料和Python爬虫、人工智能、学习资料!微信公众号【Python大本营】等你来玩奥~



推荐阅读
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • 2022年的风口:你看不起的行业,真的很挣钱!
    本文介绍了2022年的风口,探讨了一份稳定的副业收入对于普通人增加收入的重要性,以及如何抓住风口来实现赚钱的目标。文章指出,拼命工作并不一定能让人有钱,而是需要顺应时代的方向。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例
    本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤,可以获取到网站首页的新闻数据。代码示例使用Python编写,并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]
  • Python开源库和第三方包的常用框架及库
    本文介绍了Python开源库和第三方包中常用的框架和库,包括Django、CubicWeb等。同时还整理了GitHub中最受欢迎的15个Python开源框架,涵盖了事件I/O、OLAP、Web开发、高性能网络通信、测试和爬虫等领域。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
author-avatar
木扎尔特2502918527
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有