pandas模块在处理数据分析、数据清洗等方面,非常常用。
pandas模块提供了非常直观的数据结构以及强大的数据管理和数据处理的功能,一定程度上pandas模块可以看成python版本的excel。
安装pandas
模块安装的方式有很多,最简单的安装方式就是pip install pandas

模块安装完成,出现successfully,则说明已经安装好了。
pandas模块的介绍
pandas模块有两种数据结构,一种是Series,一维数组。一种是DataFrame,二维数组。
举例1:什么是Series数据结构

形象的可以做如下表示

举例2:什么是DataFrame结构?

如上图所示,这种样式的数据就是DataFrame,也就是二维结构。
通过列表创建DataFrame
DataFrame可以通过数组,列表,字典创建,这里通过列表创建DataFrame。

从返回结果中可以看出,DataFrame返回的数据和Series返回的数据有很大的差别。

数据分析,右边的0,1,2 其实就是索引,和excel中的序号类似。上面的0和1,相当于上一个案例中定义的语文,数学等,可以理解为列名。
创建一个学生成绩单,索引编程了学生姓名,列名变成了科目
首先需要定义三个变量,分别是索引,数据,列名。

代码分析,创建数据的方式都是列表方式,有几个列名,则对应几组数据。

从结果可以明确的看出来代码索表达的含义。
通过字典创建DataFrame
字典的定义方式是什么呢?是键值对的方式。

在字典这种方式的定义下,列名就变成了字典的键,而数据就变成了字典的值了。

通过二维数组创建DataFrame
之前了解了二维数组是如何创建的,关键点还是在numpy模块的使用。

这里采用了numpy模块,arange(9)方法产生了一个0-8的一维数组,reshape(3,3)组成了一个3×3的矩阵。
从最后的结果来看,和之前list和dict创建的效果没有什么区别

问题:np.arange(9) 会产生什么样的效果

问题:np.arange(9).reshape(3,3) 会产生什么样的效果

DataFrame索引重命名
继续创建一个成绩表的DataFrame,把张三修改为张三丰,原始数据如下

关键参数,rename方法,接收的是一个字典。

返回结果,这里有个参数,是inplace = True 。 表示当前修改立即生效。

读取表格内容
读取表格内容,用到的方法是read_excel(文件名)
原始表格内容:

代码实现数据读取

读取文件的就结果

写入数据到excel中
之前说了xlwings如何写入数据到excel,今天说pandas如何写入数据到Excel。pandas写入数据到excel,用到的to_excel方法,需要传递一个参数,这个参数就是文件名称。

首先要准备好数据,其次需要创建一个DataFrame对象,才可以将数据保存到excel中

从上面的结果看,数据已经成功的写入到文件中了