excel学习库

excel表格_excel函数公式大全_execl从入门到精通

「Python教程」关于pandas,你还应该知道这些

大家好,欢迎收看思路实验室出品的Python入门教程,我是室长。

在经过了几期的学习之后,我们对如何使用pandas进行数据操作有了一个基本的了解。当然,pandas支持的操作非常多,很多时候难以用一个主线来串联起来。这个系列我们就来聊一聊pandas那些有用但还没有讲到的方法。

首先大家最关心的可能就是数据的导入了。我们在初始pandas时使用read_csv方法从csv文件中读取了数据,后续的内容则是在python中生成数据。虽然我们一直在将pandas和excel进行对比,但还没有正式地操作一个excel文件。

read_excel方法

那安装什么模块呢?这要取决于我们打开的excel文件是什么格式。打开xls文件需要安装的是xlrd模块,而打开xlsx文件需要安装的是openpyxl模块。关于如何安装模块请参见教程主线第十一期。

安装好之后我们并不需要导入这个模块,直接调用read_excel就好。这里第一个参数是需要打开的文件的文件名,第二个参数是表格名,在excel的左下角位置,一般默认的是Sheet1,这里因为是使用的csv另存为excel表格,所以表格名就是“工资”:

实际上,pandas并不仅仅能读取excel文件,在pycharm中输入一个read能弹出好几十条候选方法:

方法太多了,我们挑几个最常用的讲一下:

爬虫、数据库

当然,有读取就会有输出。在pandas中输出方法一般是to_xxx的形式。

这里仍然需要注意的是to_excel方法。它同样需要依赖于其他模块。输出xls文件依赖于xlwt模块,而输出xlsx文件仍然依赖于openpyxl模块。

也就是说,对于xlsx文件,只安装一个openpyxl模块就够了。毕竟xlsx是新的excel文件格式,xls还是97-2003的格式,也快该淘汰了。而且xlrd和xlwt模块只支持不超过65535条数据,一旦数据量过大就无法使用了。所以还是建议大家使用xlsx文件进行数据的存储。

concat方法

连接后:

如果列标签不完全相同也不是不行,新的DataFrame会包含所有的列标签,没有数据的地方会填充NaN。

如果不希望这样,只希望共有的列标签添加到新的DataFrame中,则可以给join参数赋值为'inner'。

看到这里,是不是感觉有点似曾相识?其实concat和merge差不太多,merge主要进行行的连接,而concat主要进行列的连接。

赞和在看

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接