excel学习库-Pandas处理excel

01 前言

学习python是以处理和分析数据为目的，避不开要接触Pandas库，这个库非常之强大首先介绍一下这个库

pandas：pandas 是 Python 语言的一个扩展程序库，主要用于数据分析，提供高性能、易于使用的数据结构和数据分析工具。pandas 名字衍生自术语 "panel data"（面板数据）和 "Python data analysis"（Python 数据分析）

02 场景应用

pandas可结合处理EXCEL非常之方便，平时常用的功能比如，批量合并文件夹下的excel文件；按某一字段批量拆分excel文件；excel与数据库联动处理等

03 案例演示

在使用这个库前，要安装python，建议安装python3.8以后的版本稳定，然后确认自己是否已安装pandas

打开cmd，输入pip list

向下能找到pandas，就代表安装成功，如果没有安装成功，在cmd 下输入pip install pandas即可安装

接下来正式介绍本篇主题，如何利用pandas读取excel

使用函数为pandas下的read_excel()

看一下read_excel的参数

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None,

skip_footer=0, index_col=None, names=None, usecols=None,

parse_dates=False, date_parser=None, na_values=None,

thousands=None, convert_float=True, converters=None,

dtype=None, true_values=None, false_values=None,

engine=None, squeeze=False, **kwds)

介绍一下常用参数

首先看一下我的数据环境

io常用为表格路径，直接读取表格内容

sheet_name为表的名称两种用法，可以直接输入具体的表名，也可以用数字代表，如果使用列表形式代表会返回一个字典格式

header代表标题，默认为0即第一行为标题，如果改成None，即不指定标题会他会自动用数字代替

names：指定列的名字，传入一个list数据（原第二张表没有标题，通过names直接加进去）

类型名称或dict的列，其他类型,默认None，有时候你的excel中的数据是文本型数字比如0000123，如果不设置这个参数，最后pandas会直接转换为常规格式

excel学习库