01 前言
学习python是以处理和分析数据为目的,避不开要接触Pandas库,这个库非常之强大首先介绍一下这个库
pandas:pandas 是 Python 语言的一个扩展程序库,主要用于数据分析,提供高性能、易于使用的数据结构和数据分析工具。pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysis"(Python 数据分析)
02 场景应用
pandas可结合处理EXCEL非常之方便,平时常用的功能比如,批量合并文件夹下的excel文件;按某一字段批量拆分excel文件;excel与数据库联动处理等
03 案例演示
在使用这个库前,要安装python,建议安装python3.8以后的版本稳定,然后确认自己是否已安装pandas
打开cmd,输入pip list

向下能找到pandas,就代表安装成功,如果没有安装成功,在cmd 下输入pip install pandas即可安装
接下来正式介绍本篇主题,如何利用pandas读取excel
使用函数为pandas下的read_excel()
看一下read_excel的参数
pandas.read_excel(io, sheet_name=0, header=0, skiprows=None,
skip_footer=0, index_col=None, names=None, usecols=None,
parse_dates=False, date_parser=None, na_values=None,
thousands=None, convert_float=True, converters=None,
dtype=None, true_values=None, false_values=None,
engine=None, squeeze=False, **kwds)
介绍一下常用参数
首先看一下我的数据环境

io常用为表格路径,直接读取表格内容

sheet_name为表的名称两种用法,可以直接输入具体的表名,也可以用数字代表,如果使用列表形式代表会返回一个字典格式

header代表标题,默认为0即第一行为标题,如果改成None,即不指定标题会他会自动用数字代替

names:指定列的名字,传入一个list数据(原第二张表没有标题,通过names直接加进去)

类型名称或dict的列,其他类型,默认None,有时候你的excel中的数据是文本型数字比如0000123,如果不设置这个参数,最后pandas会直接转换为常规格式
