Python爬虫+Excel/VBA办公自动化
-------------------------------------
下栽地止:https://www.itwangzi.cn/3937.html
-------------------------------------
Python爬虫+Excel/VBA办公自动化为什么对 Excel 使用 Python
Excel已经够流行好用了,为什么要用Python来处理Excel呢?
Python处理Excel的好处
1、批量操作:当需要处理很多Excel文件时,比如重复性的体力劳动,那么使用Python可以实现文件的批量扫描和自动处理,用代码代替人工重复性劳动,实现自动化。 它是第一个比 Excel 更强大的 Python
2、对于大文件,当Excel文件超过几十兆甚至上百兆时,打开文件很慢,处理文件更慢。 如果这时候你用Python,你会发现处理几十兆、几百兆甚至几千兆都不是一件容易的事。 没问题
3、用Excel进行复杂的计算时,会用到VBA,但VBA本身就是一种过时的复杂语言。 Python是目前最简单易实现的语言。 Python可以处理比VBA更难的业务逻辑
Python处理Excel的类库和开发环境
Python处理Excel的库主要有3类
1. Pandas:是Python领域非常重要的数据分析和可视化类库。 在处理Excel时,90%的事情都可以通过使用pandas类库来完成。 使用pandas可以读取excel,处理excel,输出excel,但是pandas也有缺点,就是不能做格式化,比如excel中合并单元格,还有大量复杂的样式(看起来很漂亮),它 不能用熊猫来完成。 这个时候还是结合openyxl和xlwings使用pandas来解决需求
2.openpyxl:如果电脑上没有安装office,也可以用openpyxl。 该类型可以在linux上运行,也可以实现操作大部分Excel格式和样式的功能。 配合pandas使用也可以完成大部分场景需求
3.xlwings:比openyxl更强大,只能在Windows或Mac系统上运行,系统中必须安装office才能运行。 xlwings的原理是在当前系统已经安装的办公软件的基础上扩展功能。 操作Excel
在使用pandas时,往往会结合其他库来完成更复杂的功能
开发环境
操作系统:Windows、mac均可使用
Python版本:系统必须安装Python 3.6或以上版本。 Python 2 已过期,不推荐使用。 Python 3.6 之前的版本比较弱。 最好使用 Python 3.6 或以上版本。
