excel学习库

excel表格_excel函数公式大全_execl从入门到精通

微软Excel和Python都能爬取网页信息,你该怎么选?

最近体验了一下Excel(PowerBI Desktop)爬取网页信息的能力,基于这些体验也写了几个帖子,对Excel(PowerBI Desktop)爬取网页的能力基本满意。 在Excel中,抓取网页的操作路径是:数据-新建查询-自web。可以简单抓取。 PowerBI Desktop可以进行稍微复杂的抓取。在输入网址后可以选择从网页页面自定义抓取的字段,甚至可以在查询代码编辑页面自己写css selector来进行更多样化的抓取。 这两天我又折腾了用Excel(PowerBI Desktop)抓取更复杂的网页信息。不得不说,在复杂抓取网页信息方面,Excel(PowerBI Desktop)体验比较糟糕——爬取网站信息的速度慢得让我无法忍受。刷新一次结果至少要两三个小时乃至更多。 我终于失去耐心,还是重操python大业(太多东西又忘掉了……),爬取同样的信息,python五六分钟就爬取完毕,这个效率的差异可比Excel和PowerBI Desktop高太多了。 所以,我的结论是: 1.简单爬取,页数不多情况下,用微软的Excel(PowerBI Desktop)不失为一个可行的选项。 2.大批量爬取,还是使用python这类工具吧(应该还有其他更高效的工具,但我只勉强会用python,所以只能提python)。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接