爬虫的学习就是与反扒措施、反扒系统做斗争的一个过程,而使用代理IP是我们重要的防反扒的重要措施,代理IP的来源有两种一是你花钱去购买商家会给你提供一个接口你直接调用就可以了,二是自己在网上爬取高效IP。在这篇博客中我重点给大家讲一下如何从网上获取高效IP,我们下面的IP来源于西刺代理,这是我很久之前写的一篇博客,今天来进行“翻新”一番希望可以帮助到大家。
BeautifulSoup和requests,BeautifulSoup负责解析HTML网页源码,requests负责发送请求来获取网页源码,BeautifulSoup和requests均属于Python爬虫的基础库,可以通过pip安装。打开命令行输入命令pipinstallBeautifulSoup4和pipinstallrequests进行安装:
过后在输入命令piplist在pip安装包列表中检查BeautifulSoup和requests库是否安装成功