上传者: 38592134
|
上传时间: 2021-12-10 10:56:03
|
文件大小: 515KB
|
文件类型: -
为什么ip会被封?
当我们爬取一些网站时,会发现ip被封了。这是因为网站为了防止被爬取,会有反爬机制,对于同一个ip地址的大量同类型的访问,会封锁ip,过一段时间后才能继续访问
如何解决ip被封的问题?
有几种方法:
1.修改请求头,模拟浏览器(不是代码去直接访问)访问
2.使用代理ip并轮换
3.设置访问时间间隔
如何获取代理ip地址
从该网站获取:https://www.xicidaili.com/
inspect->鼠标定位
要获取的代理ip地址,属于class=’odd’标签的内容:
#将获取的代理ip保存到proxy_ip_list列表中
#导入相关库
from bs4 impor