python模拟浏览器访问网站

阅读：评论：0

import os  
import urllib  
class AppURLopener(urllib.FancyURLopener):  
    version = "Mozilla/5.0"  
urllib._urlopener = AppURLopener()  
url = "blog.csdn/eastmount/article/details/44492787"  
content = urllib.urlopen(url).read()
open('test.html','w+').write(content)

伪装成浏览器访问
某些网站反感爬虫的到访，于是对爬虫一律拒绝请求
这时候我们需要伪装成浏览器，这可以通过修改http包中的header来实现

#…  
  
headers = {  
	'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'  
}  
req = urllib2.Request(  
	url = 'www.csdn',  
	data = postdata,  
	headers = headers  
)  
#...

对付"反盗链"
某些站点有所谓的反盗链设置，其实说穿了很简单，

就是检查你发送请求的header里面，referer站点是不是他自己，

所以我们只需要像把headers的referer改成该网站即可，以cnbeta为例：

#...
headers = {
    'Referer':'wwwbeta/articles'
}
#...

本文发布于:2025-04-05 09:10:00，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/1743815426584052.html

上一篇：chrome查看浏览器内核日志

下一篇：调用Android自带浏览器打开网页

标签：浏览器网站 python

留言与评论（共有 0 条评论）