python网络爬虫(一) 爬取网站图片
python网络爬虫(二)分页爬取图片
网络爬虫(Web Spider),又被称为网页蜘蛛,是一种按照一定的规则,自动地抓取网站信息的程序或者脚本。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。
用户获取网络数据的方式:
发起请求
网站相响应
import requests
import time
from lxml import etree
url = '/'headers = {"Referer":"Referer: /","User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36",}resq = (url,headers = headers)print(resq)html = etree.)
srcs = html.xpath(".//img/@src")for i in srcs:imgname = i.split('/')[-1]img = (i,headers = headers)with open('imgs1/'+imgname,'wb') as file:file.t)print(i,imgname)
本文发布于:2024-02-05 07:04:13,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170726949864246.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |