1.首先导入需要的模块
import requests
from bs4 import BeautifulSoup
import csv
2.获取网页,并解析结果
def html_parser(url_start):
#获取html
try:
headers={‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36’} #模拟浏览器登入
(url_start,headers=headers,timeout=10) #获取网页
except:
pass
#print(r.status_code)
else:
html = r.content.decode(‘gb2312’,‘ignore’) #解码gb2312,忽略其中有异常的编码,仅显示有效的编码
#print(len(html)) #解析网页
soup = BeautifulSoup(html,'lxml')
for li in soup.select('.co_area2 li'):
本文发布于:2024-01-30 22:36:09,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170662537223313.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |