58同城python委培生需要收费吗

阅读: 评论:0

58同城python委培生需要收费吗

58同城python委培生需要收费吗

1,通过url获取html

url=""+pagenumber+'/?key=python&final=1&jump=1&PGTID=0d000000-0000-046d-babb-93654e2239c8&ClickID=2'

r&#(url,headers=headers,timeout=30)

r.raise_for_status()

2,headers的改变

因为爬到第二面被挡住了,就加了改了个headers

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'}

3,正则表达式的匹配

根据这段信息得出re表达式

res = repile(r'

(.*?)
.*?
',re.S)

4,excel的写入

wbk=xlwt.Workbook()

sheet=wbk.add_sheet('sheet 1')

sheet.write(sum, 0,j[0])

sheet.write(sum, 1,j[1])

sheet.write(sum, 2,j[2])

sheet.write(sum, 3, j[3])

5,二级网页的爬取

因为薪资在另外一个网页所以加了一个爬取函数,结合了一点bs4库

r&#(url)

r.raise_for_status()

html&#

soup=BeautifulSoup(html,"html.parser")

temphtml = soup.find_all('div', class_="pos_base_info")

res = (r'(.*?)

tempre=re.findall(res, str(temphtml))

6,效果图

7,总结

感受:从学python到写出这个小爬虫,也花了一个月了,认识到了python的魅力,少了对过程的描述,只需要注重逻辑即可;

收获:爬虫让我对网页有了个大致的认识,对网页之间信息的传递多了一分理解

8,源码

因为未知原因已丢失

本文发布于:2024-01-31 19:59:44,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170670238331002.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:同城   委培生   python
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23