51job招聘信息爬取

阅读: 评论:0

51job招聘信息爬取

51job招聘信息爬取

from bs4 import BeautifulSoup as bs
from selenium import webdriver
import time
import csvdef request_data():# 设置打开网页不自动关闭option = webdriver.ChromeOptions()option.add_experimental_option("detach", True)browser = webdriver.Chrome(options=option)data_all = []for i in range(1, 172):(f',000000,0000,00,9,99,%25E6%2595%25B0%25E6%258D%25AE%25E5%2588%2586%25E6%259E%2590,2,{i}.html')time.sleep(1)data_all.append(browser.page_source)return data_alldef analysis_data(data):finally_data = []for each_item in data:html = bs(each_item, 'lxml')all_contents = html.select('.j_joblist>.e')all_info = []for item in all_contents:# 职位post = item.select_one('.t>.jname.at').get_text()# 发布时间announce_time = item.select_one('.t>.time').string# 公司company = item.select_one('ame.at').get_text()# 年薪wages = item.select_one('.sal').string# 条件要求ask = item.select_one('.d.at').get_text()# 公司规模scale = item.select_one('.dc.at').get_text()# 经营范围business = item.select_one('.int.at').get_text()# 详情地址postlink = item.select_one('.el').attrs['href']all_info.append([post, announce_time, company, wages, ask, scale, business, postlink])finally_data.append(all_info)return finally_dataif __name__ == '__main__':result = analysis_data(request_data())with open('./51job.csv', 'w', newline='', encoding='utf-8') as f:writer = csv.writer(f)writer.writerow(['招聘岗位', '发布时间', '公司名称', '工资', '招聘条件', '公司规模', '经营范围', '职位连接'])for item1 in result:writer.writerows(item1)

 

本文发布于:2024-01-30 17:53:32,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170660841621784.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:招聘信息   job
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23