python去哪儿网的旅游景点信息

阅读: 评论:0

python去哪儿网的旅游景点信息

python去哪儿网的旅游景点信息

爬取过程分析:
1、网站url:‘.htm?keyword=北京&page=1’
2、http请求方法为get方法
3、用beautifulsoup提取所需要的信息
4、将爬取的信息存至本地


具体代码如下:

import requests
from bs4 import BeautifulSoupclass QuNaEr():def __init__(self, keyword, page=1):self.keyword = keywordself.page = pagedef qne_spider(self):url = '.htm?keyword=%s&page=%s' % (self.keyword, self.page)response = (ding = 'utf-8'text = bs_obj = BeautifulSoup(text, 'html.parser')arr = bs_obj.find('div', {'class': 'result_list'}).contentswith open('./qunaer/tour.csv','a') as f:for i in arr:info = i.attrs# 景区名称name = ('data-sight-name')print(name)# 地址address = ('data-address')# 近期售票数count = ('data-sale-count')# 经纬度point = ('data-point')# 起始价格try:price = i.find('span', {'class': 'sight_item_price'})price = price.find_all('em')price = price[0].textf.write('{},{},{},{},{}n'.format(name,address,count,price,point))except Exception as e:print(e)if __name__ == '__main__':citys = ['北京', '上海', '成都', '三亚', '广州', '重庆', '深圳', '西安', '杭州', '厦门', '武汉', '大连', '苏州']with open('./qunaer/tour.csv', 'a') as f:f.write('{},{},{},{},{}n'.format('景区名称', '地址', '售票数', ‘起始价格', '经纬度'))for i in citys:for page in range(1, 10):qne = QuNaEr(i, page=page)qne.qne_spider()

本文发布于:2024-02-01 13:58:04,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170676708437087.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:旅游景点   去哪儿   信息   python
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23