python爬虫实战:爬取股票信息,对上交所和深交所所有的股票信息进行搜集

阅读: 评论:0

python爬虫实战:爬取股票信息,对上交所和深交所所有的股票信息进行搜集

python爬虫实战:爬取股票信息,对上交所和深交所所有的股票信息进行搜集

要用到两个网站:
1.获取所有股票的名称的网址(这里指上交所和深交所的股票)
.html2.获取单个股票的各类信息
.html

 


'''
要用到两个网站:
1.获取所有股票的名称的网址(这里指上交所和深交所的股票)
.html2.获取单个股票的各类信息
.html
'''import requests
from bs4 import BeautifulSoup
import traceback
import re#获取网页内容
def getHTMLText(url, code="utf-8"):try:r = (url)r.raise_for_status()r.encoding = cept:return ""#获取所有的股票名称,将其放在一个列表中
def getStockList(lst, stockURL):html = getHTMLText(stockURL, "GB2312")soup = BeautifulSoup(html, 'html.parser')a = soup.find_all('a')for i in a:try:href = i.attrs['href']lst.append(re.findall(r"d{6}", href)[0])except:continuedef getStockInfo(lst, stockURL, fpath):count = 0for stock in lst:url = stockURL + "sz" + stock + ".html"#对应的每只股票的网址html = getHTMLText(url)try:if html == "":continueinfoDict = {}soup = BeautifulSoup(html, 'html.parser')stockInfo = soup.find('div', attrs={'class': 'stock-bets'})name = stockInfo.find_all(attrs={'class': 'bets-name'})[0]infoDict.update({'股票名称': split()[0]})keyList = stockInfo.find_all('dt')valueList = stockInfo.find_all('dd')for i in range(len(keyList)):key = keyList[i].textval = valueList[i].textinfoDict[key] = val#保存到本地,并加载进度条with open(fpath, 'a', encoding='utf-8') as f:f.write(str(infoDict) + 'n')count = count + 1print("r当前进度: {:.2f}%".format(count * 100 / len(lst)), end="")except:count = count + 1print("r当前进度: {:.2f}%".format(count * 100 / len(lst)), end="")continuedef main():stock_list_url = '.html'stock_info_url = '/'output_file = 'D:/'slist = []getStockList(slist, stock_list_url)getStockInfo(slist, stock_info_url, output_file)main()

 

本文发布于:2024-01-28 10:26:47,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17064088136762.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:股票   深交所   爬虫   信息   实战
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23