1,首先在你的电脑中找的。
看有无pip,有则进行下一步,无。在Python下载并安装,python。
2.然后复制路径,再Vscode终端,输入cd +“你复制的路径”,回车.
3.输入pip install BeautifulSoup。没有句号。出现succeful,成功。
4重复1,然后输入pip install lxml. 出现succeful,成功.4,运行文件会出现
这个点开,就出现了。
你要爬取的文件。
比如爬取代码:
quest
from bs4 import BeautifulSoup
import timeprint("***开始爬取数据***")
url="=%E4%B8%AD%E5%8C%97%E5%A4%A7%E5%AD%A6&ie=utf-8&tab=main"
html= quest.urlopen(url).read()#读网页soup=BeautifulSoup(html,"lxml")#创建BeutifulSoup对象#***开始爬取数据***#%%建立并打开文件
start_time=time.strftime('%Y-%m-%d %H-%M-%S',time.localtime())
f=open('ZBtb-'+start_time+'.txt','a+',encoding='utf-8')f.write("爬取时间:"+start_time+"n")#获取数据并写入文本文件
all=soup.find_all("a",class_="j_th_tit")#寻找标签是a,类名(class)是j_th_tit
title=str(all).split('</a>')
#title=list(ALL)
title.pop()
i=0
for j in title:i+=1each1=j.split('title="')[1]f.write('【标题'+str(i)+'】'+each1+'n')f.close()
print("***爬取数据结束***")
本文发布于:2024-01-31 16:51:25,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170669108529984.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |