爬取网站文章标题

阅读: 评论:0

爬取网站文章标题

爬取网站文章标题

检查网页源代码,确实标题的类名即可:

 代码就可以这样写了

import requests
from bs4 import BeautifulSoup
link="/"
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'}
r&#(link,headers=headers)
soup=,'lxml')
title_list=soup.find_all(attrs={"class":"post-title"})
for i in range(len(title_list)):title=title_list[i].a.text.strip()print('第%s篇文章的标题是:%s'%(i+1,title))

本文发布于:2024-02-04 12:09:17,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170706876655434.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:标题   文章   网站
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23