爬取心灵鸡汤

阅读: 评论:0

爬取心灵鸡汤

爬取心灵鸡汤

网页截图

Python代码

import requests
import reurl = '/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}text = (url, headers=headers).content.decode()
for i in range(64783, 64793):page = re.findall(r'div id="humorContent_{}" class="pic_text1"(.*?)<p>'.format(str(i)), text, re.DOTALL)print(page[0])print('*' * 40)
效果截图

总结

网页本身存在一定的问题,而我的正则表达式应该是没有问题的;现在的不足之处就是还不会翻页爬取数据,存储以及整理数据,希望今后能因为兴趣再更上一层楼。

本文发布于:2024-02-27 18:04:25,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/1709109832114102.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:转发心灵鸡汤
下一篇:心灵鸡汤2
标签:心灵鸡汤
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23