爬取心灵鸡汤

阅读：评论：0

爬取心灵鸡汤

网页截图

Python代码

import requests
import reurl = '/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}text = (url, headers=headers).content.decode()
for i in range(64783, 64793):page = re.findall(r'div id="humorContent_{}" class="pic_text1"(.*?)<p>'.format(str(i)), text, re.DOTALL)print(page[0])print('*' * 40)

效果截图

总结

网页本身存在一定的问题，而我的正则表达式应该是没有问题的；现在的不足之处就是还不会翻页爬取数据，存储以及整理数据，希望今后能因为兴趣再更上一层楼。

本文发布于:2024-02-27 18:04:25，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/1709109832114102.html

上一篇：转发心灵鸡汤

下一篇：心灵鸡汤2

标签：心灵鸡汤

留言与评论（共有 0 条评论）