2024年1月26日发(作者:)
用Python写个抖音的爬虫程序
# 导入必要的库
import requests
from bs4 import BeautifulSoup
import re
# 设置要爬取的页面地址
url = '网址'
# 请求页面
response = (url)
# 解析页面
soup = BeautifulSoup(, '')
# 查找所有抖音视频节点
videos = _all('div', class_='task-card-content')
# 遍历抖音视频节点
for video in videos:
# 提取 视频标题 作者名称 回复数量
title = ('p', class_='title').get_text()
author = ('p', class_='author').get_text()
replies = ('span', class_='replies').get_text()
# 正则匹配作者名称
match_result = ('w+', author)
author = match_(0)
# 输出该视频信息
print('标题:{} 作者:{} 回复:{}'.format(title, author,
replies))
本文发布于:2024-01-26 04:26:32,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/1706214392739.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |