Pycharm开发环境
python 版本 python3.7
Anconda 集成开发环境
#### 1、分析目标网页,确定爬取的url路径,headers参数
#### 2、发送请求--requests 模拟浏览器发送请求,获取响应数据
#### 3、解析数据 json模块:把json字符串转化成python可交互的数据类型
#### 4、保存数据--保存在目标文件夹中
Pycharm开发环境
python 版本 python3.7
Anconda 集成开发环境
pip install requestspip install json
# 学习模块
# requests
# json
# 动态数据抓包# 下载一页的视频
import requests #导入模块 pip install requests# 1、分析目标网页,确定爬取的url路径,headers参数
base_url ='=0&pageSize=40&subjectId=74'headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
# 2、发送请求 requests 模拟浏览器发送请求,获取响应数据
response = (base_url,headers= headers) #
data = response.json()
print(data)# 3、解析数据 json模块:把json字符串转化成python可交互的数据类型data_list = data['data']
# print.pprint(data_list) 打印列表# for循环遍历列表
for datal in data_list:video_title = datal['title'] + ".mp4" # 视频标题video_url = datal['playUrl'] # 视频Url# print(video_title,video_url) # 打印标题print(':',video_title) # 打印 srart download 视频标题video_data = (video_url,headers=headers).content ## 图片视频音频文件都是二进制的,用wb进行保存,写入t content方法with open('video\'+ video_title,mode='wb') as f: #保存数据f.write(video_data)print('download finised ....n')print('download endding')
本文发布于:2024-01-29 16:33:31,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170651721316620.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |