爬虫日记之06HTTP协议

阅读: 评论:0

爬虫日记之06HTTP协议

爬虫日记之06HTTP协议

爬虫日记之06HTTP协议

2022-3-5

请求

1 请求行 -> 请求方式(get/post) 请求url地址 协议
2 请求头 -> 放一些服务器要使用的附加信息
3 请求体 -> 一般放一些请求参数

响应

1 状态行 -> 协议 状态码
2 响应头 -> 放一些客户端要使用的一些附加信息
3 响应体 -> 服务器返回的真正客户端要用的内容(HTML,json)等

请求头中常见的一些重要内容(爬虫需要):

  1. User-Agent:请求载体的身份标识
  2. Regerer:防盗链(这次请求时从哪个页面中来的,反爬常用)
  3. cookie:本地字符串数据信息(用户登录信息,反爬的token)

响应头中常见的一些重要内容:

  1. cookie:本地字符串数据信息(用户登录信息,反爬的token)
  2. 各种字符串(需要经验识别,一般是用于防止各种攻击和反爬的token字样)

请求方式:

  1. GET
  2. POST

*参考视频教程

本文发布于:2024-02-08 20:09:06,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170739440568726.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:小结日记
下一篇:3.16毕设日记
标签:爬虫   协议   日记   HTTP
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23