http技术原理(一文带你了解HTTP)

01-01 HTTP协议

HTTP就是Web通信时使用的协议,也是Web建立的基础;是网络上应用最广的一种协议。

什么是HTTP?

又称超文本传输协议;Hyper Text Transfer Protocol;

为了了解这一协议的过程,我们设想一下快递小哥的工作:

快递小哥首先通过货车派送货物,当货物送到我们的收货地址的时候,快递小哥就会打电话联系我们,说是某某公司的快递员,要我们来取件。

如果要让快递小哥送进小区里面,我们就需要告诉物业准许他进入,相当于给他颁了个通行证;

当快递小哥将货物送到我们手上,我们需要签收,快递小哥拿到快递单,就完成了一次快递任务。

HTTP协议类似。

浏览器:快递小哥

快递小哥通过货车送货:浏览器通过Get方式发送请求。

HTTP中的Host就相当于“收件人地址”;

User-Agent就相当于快递小哥所处的公司;

HTTP包含的Cookie就相当于能够进入我们小区的凭证。

当服务器收到浏览器的HTTP请求后,会返回一个状态码(对应收到这个事实)和相应内容(对应已签收的字据)。状态码为200表示正常收到(状态码可以在上文中/前一篇的开发者工具的网络中查看)

可以看到HTTP协议的请求和响应包含了一些特殊的属性,包含方式、User-Agent、Host、返回的状态码等等;

这些都属于HTTP的报文。

什么是HTTP的报文?

分为三部分:起始行、头、身体

http技术原理(一文带你了解HTTP)(1)

左边,是浏览器发送的HTTP请求报文,右边是服务器返回的HTTP请求报文;

  • 左侧
    • 第一行:请求行Request Line
    • 之后:是我们的头部Headers;
    • 下面:应该是我们的数据体,但由于是GET请求,没有数据体
    • 注意头部和数据体之间是有一个空行的。
  • 右侧
    • 比如:HTTP/1.1 200 OK
    • 第一行:状态行;
    • 头部
    • 主体:也就是响应的正文
    • 注意响应的头部和主题之间也是有一行空行的。
HTTP请求示例

比如一个发帖的HTTP请求

当我们进行发帖的时候,我们的请求报文和响应报文如下:

http技术原理(一文带你了解HTTP)(2)

  • 请求
    • 就是要发布的帖子的相关内容
    • 相较于上面,多了一个Cookie字段,就是前面提到的用户凭证,相当于告诉服务器,是我发的这个帖子。
    • 黑客就比较喜欢获取这个Cookie凭证,如果获取,就拥有了“我”的凭证,可以以“我”的身份发帖。
    • 后面会接触一些这方面的安全漏洞。
    • 这里是POST
    • 第一行:请求行
    • Headers
    • 也有了数据体
HTTP请求的其他方法
  • HEAD
    • 与GET请求类似,不同是只返回HTTP的头部信息,没有数据体,也就没有页面内容。
  • PUT
    • 上传指定的URL描述
  • DELETE
    • 删除指定资源
  • OPTIONS
    • 返回服务器支持的HTTP方法
01-02 HTTP头的Referer

这是除了HTTP请求方式和Cookie的概念外,另一个重要概念。

Referer就是告诉服务器,我们从什么地方来(即告诉物业我们是哪个快递公司的);

举例:

我们通过https://m.study.163.com/直接跳转到页面。和从bing主页搜索云课堂再进入,开发者工具中显示的HTTP请求是不同的,后者会多一个Referer头,表示是从bing的这个链接来的。

如图;图一是直接跳转;图二是搜索跳转;

直接跳转Rerfer

http技术原理(一文带你了解HTTP)(3)

搜索跳转的Rerfer与之不同。

http技术原理(一文带你了解HTTP)(4)

所以由于Referer可以告诉服务器该次请求的来源,所以很多Web服务器会通过Referer来进行统计(比如CNZZ、百度统计)

从安全的角度来讲,Referer还可以用来判断来源是否合法。

(比如:

  • 防止盗链
    • 比如一些网站不想被盗用内容或恶意引用,就会通过Referer限制来者
  • 防止CSRF漏洞
    • (暂不了解
01-03 HTTP状态码302 --跳转

比如:在响应报文的状态行(第一行)

HTTP/1.1 302 Moved Temporarily

在跳转同时,还会在响应报文的Headers部分有一个Location字段,是跳转到的URL地址,也就是这个响应报文告诉我们,我们需要跳转到Location中的URL地址。

除了这两处,还会有Set-Cookie字段,作用是Web服务器向我们的浏览器颁发凭证,比如我们通过用户名密码登录成功后,Web服务器通常就会给我们颁发一个凭证。

类似的是301。

除此之外,还包括10x,20x,30x,40x,50x;每个状态码都代表不同的意思。

分类

分类描述

10x

信息,服务器收到请求,需要请求者继续执行操作

20x

成功,操作被成功接收并处理

30x

重定向,需要进一步的操作以完成请求

40x

客户端错误,请求包含语法错误或无法完成请求

50x

服务器错误,服务器在处理请求的过程中发生了错误

具体的状态码可以到后面再学习,或用到查看。

01-04 实例演示

我们打开Edge浏览器,输入https://www.cnblogs.com/Roboduster

http技术原理(一文带你了解HTTP)(5)

我们用F12打开开发者工具,进入“网络”,刷新一下,查看“文档”,选中head头,可以看到有请求头、响应头,点击就可以看源码,有一些是上面讲过的,还有些字段是不熟悉的。这些字段可以自行查阅。

http技术原理(一文带你了解HTTP)(6)

除了HEADER外,我们可以看一看响应的具体内容,在左侧的“响应”中;Cookie中有请求的Cookie等等。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页