JavaEE: 深入解析HTTP协议的奥秘(2)

server/2024/10/17 23:42:42/
http://www.w3.org/2000/svg" style="display: none;">

文章目录

  • HTTP
    • 认识 URL
      • URL encode 介绍
    • 认识 "方法"(method)
      • GET
      • POST
      • 其他方法


HTTP

JavaEE: 深入解析HTTP协议的奥秘(1)

书接上文~


认识 URL

平时我们俗称的"网址"其实就是说的 URL .(唯一资源定位符)

URL 不是 HTTP 专属的,很多协议都会用到.

其实除了 URL,还有一个叫 URI(大写的 i )的.(唯一资源标识符).

我们可以简单的理解成, URL 是
URI 的一种实现,实际上,在日常开发中,一般也不会刻意区分 URL 和 URI 这俩概念~
https://i-blog.csdnimg.cn/direct/e222c70959544b39bb2cb7b8a3339577.png" alt="在这里插入图片描述" />

一个具体的 URL:

https://v.bitedu.vip/personInf/student?userId=10000&classId=100
  • https : 协议方案名.常见的有 httphttps,也有其他的类型.(例如访问 mysql 时用的 jdbc:mysql)

  • user:pass : 登录信息.现在的网站进行身份认证一般不会再通过 URL 进行了.一般都会省略.

  • v.bitedu.vip : 服务器地址,此处是一个"域名",域名会通过 DNS 系统解析成一个具体的 IP 地址.

  • 端口号 : 上面的 URL 中端口号被忽略了.当端口号省略的时候,浏览器会根据协议类型自动决定使用哪个端口.

    http 协议默认使用 80 端口.
    https 协议默认使用 443 端口.

  • /personInf/student : 带层次的文件路径.

  • userId=10000&classId=100 : 查询字符串(query string).本质是一个键值对结构.键值对之间使用 & 分隔.键和值之间使用 = 分隔.

    query string 中的 key 和 value 的取值和个数,完全都是程序员自己约定的.我们可以通过这样的方式来自定制传输我们需要的信息给服务器.

  • 片段标识 : 次 URL 中省略了片段标识.片段标识主要用于页面跳转.

URL encode 介绍

像 / ? : 等这样的字符,已经被 url 当做特殊意义理解了.因此这些字符不能随意出现.

如果某个参数中需要带有这些特殊字符,就必须先对特殊字符进行转义.

一个中文字符由 UTF-8 或者 GBK 这样的编码方式构成,虽然在 URL 中没有特殊含义,但是仍然需要进行转义.否则浏览器可能吧 UTF-8/GBK 编码中的某个字节当做 URL 中的特殊符号.

转义的规则如下: 把要转的符号/汉字,每个字节以十六进制的方式表示出来,然后从右到左,取4位(不足4位直接处理),每2位做1位,前面加上 %,编码成 %XY 格式.

举个栗子:
https://i-blog.csdnimg.cn/direct/ae2527de177444e784fcbb62ce378462.png" alt="在这里插入图片描述" />
日常开发的时候,大多数情况下不需要我们手动处理转码.
日常使用的一些库(无论是前端的还是后端的)一般都是自带了 url encode / decode 的功能的.

认识 “方法”(method)

HTTP 的方法~
方法就是描述了这个 HTTP 请求的"动作"要干啥.

GET 从服务器拿到一个 XXX 数据.
POST 向服务器发送一个 XXX 数据.
https://i-blog.csdnimg.cn/direct/90d796303be44b59af4bb7cf56d16420.png" alt="在这里插入图片描述" />

GET

GET 是最常用的 HTTP 方法.常用于获取服务器上的某个资源.

  1. 直接在浏览器中输入一个 URL,此时就会触发 GET 请求.

  2. HTML 页面中的很多元素会进一步触发 GET 请求.

    举个例子: 在搜狗主页按 Ctrl + F5
    https://i-blog.csdnimg.cn/direct/af690eefe31442d7a09bcd19551308be.png" alt="在这里插入图片描述" />

    直接按 F5 与 按 Ctrl + F5 相比,少了很多东西,这是为啥?
    答: 按 Ctrl + F5 会忽略缓存,强制从服务器重新获取数据.
    浏览器都缓存了啥?
    答: 主要是一些 CSS 文件,JavaScript 文件,图片文件,字体文件等等(这些内容一般是固定的,改变频率非常低,所以只需要在第一次访问搜狗主页的时候,把上述固定的资源都保存到硬盘上,后续再访问搜狗,就没必要重复获取上述的内容了)
    浏览器缓存,节省了服务器的带宽,并且加快了页面的展示速度~

  3. JS代码中也能触发 GET 请求.

POST

POST 请求的场景.

  1. 登录/注册
    https://i-blog.csdnimg.cn/direct/d64a92bd79924ba394a0ee0803c1385f.png" alt="在这里插入图片描述" />
  2. 上传文件
    比如说在 Gitee 上,上传一个头像图片.
    https://i-blog.csdnimg.cn/direct/7719bf72bc1d4755aed5a9226465123b.png" alt="在这里插入图片描述" />

    这里的 Body 中的内容,就是头像图片的二进制内容(base64 转码后的内容)
    图片本身是二进制的, HTTP 协议虽然也能传输二进制,但是很多时候,也会把二进制数据进行转码(不一定用 urlencode(转码后的体积太大了),还有一种转码方式,base64 编码(另一种把二进制转成文本的方式))

除此之外, POST 也有很多其他的场景.

其实,HTTP 中的 GET 和 POST 很多时候都是可以通用的.


一个经典面试题: GET 和 POST 的区别.

首先,明确抛出结论,这两个方法,其实没有本质区别(GET 能用的场景,换成 POST 也成; POST 能用的场景,换 GET,也不是不行)

但是,没有本质区别,不代表没有区别,在使用习惯上还是有区别的~

  1. 语义不同.
    GET 表示从服务器获取数据.
    POST 表示往服务器提交数据.

  2. 传递数据的方式不同.
    GET 传递数据,通常是通过 query string 把自定义数据交给服务器.
    POST 传递数据,通常是通过 Body 把自定义的数据交给服务器.

  3. GET 方法对应的请求,通常设计成"幂等"的.
    POST 方法对应的请求,对应"幂等性"则无要求.
    以上是HTTP标准文档建议的做法,但是这个区别放在今天不是特别合适了.实际上,幂等不幂等更多的是看业务要求,和方法其实关系不大.

    幂等是啥?
    举个例子:
    https://i-blog.csdnimg.cn/direct/8c7aad7e12934ae285d8bb1c770d5f51.png" alt="在这里插入图片描述" />

  4. 承接幂等性
    GET 如果设计成幂等的,此时 GET 的结果是可以被缓存的.
    POST 不设计成幂等性,POST就不应该被缓存.

关于 GET 和 POST 的差别,网上还有一些说法:

  1. 有些资料说, POST 比 GET 更安全.
    https://i-blog.csdnimg.cn/direct/ec7019a6a4d34ed1be98d507e7dfe876.png" alt="在这里插入图片描述" />
    我觉得,上述说法,有些勉强了,安全性核心,在于针对密码进行加密.
    把密码明文传输,即使你是 post ,此时还是不安全,只是不直接显示了,但是黑客稍微抓个包,很容易获取到~

  2. 关于传输的数据量
    网上有个说法, GET 请求能够传输的数据量有上限.(GET 通过 URL 的 query string 传数据)并且 URL 长度存在上限.

    POST 则可以传输更大的数据, Body 这里的长度没有限制~

    HTTP 协议标准上,并没有规定 URL 的长度,之所以有长度上限的说法,是在上古时期的 IE 浏览器,实现的过程中引入的限制.
    咱们现在是 2024 年, IE 浏览器早就完了.

  3. 传输数据类型
    GET 只能传输文本数据.
    POST 可以传输文本,也能传输二进制.

    GET 也能传二进制:

    1. 基于 query string, 可以把二进制进行 urlencode / base64 转码
    2. 给 get 添加 body,并确保使用的库(客户端,服务器)都能支持这种用法即可.

大家也可以把自己的看法说出来,欢迎在评论区讨论~

其他方法

  • PUT 与 POST 相似,只是具有幂等特性,一般用于更新.
  • DELETE 删除服务器指定资源.
  • OPTIONS 返回服务器所支持的请求方法.
  • HEAD 类似于 GET ,只不过响应体不返回,只返回响应头.
  • TRACE 回显服务器端收到的请求,测试的时候会用到这个.
  • CONNECT 预留,暂无使用.

本文到这里就结束啦~

下一篇文章 JavaEE: 深入解析HTTP协议的奥秘(3)

https://i-blog.csdnimg.cn/direct/703e1af8ff51400aa23e56d64d5030ff.gif" alt="在这里插入图片描述" />


http://www.ppmy.cn/server/131722.html

相关文章

基于springboot+小程序的智慧物流管理系统(物流1)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1、项目介绍 基于springboot小程序的智慧物流管理系统实现了管理员、司机及用户。 1、管理员实现了司机管理、用户管理、车辆管理、商品管理、物流信息管理、基础数据管理、论坛管理、公告信息管理等。…

Ubuntu20.04,编译安装BCC

https://github.com/iovisor/bcc/blob/master/INSTALL.md 一、内核配置 In general, to use these features, a Linux kernel version 4.1 or newer is required. In addition, the kernel should have been compiled with the following flags set: CONFIG_BPFy CONFIG_BP…

机器学习_线性回归_岭回归算法预测波士顿房价代码实现(机器学习全流程)(附带数据集housingData下载链接, 长期有效)

# 1.导入外部数据集HousingData import pandas as pd boston_datapd.read_csv(r"C:\Users\鹰\Desktop\ML_Set\HousingData.csv")# 数据基本描述 print(boston_data.head()) print(boston_data.describe()) print(boston_data.shape)# 2.数据基本处理-缺失值处理,特征…

使用verilog设计实现的数字滤波器(低通、高通、带通)及其仿真

以下是一个简单的使用Verilog设计数字滤波器(以有限脉冲响应(FIR)滤波器为例,实现低通、高通、带通滤波器)的基本步骤和代码框架: 一、FIR滤波器原理 FIR滤波器的输出 y [ n ] y[n] y[n] 是输入信号

渐进式去中心化、SIP 和 The Sandbox DAO

去中心化自治组织(DAO)的世界正在迅速发展,The Sandbox DAO 的推出是一个谨慎的过程。我们研究了其他 DAO 的发展历程,不仅从他们的成功中学习,也从他们的失败中学习。 我们看到的一个常见错误是急于全面去中心化&…

「自动化测试」Selenium 的使用

使用 Selenium 需要先导入相关依赖 <dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-java</artifactId> <version>4.0.0</version> </dependency><dependency><groupId>io.gith…

k8s各类控制器详解

一、控制器定义 控制器也是管理pod的一种手段 自主式pod&#xff1a;pod退出或意外关闭后不会被重新创建 控制器管理的 Pod&#xff1a;在控制器的生命周期里&#xff0c;始终要维持 Pod 的副本数目 Pod控制器是管理pod的中间层&#xff0c;使用Pod控制器之后&#xff0c;只…

【教学类-36-10】20241010职业抽卡(midjounery-niji)(涂色、裁剪、游戏)

背景需求 昨天在户外玩了角色游戏&#xff0c;受道具所限&#xff08;只有烧烤做饭锅子材料&#xff09;&#xff0c;所有的孩子都只玩了烧烤店、娃娃家做饭的内容&#xff0c;扮演的都是爸妈、厨师等工作 今天从以前的纸类学具中找出一套数量相对较多的“职业涂色卡” 学具代…