深入拆解TomcatJetty(二)

ops/2024/10/21 3:21:08/

深入拆解Tomcat&Jetty(二)

专栏地址:https://time.geekbang.org/column/intro/100027701

1、Tomcat支持的IO模型和应用层协议

IO模型:

  • NIO:非阻塞 I/O,采用 Java NIO 类库实现。
  • NIO2:异步 I/O,采用 JDK 7 最新的 NIO2 类库实现。
  • APR:采用 Apache 可移植运行库实现,是 C/C++ 编写的本地库。

应用层协议:

  • HTTP/1.1:这是大部分 Web 应用采用的访问协议。
  • AJP:用于和 Web 服务器集成(如 Apache)。
  • HTTP/2:HTTP 2.0 大幅度的提升了 Web 性能。
2、总体架构

Tomcat 要实现 2 个核心功能:

  • 处理 Socket 连接,负责网络字节流与 Request 和 Response 对象的转化。
  • 加载和管理 Servlet,以及具体处理 Request 请求。

因此 Tomcat 设计了两个核心组件连接器(Connector)和容器(Container)来分别做这两件事情。连接器负责对外交流,容器负责内部处理。

由于支持的应用层协议和IO模型不通,因此Tomcat设计为一个容器可以对应多个连接器,容器和连接器都不单独对外提供服务,而是共同组合起来才能对外提供服务,组合起来的这个整体叫做 Service

image-20241019233708138

一个Tomcat实例(Server)可以对应多个Service,每个Service又可以由多个连接器和一个容器构成,连接器与容器间通过标准的 ServletRequest 对象 和 ServletResponse 对象通信。

3、连接器
3.1、整体架构

连接器对容器屏蔽了应用层协议之间的IO模型的差别,使传递给容器的都是一个标准的 ServletRequest 对象。

连接功能又可以详细分解为以下几个部分:

  • 监听网络端口。
  • 接受网络连接请求。
  • 读取请求网络字节流。
  • 根据具体应用层协议(HTTP/AJP)解析字节流,生成统一的 Tomcat Request 对象。
  • 将 Tomcat Request 对象转成标准的 ServletRequest。
  • 调用 Servlet 容器,得到 ServletResponse。
  • 将 ServletResponse 转成 Tomcat Response 对象。
  • 将 Tomcat Response 转成网络字节流。
  • 将响应字节流写回给浏览器。

通过分析连接器的详细功能列表,我们发现连接器需要完成 3 个高内聚的功能:

  • 网络通信。
  • 应用层协议解析。
  • Tomcat Request/Response 与 ServletRequest/ServletResponse 的转化。

因此 Tomcat 的设计者设计了 3 个组件来实现这 3 个功能,分别是 EndPoint、Processor 和 Adapter。EndPoint 负责提供字节流给 Processor,Processor 负责提供 Tomcat Request 对象给 Adapter,Adapter 负责提供 ServletRequest 对象给容器。

由于 I/O 模型和应用层协议可以自由组合,比如 NIO + HTTP 或者 NIO2 + AJP。Tomcat 的设计者将网络通信和应用层协议解析放在一起考虑,设计了一个叫 ProtocolHandler 的接口来封装这两种变化点。各种协议和通信模型的组合有相应的具体实现类。比如:Http11NioProtocol 和 AjpNioProtocol。

image-20241019235027769

因此连接器可以分为 ProtocolHandler 和 Adatper 组件,其中 ProtocolHandler 包括 Endpoint 和 Processor。

image-20241019235409388

3.2、ProtocolHandler

连接器用 ProtocolHandler 来处理网络连接和应用层协议:

  • EndPoint

EndPoint 是通信端点,即通信监听的接口,是具体的 Socket 接收和发送处理器,是对传输层的抽象,因此 EndPoint 是用来实现 TCP/IP 协议的。(比如EndPoint利用Socket接口将网络字节流转化为Socket数据,可以近似看为对传输层协议的间接实现。)

EndPoint 是一个接口,对应的抽象实现类是 AbstractEndpoint,而 AbstractEndpoint 的具体子类,比如在 NioEndpoint 和 Nio2Endpoint 中,有两个重要的子组件:Acceptor 和 SocketProcessor。

其中 Acceptor 用于监听 Socket 连接请求。SocketProcessor 用于处理接收到的 Socket 请求,它实现 Runnable 接口,在 Run 方法里调用协议处理组件 Processor 进行处理。为了提高处理能力,SocketProcessor 被提交到线程池来执行。而这个线程池叫作执行器(Executor)。

  • Processor

如果说 EndPoint 是用来实现 TCP/IP 协议的,那么 Processor 用来实现 HTTP 协议,Processor 接收来自 EndPoint 的 Socket,读取字节流解析成 Tomcat Request 和 Response 对象,并通过 Adapter 将其提交到容器处理,Processor 是对应用层协议的抽象。

Processor 是一个接口,定义了请求的处理等方法。它的抽象实现类 AbstractProcessor 对一些协议共有的属性进行封装,没有对方法进行实现。具体的实现有 AJPProcessor、HTTP11Processor 等,这些具体实现类实现了特定协议的解析方法和请求处理方式。

image-20241020000511389

3.3、Adapter

由于协议不同,客户端发过来的请求信息也不尽相同,Tomcat 定义了自己的 Request 类来“存放”这些请求信息。ProtocolHandler 接口负责解析请求并生成 Tomcat Request 类。但是这个 Request 对象不是标准的 ServletRequest,也就意味着,不能用 Tomcat Request 作为参数来调用容器。Tomcat 设计者的解决方案是引入 CoyoteAdapter,这是适配器模式的经典运用,连接器调用 CoyoteAdapter 的 Sevice 方法,传入的是 Tomcat Request 对象,CoyoteAdapter 负责将 Tomcat Request 转成 ServletRequest,再调用容器的 Service 方法

为什么不在 Processor 中直接转为 ServletRequest 呢?设计者认为连接器应尽量保证其独立性,不一定非要与 Servlet 容器一起工作。另外对象转换消耗的性能也并不多。(TomcatRequest -> ServletRequest)。同时如果由于容器发生更新,只需要修改 Adapter 相关代码即可,无需修改 Processor 代码。

4、多层容器

Tomcat 设计了 4 种容器,分别是 Engine、Host、Context 和 Wrapper。这 4 种容器不是平行关系,而是父子关系。

image-20241020212340675

Context 表示一个 Web 应用程序;Wrapper 表示一个 Servlet,一个 Web 应用程序中可能会有多个 Servlet;Host 代表的是一个虚拟主机,或者说一个站点,可以给 Tomcat 配置多个虚拟主机地址,而一个虚拟主机下可以部署多个 Web 应用程序;Engine 表示引擎,用来管理多个虚拟站点,一个 Service 最多只能有一个 Engine。

可以与Tomcat配置文件结合起来理解:

image-20241020212536742

Tomcat 是用组合模式来管理这些容器的。具体实现方法是,所有容器组件都实现了 Container 接口,组合模式可以使得用户对单容器对象(Wrapper)和组合容器对象(Engine、Host、Context)的使用具有一致性。

java">public interface Container extends Lifecycle {public void setName(String name);public Container getParent();public void setParent(Container container);public void addChild(Container child);public void removeChild(Container child);public Container findChild(String name);
}

请求是怎么被定位到具体的Servlet呢?Tomcat 设计了Mapper组件,它的工作原理是:Mapper 组件里保存了 Web 应用的配置信息,其实就是容器组件与访问路径的映射关系,比如 Host 容器里配置的域名、Context 容器里的 Web 应用路径,以及 Wrapper 容器里 Servlet 映射的路径,你可以想象这些配置信息就是一个多层次的 Map。具体流程如下:

  • 根据端口号(连接器)确定 Service 和 Engine
  • 根据域名确定 Host
  • 根据 URL 确定 Context
  • 根据 URL 确定 Wrapper

如图所示:

image-20241020213408478

需要注意的是,请求并不是到 Servlet 才被处理的,实际上这个查找路径上的父子容器都会对请求做一些处理。连接器中的 Adapter 最终会调用容器的 Service 方法来执行 Servlet,最先拿到请求的是 Engine 容器,Engine 容器对请求做一些处理后,会把请求传给自己子容器 Host 继续处理,依次类推,最后这个请求会传给 Wrapper 容器,Wrapper 会调用最终的 Servlet 来处理。

Tomcat 使用责任链模式和 Pipeline-Valve 管道来实现这个操作。

java">public interface Pipeline extends Contained {public void addValve(Valve valve);public Valve getBasic();	// 获取链表末端的 Value,用来调用下层容器 Pipeline 第一个 Valuepublic void setBasic(Valve valve);public Valve getFirst();
}

Value 就是其中的一个处理点:

java">public interface Valve {public Valve getNext();public void setNext(Valve valve);public void invoke(Request request, Response response)
}

Pipeline 中有 addValve 方法。Pipeline 中维护了 Valve 链表,Valve 可以插入到 Pipeline 中,对请求做某些处理。我们还发现 Pipeline 中没有 invoke 方法,因为整个调用链的触发是 Valve 来完成的,Valve 完成自己的处理后,调用 getNext.invoke() 来触发下一个 Valve 调用。

Pipeline 中的 getBasic 方法。这个 BasicValve 处于 Valve 链表的末端,它是 Pipeline 中必不可少的一个 Valve,负责调用下层容器的 Pipeline 里的第一个 Valve。

image-20241020214229336

整个调用过程由连接器中的 Adapter 触发的,它会调用 Engine 的第一个 Valve:

java">// Calling the container
connector.getService().getContainer().getPipeline().getFirst().invoke(request, response);

Wrapper 容器的最后一个 Valve 会创建一个 Filter 链,并调用 doFilter 方法,最终会调到 Servlet 的 service 方法(org.apache.catalina.core.StandardWrapperValve)。

java">        // Create the filter chain for this requestApplicationFilterChain filterChain =ApplicationFilterFactory.createFilterChain(request, wrapper, servlet);// Call the filter chain for this request// NOTE: This also calls the servlet's service() methodContainer container = this.container;try {if ((servlet != null) && (filterChain != null)) {// Swallow output if neededif (context.getSwallowOutput()) {try {SystemLogHandler.startCapture();if (request.isAsyncDispatching()) {request.getAsyncContextInternal().doInternalDispatch();} else {filterChain.doFilter(request.getRequest(),response.getResponse());}} finally {String log = SystemLogHandler.stopCapture();if (log != null && log.length() > 0) {context.getLogger().info(log);}}} else {if (request.isAsyncDispatching()) {request.getAsyncContextInternal().doInternalDispatch();} else {// 一般走的是这个 doFilterfilterChain.doFilter(request.getRequest(), response.getResponse());}}}}

调用栈如图:

image-20241020220803644

Value 和 Web 应用里的 Filter 有什么区别

  • Value 是 Tomcat 的私有机制,与 Tomcat 基础架构/API 是紧耦合的。Filter 是 Servlet API 公有的标准,所有的 Web 容器都支持。
  • Value 工作在容器级别,可以拦截到所有的请求;而 Filter 工作在应用级别,只能拦截某个 Web 应用的所有请求。如果一个 Tomcat 部署了多个应用,只能通过 Value (Host 或 Engine级别)实现统一拦截。

Tomcat 内的 Context 组件跟 Servlet 规范中的 ServletContext 接口有什么区别?跟 Spring 中的 ApplicationContext 又有什么关系?

  • Tomcat 的 Context 是一个 Web 应用; Servlet 的 ServletContext 是 Web 应用上下文, 是 Context 的一个成员变量;
  • Spring 的 ApplicationContext 是 spring 容器, 是 ServletContext 的一个属性
  1. Servlet 规范中 ServletContext 表示 web 应用的上下文环境,而 web 应用对应 tomcat 的概念是Context,所以从设计上,ServletContext 自然会成为 tomcat 的 Context 具体实现的一个成员变量。
  2. tomcat内部实现也是这样完成的,ServletContext 对应 tomcat 实现是org.apache.catalina.core.ApplicationContext,Context 容器对应 tomcat 实现是org.apache.catalina.core.StandardContext。ApplicationContext 是 StandardContext 的一个成员变量。
  3. Spring 的 ApplicationContext 之前已经介绍过,tomcat 启动过程中 ContextLoaderListener 会监听到容器初始化事件,它的contextInitialized 方法中,Spring 会初始化全局的 Spring 根容器 ApplicationContext,初始化完毕后,Spring 将其存储到ServletContext 中。
  4. 总而言之,Servlet 规范中 ServletContext 是 tomcat 的 Context 实现的一个成员变量,而 Spring 的 ApplicationContext 是 Servlet规范中 ServletContext 的一个属性。

http://www.ppmy.cn/ops/127163.html

相关文章

【计算机网络 - 基础问题】每日 3 题(四十七)

✍个人博客:https://blog.csdn.net/Newin2020?typeblog 📣专栏地址:http://t.csdnimg.cn/fYaBd 📚专栏简介:在这个专栏中,我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞…

Linux文件系统软硬链接

目录 一、认识硬件--磁盘--永久性存储介质 1.1磁盘的结构 1.2磁盘的存储构成 1.3磁盘的逻辑结构 二、文件系统 2.1文件系统的引入 2.2理解文件系统 2.3对文件增删查改的再理解 2.4如何理解“目录” 三、软硬链接 3.1软链接 3.2 硬链接 3.3ACM 一、认识硬件--磁盘--…

cmake Qt模板

一、常用模块 1. 构建完成后自动调用windeployqt打包 add_custom_command(TARGET ${PROJECT_NAME} POST_BUILDCOMMAND "${QT_PATH}/bin/windeployqt.exe" "${CMAKE_CURRENT_BINARY_DIR}/${PROJECT_NAME}.exe" )需要将QT_PATH设为Qt的安装目录。还可以用-…

【Golang】踩坑记录:make()创建引用类型,初始值是不是nil!!

文章目录 起因二、得记住的知识点1. make()切片,初始化了吗?2. make()切片不同长度容量,append时的差别3. 切片是指向数组的指针吗?4. 切片扩容时,重新分配内存,原切片的数据怎么办? 三、咳咳&a…

【论文阅读】03-Diffusion Models and Representation Learning: A Survey

Abstract(摘要) 扩散模型是各种视觉任务中流行的生成建模方法,引起了人们的广泛关注它们可以被认为是 自监督学习方法【通过数据本身的结构和特征来训练模型,而不是依赖外部标签】 的一个独特实例,因为它们独立于标签注…

博科测试IPO上市丨为行业提供智能测试综合解决方案

近年来,汽车制造、大型基础设施建设以及新能源开发等领域,对高精度、高效率的测试解决方案需求迫切。为推动行业发展,博科测试通过多年的技术积累以及自主创新,围绕伺服液压测试和汽车测试试验领域,积累了多项核心技术…

spring如何解决bean循环依赖的问题

1、概述 spring中,存在A依赖B,同时B又依赖A的情况,这种情况下,spring如何进行bean初始化呢? Service public class A {Autowiredprivate B b; }Service public class B {Autowiredprivate A a; } 本文来解释这个问题…

vector的模拟实现

1.迭代器失效 在上一篇中因为插入导致的扩容,扩容则pos指向的是之前的空间,导致了野指针的出现,没有扩容,使pos的位置意义改变,由于数据挪动,pos不再指向原来的位置,认为上面俩种迭代器失效。(…