网络发展史
独立模式
独立模式:计算机之间相互独立。
网络互连
网络互连:将多台计算机连接在一起,完成数据共享。
数据共享本质是网络数据传输,即计算机之间通过网络来传输数据,也称为网络通信。
根据网络互连的规模不同,可以划分为局域网和广域网。
局域网
局域网,即 Local Area Network,简称LAN。
Local 即标识了局域网是本地,局部组建的一种私有网络。
局域网内的主机之间能方便的进行网络通信,又称为内网;局域网和局域网之间在没有连接的情况下,是无法通信的。
局域网组建网络的方式有很多种:
- 基于网线直连
- 基于集线器组建
- 基于交换机组建
- 基于交换机和路由器组建
广域网
广域网,即 Wide Area Network,简称WAN。
通过路由器,将多个局域网连接起来,在物理上组成很大范围的网络,就形成了广域网。广域网内部的局域网都属于其子网。
网络通信基础
网络互连的目的是进行网络通信,也即是网络数据传输,更具体一点,是网络主机中的不同进程间,基于网络传输数据。
那么,在组建的网络中,如何判断到底是从哪台主机,将数据传输到那台主机呢?这就需要使用IP地址来标识。
IP地址
概念
IP地址主要用于标识网络主机、其他网络设备(如路由器)的网络地址。简单说,IP地址用于定位主机的网络地址。
使用这个地址,来描述网络上一个设备所在的位置。
就像我们发送快递一样,需要知道对方的收货地址,快递员才能将包裹送到目的地。
格式
IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节),如:01100100.00000100.00000101.00000110。
通常用“点分十进制”的方式来表示,即 a.b.c.d 的形式(a,b,c,d都是0~255之间的十进制整数)。如:100.4.5.6。
特殊IP
127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
本机环回主要用于本机到本机的网络通信(系统内部为了性能,不会走网络的方式传输),对于开发网络通信的程序(即网络编程)而言,常见的开发方式都是本机到本机的网络通信。
IP地址解决了网络通信时,定位网络主机的问题,但是还存在一个问题,传输到目的主机后,由哪个进程来接收这个数据呢?这就需要端口号来标识。
端口号
概念
在网络通信中,IP地址用于标识主机网络地址,端口号可以标识主机中发送数据、接收数据的进程。简单说:端口号用于定位主机中的进程。
区分一个主机上不同的应用程序。
类似发送快递时,不光需要指定收货地址(IP地址),还需要指定收货人(端口号)。
格式
端口号是0~65535范围的数字,在网络通信中,进程可以通过绑定一个端口号,来发送及接收网络数据。
注意事项
两个不同的进程,不能绑定同一个端口号,一个端口只能被一个进程占用,但一个进程可以绑定多个端口号。
一个网络程序在启动时都需要关联/绑定一个或者多个端口号,后续的通信过程都需要依赖端口来进行展开的。MySQL默认关联的端口3306
了解:
一个进程启动后,系统会随机分配一个端口(启动端口)
程序代码中,进行网络编程时,需要绑定端口号(收发数据的端口)来发送、接收数据。
进程绑定一个端口号后,fork一个子进程,可以实现多个进程绑定一个端口号,但不同的进程不能绑定同一个端口号。
现在有一个问题:有了IP地址和端口号,可以定位到网络中唯一的一个进程,但还存在一个问题,网络通信是基于二进制0/1数据来传输,如何告诉对方发送的数据是什么样的呢?
网络通信传输的数据类型可能有多种:图片,视频,文本等。同一个类型的数据,格式可能也不同,如发送一个文本字符串“你好!”:如何标识发送的数据是文本类型,及文本的编码格式呢?
基于网络数据传输,需要使用协议来规定双方的数据格式。
认识协议
概念
协议,网络协议的简称,网络协议是网络通信(即网络数据传输)经过的所有网络设备都必须共同遵从的一组约定、规则。如怎么样建立连接、怎么样互相识别等。只有遵守这个约定,计算机之间才能相互通信交流。
描述了网络通信传输的数据的含义。
通常由三要素组成:
- 语法:即数据与控制信息的结构或格式;
类似打电话时,双方要使用同样的语言:普通话
- 语义:即需要发出何种控制信息,完成何种动作以及做出何种响应;
语义主要用来说明通信双方应当怎么做。用于协调与差错处理的控制信息。
类似打电话时,说话的内容。一方道:你瞅啥?另一方就得有对应的响应:瞅你咋的!
- 时序,即事件实现顺序的详细说明。
时序定义了何时进行通信,先讲什么,后讲什么,讲话的速度等。比如是采用同步传输还是异步传输。
女生和男生的通话,总是由男生主动发起通话,而总是在男生恋恋不舍的时候,由女生要求结束通话。
协议(protocol)最终体现为在网络上传输的数据包的格式。
作用
为什么需要协议?
就好比见网友,彼此协商胸口插支玫瑰花见面,这就是一种提前的约定,也可以称之为协议。
协议就只是表示一种约定,这样的约定可以是任意的
计算机之间的传输媒介是光信号和电信号。通过 “频率” 和 “强弱” 来表示 0 和 1 这样的信息。要想传递各种不同的信息,就需要约定好双方的数据格式。
计算机生产厂商有很多;
计算机操作系统,也有很多;
计算机网络硬件设备,还是有很多;
如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来,约定一个共同的标准,大家都来遵守,这就是 网络协议;
因为电脑种类很多,设备的厂商也很多,必须要有一份统一的协议标准,让大家都按照同样的标准来研发设备,大家搞出来的都可以一起相互通信了
网络通信协议虽然很复杂,但本质上也是人为约定出来的一些规则,网络发展这么多年了,很多细节已经有大佬规定好现成的协议了,我们主要是学习大佬们这些定好的协议就好了
知名协议的默认端口
系统端口号范围为 0 ~ 65535,其中:0 ~ 1023 为知名端口号,这些端口预留给服务端程序绑定广泛使用的应用层协议,如:
22端口:预留给SSH服务器绑定SSH协议
21端口:预留给FTP服务器绑定FTP协议
23端口:预留给Telnet服务器绑定Telnet协议
80端口:预留给HTTP服务器绑定HTTP协议
443端口:预留给HTTPS服务器绑定HTTPS协议
以上只是说明 0 ~ 1023 范围的知名端口号用于绑定知名协议,但某个服务器也可以使用其他 1024 ~ 65535 范围内的端口来绑定知名协议。
餐厅的VIP包房是给会员使用,但会员也可以不坐包房,坐其他普通座位。
五元组
在TCP/IP协议中,用五元组来标识一个网络通信:
- 源IP:标识源主机
- 源端口号:标识源主机中该次通信发送数据的进程
- 目的IP:标识目的主机
- 目的端口号:标识目的主机中该次通信接收数据的进程
- 协议号(协议类型):标识发送进程和接收进程双方约定的数据格式
五元组在网络通信中的作用,类似于发送快递:
协议分层
对于网络协议来说,往往分成几个层次进行定义。
网络通信是很复杂的工作,会涉及到一系列非常繁琐,非常细节的工作…靠一个协议解决所有问题,导致这个协议非常复杂,非常庞大,因此需要对协议进行拆分。这么一拆分,拆分出来的协议有点多,因此对这些协议进行分类,然后分层。
分层的作用
上层协议,调用下层协议;下层协议,给上层提供服务支持。避免跨层级调用引起的混乱。也就属于是给这些协议搞了明确的层级关系,避免跨层之间的交互。降低耦合,提高整个系统的可读性
- 上层不需要了解下层的细节(封装)
- 灵活的调整/替换某层的协议
上下两种说法都挺好,都了解理解一下~~
为什么需要网络协议的分层?
分层最大的好处,类似于面向接口编程:定义好两层间的接口规范,让双方遵循这个规范来对接。
在代码中,类似于定义好一个接口,一方为接口的实现类(提供方,提供服务),一方为接口的使用类(使用方,使用服务):
- 对于使用方来说,并不关心提供方是如何实现的,只需要使用接口即可
- 对于提供方来说,利用封装的特性,隐藏了实现的细节,只需要开放接口即可。
这样能更好的扩展和维护,如下图:
协议分层有两种主要的方式:OSI七层网络模型(只是在教科书中)、TCP/IP五层网络模型(真实世界的情况)
OSI七层模型
OSI:即Open System Interconnection,开放系统互连
- OSI 七层网络模型是一个逻辑上的定义和规范:把网络从逻辑上分为了7层。
- OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输;
- 它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整。通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯。
OSI 七层模型划分为以下七层:
OSI 七层模型既复杂又不实用:所以 OSI 七层模型没有落地、实现。
实际组建网络时,只是以 OSI 七层模型设计中的部分分层,也即是以下 TCP/IP 五层(或四层)模型来实现。
TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇。
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
- 应用层:负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。我们的网络编程主要就是针对应用层。(拿到这个数据具体用来干什么)
- 传输层:负责两台主机之间的数据传输。如传输控制协议 (TCP),能够确保数据可靠的从源主机发送到目标主机。(只关注起点和终点,不关注中间过程 => 数据从哪里出发,要到哪里去)
- 网络层:负责地址管理和路由选择。例如在IP协议中,通过IP地址来标识一台主机,并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。路由器(Router)工作在网路层。(路径规划 => 路线怎么走法)
- 数据链路层:负责设备之间的数据帧的传送和识别。例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网,无线LAN等标准。交换机(Switch)工作在数据链路层。(相邻节点之间,数据如何传输)
- 物理层:负责光/电信号的传递方式。比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤,现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器(Hub)工作在物理层。(描述网络通信中的一些基础设施需遵守的规范,会约定网线、网口是什么样子的…)
TCP/IP五层(或四层)网络模型,算上物理层就是五层、不算就是四层,物理层偏硬件,和软件关系不大
图中右侧:
应用程序:chrome、QQ音乐、QQ…不同的应用程序,就会使用不同的应用层协议了通信(也可能是相同的)
操作系统:传输层协议、网络层协议都属于是操作系统中,已经内置的
设备驱动程序与网络接口:驱动程序是硬件厂商提供的,驱动程序会和系统内核进行适配,进一步的系统就可以通过驱动来操作硬件
我们主要是和应用层和传输层打交道
网络分层对应
网络数据传输时,经过不同的网络节点(主机、路由器)时,网络分层需要对应。
以下为同一个网段内的两台主机进行文件传输:
以下为跨网段的主机的文件传输:数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器
在这里插入图片描述
网络数据传输
网络数据传输的基本流程:封装和分用
以QQ发送信息为例,介绍网络数据传输的基本流程
A把信息通过QQ发给主机B
- 应用层:
qq应用程序,从输入框中获取你要发送的信息,构造成应用层级数据报(根据应用层协议,具体啥协议开发的人才知道),所谓的“构造成应用层级数据报”过程,就是按照一定的格式进行字符串拼接。应用程序就会调用传输层提供的接口,把上述数据交给传输层进行处理
- 传输层:
传输层协议很多,其中最主要的是TCP和UDP,此处假设使用UDP。上面把数据从应用层传到了传输层,交给了UDP,于是UDP协议就要按照自己的协议格式生成一个UDP数据报。在应用层数据报的基础上添加了一个UDP报头(header),原来的应用层数据报就成了UDP的载荷(payload),UDP不关心应用层数据报里面有啥,只是把其当成一个字符串,构造成一个UDP数据报。UDP报头包含很多信息,这里先说有源端口,目的端口。此时传输层会把构造好的UDP数据报进一步交给网络层
- 网络层
网络层最主要的协议:IP协议
IP协议会根据自己的格式,来构造出IP数据报,即在UDP数据报的基础上添加了IP报头,原来的UDP数据报就成了IP数据报的载荷(payload),同理IP协议不关心这里的UDP数据报内容是啥,只是把其当成一个字符串,在这个基础上拼接了另外一个IP报头。IP报头包含很多数据,最关键的是源IP,目的IP
一次通信需要源IP、源端口、目的IP、目的端口、协议类型,网络通信中的“五元组”
接下来还需要把数据传输给数据链路层
- 数据链路层
协议也很多,其中以太网(平时上网需要插网线,就是符合以太网协议的网线),以太网又会针对IP数据报进行封装,再添加上数据头(以太网数据帧头)、数据尾(帧尾),原来的IP数据报就成了以太网数据报的载荷,同理以太网也不关心这里的IP数据报内容是啥,只是把其当成一个字符串,进一步的拼接上帧头帧尾,构造成以太网数据帧。上述数据还要进一步交给物理层
网络上传输数据的基本单位有很多种术语叫法:包(packet)、帧(frame)、报(Datagram)、段(segment),如果深究是有区别的,但日常学习、开发中使用这些术语也是混用的
- 物理层
硬件设备(网卡)
本质上以上数据都是二进制数据,硬件设备就需要对上述数据进行转换成光信号/电信号/电磁波
以上主机A就完成了发送过程
接收方的情况(主机B),先不考虑中间过程
- 物理层(硬件设备,网卡),收到光信号/电信号/电磁波,将收到的信号进行解调,得到了一串0101二进制数据序列,也就是以太网数据帧,这个数据就要交给上一层,数据链路层
- 数据链路层:其中的以太网协议就会把这个数据进行解析(掐头去尾), 此时再把载荷部分交给网络层(IP协议)
- 网络层:IP协议再针对这个数据报进行解析,去掉IP报头,取出载荷,进一步交给传输层
- 传输层:根据IP报头中的字段,(假设按照上面A传给B的过程来,那就是UDP的)就知道当前这个载荷是UDP数据报,交给UDP处理,UDP也是要针对数据报进行解析,去掉报头,取出载荷进一步交给应用程序
- 应用层:UDP报头中,有一个字段,目的端口,根据目的端口找到关联的应用程序,就交给这个程序即可,qq收到这个数据了,就会按照qq的应用层协议,进行解析,把这里的数据显示在界面上,在qq的对应的头像就开始闪烁,点进去就能显示这个新的信息,以及信息的时间啥的…
以上主机B就完成了接收过程
主机A从上到下依次添加报头的过程称为“封装”(打包快递)
主机B从下到上依次解析报头的过程称为“分用”(拆快递)
每次网络数据的传输都是要经历这个过程的
网络层负责的工作是路线规划(走哪条路),数据链路层是根据路线规划好后应该怎么走(坐车还是走路)