摘要
CDN的全称是(Content Delivery Network),即内容分发网络。其目的是通过在现有的Internet中增加一层新的CACHE(缓存)层,将网站的内容发布到最接近用户的网络”边缘“的节点,使用户可以就近取得所需的内容,提高用户访问网站的响应速度。从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等原因,提高用户访问网站的响应速度。
简单的说,CDN的工作原理就是将您源站的资源缓存到位于全球各地的CDN节点上,用户请求资源时,就近返回节点上缓存的资源,而不需要每个用户的请求都回您的源站获取,避免网络拥塞、缓解源站压力,保证用户访问资源的速度和体验。
一、CDN加速原理
假设您的加速域名为www.aliyundoc.com
,接入CDN开始加速服务后,当终端用户在北京发起HTTP请求时,处理流程如下图所示。
- 当终端用户向
www.aliyundoc.com
下的指定资源发起请求时,首先向Local DNS(本地DNS)发起请求域名www.aliyundoc.com
对应的IP。 - Local DNS检查缓存中是否有
www.aliyundoc.com
的IP地址记录。如果有,则直接返回给终端用户;如果没有,则向网站授权DNS请求域名www.aliyundoc.com
的解析记录。 - 当网站授权DNS解析
www.aliyundoc.com
后,返回域名的CNAMEwww.aliyundoc.com.example.com
。 - Local DNS向DNS调度系统请求域名
www.aliyundoc.com.example.com
的解析记录,DNS调度系统将为其分配最佳节点IP地址。 - Local DNS获取DNS调度系统返回的最佳节点IP地址。
- Local DNS将最佳节点IP地址返回给用户,用户获取到最佳节点IP地址。
- 用户向最佳节点IP地址发起对该资源的访问请求。
- 如果该最佳节点已缓存该资源,则会将请求的资源直接返回给用户(步骤8),此时请求结束。
- 如果该最佳节点未缓存该资源或者缓存的资源已经失效,则节点将会向源站发起对该资源的请求。获取源站资源后结合用户自定义配置的缓存策略,将资源缓存到CDN节点并返回给用户(步骤8),此时请求结束。
二、CDN应用场景和作用
CDN的应用场景如下表所示。可使用CDN加速的站点主要包括媒体站点、网页站点和下载站点,下表列出了每个站点适用的场景。
媒体站点 | 网页站点 | 下载站点 |
---|---|---|
|
|
|
应用场景 | 场景概述 |
---|---|
图片小文件 | 适用于网站或应用中小文件的加速分发,例如各种门户网站、电子商务类网站、新闻资讯类网站或应用、娱乐游戏类网站等。 |
大文件 | 适用于各类大文件的下载和分发加速,例如游戏安装包、应用更新、手机ROM升级、应用程序包下载等,平均单个文件大小在20 MB以上。 |
频音点播 | 适用于各类视音频网站,例如影视类视频网站、在线教育类视频网站、新闻类视频网站、短视频社交类网站以及音频类相关网站和应用,支持MP4、FLV等主流视频格式。 |
2.1 图片小文件
图片小文件适用于网站或应用中小文件的加速分发,例如各种门户网站、电子商务类网站、新闻资讯类网站、娱乐游戏类网站等。您需要将源站内容进行动静态分离,静态内容使用CDN加速,例如图片、CSS、JS小文件等;CDN加速图片小文件业务可以帮您解决以下问题:
- 终端用户访问慢:网站小文件内容多、打开速度太慢。
- 跨区域访问质量差:终端用户分布在不同区域,不同区域的访问速度和质量高低不一。
- 高并发压力大:运营推广期间,源站服务器压力大,服务器容易崩溃,造成服务不可用。
- 图片格式分辨率处理复杂:无法根据适合的终端情况进行图片压缩和优化。
2.2 大文件下载
大文件下载适用于各类大文件的下载和分发加速,例如游戏安装包、应用更新、手机ROM升级、应用程序包下载等,平均单个文件大小在20 MB以上。CDN加速大文件下载业务可以帮您解决以下问题:
- 终端用户无法下载或者下载太慢。
- 网络环境不稳定时,下载容易中断,重新下载会耗费额外的资源。
- 网站内容不安全,容易被劫持或者盗链,对业务造成额外的损失。
- 高并发下载或者下载突增场景下对源站性能要求非常高,且源站的带宽成本也较高。
2.3 视音频点播
视音频点播适用于各类视音频网站,例如影视类视频网站、在线教育类视频网站、新闻类视频网站、短视频社交类网站以及音频类相关网站和应用,您可以使用CDN产品实现对音视频内容的文件分发和访问加速。CDN加速视音频点播业务可以帮您解决以下问题:
- 终端用户访问视频时打不开视频或容易卡顿,观看不流畅。
- 视频资源容易被劫持或盗用,版权得不到有效保护。
- 高并发访问或者访问突增场景下对源站性能要求非常高,且源站的带宽成本也较高。
使用CDN可以帮您实现静态资源的加速和分发,提高资源访问速度:
- 丰富的资源节点:为用户提供就近接入的同运营商CDN节点,解决长距离接入和跨运营商访问带来的延迟高和速度慢的问题。
- 资源可弹性扩展:基于全球2800+节点,资源可弹性扩展,实现业务高可用。
- 精准的调度系统:实时获取CDN节点的健康状况,并根据用户所在位置和运营商来分配最佳接入节点,以便取得最佳接入效果。
- 智能的传输链路:通过协议优化、连接优化等措施来降低总体时延、提高传输速度,尤其是提高弱网环境下的传输速度。
- 高效的缓存策略:能够带来更高的缓存命中率,命中就近节点上的远程资源,提供高效地访问速度。
- 降低您的IT成本:可将您的业务算力、带宽、连接数转移到CDN边缘节点,降低您的IT成本。
- 强大的带宽输出能力:全网带宽输出能力达150 Tbps。
- 提供行业通用标准API:提高易用性和适用性。
三、CDN系统架构核心
CDN的产品架构图,由调度系统、链路质量系统、缓存系统和支撑系统这四大系统组成。
3.1 CDN的产品架构图
- 调度系统:支持策略中心、DNS、HTTPDNS和302调度模式。当终端用户发起访问请求时,用户的访问请求会先进行域名DNS解析,然后通过CDN的调度系统处理用户的解析请求。
- 链路质量系统:链路质量探测系统会实时监测缓存系统中的所有节点和链路的实时负载以及健康状况,并将结果反馈给调度系统,调度系统根据用户请求中携带的IP地址解析用户的运营商和区域归属,然后综合链路质量信息为用户分配一个最佳接入节点。
- 缓存系统:用户通过收到的最佳接入节点访问对应的缓存节点,如果节点已经缓存了用户请求的资源,会直接将资源返回给用户;如果L1(边缘节点)和L2(汇聚节点)节点都没有缓存用户请求的资源,此时会返回源站去获取资源并缓存到缓存系统,供后续用户访问,避免重复回源。分级缓存的部署架构可提高内容分发效率、降低回源带宽以及提升用户体验。
- 支撑服务系统支撑服务系统包括天眼、数据智能和配置管理系统,分别具备了资源监测、数据分析和配置管理能力。
- 资源监测:天眼可以对缓存系统上用户业务运行的状态进行监测。例如对CDN加速域名的QPS、带宽、HTTP状态码等常见指标的监控。
- 数据分析:用户可以分析CDN加速域名的TOP URL、PV、UV等数据。
- 配置管理:通过配置管理系统,用户可以配置缓存文件类型、缓存时去参数缓存等缓存规则,以提升缓存系统的运作效率。
3.2 CDN网络的基础概念
源站,指您运行业务的网站服务器,是加速分发数据的来源。源站可用来处理和响应用户请求,当边缘节点没有缓存用户请求的内容时,节点会返回源站获取资源数据并返回给用户。CDN的源站可以是对象存储OSS、函数计算、自有源站(IP、源站域名)。
边缘节点是CDN用于缓存源站资源,以便快速响应不同地域用户请求的网络节点。在CDN的帮助文档中,边缘节点、CDN节点、Cache节点、缓存节点、加速节点、节点等都指CDN的边缘节点。
加速域名,是您接入CDN用于加速、终端用户实际访问的域名。例如,您将域名aliyundoc.com
接入DN,aliyundoc.com
即为加速域名。
CDN通过加速域名,将源站资源缓存到CDN加速节点,实现资源访问加速。在DN的帮助文档中,加速域名通常被简写为域名。域名(Domain Name)又称网域,是由一串用点分隔的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。
CNAME(Canonical Name)记录,指域名解析中的别名记录,用来把一个域名解析到另一个域名(CNAME域名),再由CNAME域名来解析到需要访问的服务器IP地址。
CNAME域名,是CDN生成的,当您在CDN控制台添加加速域名后,系统会为加速域名分配一个*.*kunlun*.com
形式的CNAME域名。说明 CDN产品通过分布广泛的CDN边缘节点来为最终用户提供加速服务,不同区域或者不同运营商的用户访问到的CDN节点IP地址是不同的,因此加速域名就无法通过DNS的A记录解析的方式唯一解析到某个IP地址,这个时候就引入了CNAME域名。添加加速域名后,您需要在您的DNS解析服务商处,添加一条CNAME记录,将加速域名唯一解析到CNAME域名,记录生效后域名解析就正式转向CDN服务,该域名所有的请求都将转向CDN的边缘节点,达到加速效果。CNAME域名将会解析到具体哪个CDN节点IP地址,将由CDN的调度系统来综合区域、运营商、节点资源水位等多个条件来决定。
静态内容是指用户多次请求某一资源,响应返回的数据都是相同的内容。例如图片、视频、网站中的文件(HTML、CSS、JS)、软件安装包、APK文件、压缩包文件等。CDN通过加速域名将源站的静态资源缓存到CDN遍布全球的加速节点上,供用户就近访问,实现资源访问加速。
动态内容是指用户多次请求某一资源,响应返回的数据可能是不同的内容。例如网站中的文件(ASP、JSP、PHP、PERL、CGI)、API接口、数据库交互请求等。
DNS(Domain Name System)即域名解析服务,主要功能是将域名解析为网络可以识别的IP地址,即域名解析。人们习惯记忆域名,但机器间互相只识别IP地址。域名解析需要由专门的DNS服务器来完成,整个过程自动进行。例如,您上网时输入域名aliyundoc.com
会自动转换成10.10.10.10(举例说明,具体IP以实际为准)。
SSL(Secure Sockets Layer)即安全套接字协议,SSL协议位于TCP/IP协议与各种应用层协议之间,可以有效协助Internet上的应用软件提升通讯时的资料完整性及安全性。IETF将SSL标准化后名称被改为TLS(Transport Layer Security),即传输层安全协议,因此通常将两者并称为SSL/TLS。
当用户通过浏览器发送请求时,如果CDN节点未缓存请求的资源或缓存资源已到期,此时会回源站获取资源并返回给用户,该过程被称为回源。
回源HOST,即CDN节点回源时实际请求的域名。当源站服务器上提供多个域名服务时,您可根据业务需求指定CDN节点回源时在访问的具体域名。例如,您期望CDN回源时实际请求的地址为aliyundoc.com
,与加速域名www.aliyundoc.com
不同,那么您需要配置回源HOST为aliyundoc.com
。
回源协议,指CDN节点回源时使用的协议,有可能与客户端访问资源时使用的协议相同,也有可能不相同。例如,当客户端使用HTTPS方式请求未缓存在CDN节点上的资源时,可以配置CDN节点使用HTTPS协议回源站获取资源,也可以配置使用HTTP协议回源(源站不支持HTTPS协议的情况下)。
SNI(Server Name Indication)是对SSL/TLS协议的扩展,可用来解决一个HTTPS服务器(同一个IP地址)拥有多个域名,但是无法确定客户端到底请求的是哪一个域名的服务的问题。
当您的源站IP绑定了多个域名,且CDN回源协议为HTTPS时,可通过配置回源SNI,来指明客户端从哪个域名获取资源,服务器会根据配置的SNI信息返回正确的证书给客户端。
Range回源,指CDN节点在回源的HTTP请求里面携带了Range信息,源站在收到CDN节点的回源请求时,根据HTTP请求头中的Range信息返回指定范围的内容数据给CDN节点,例如只返回某个文件的0-100Byte范围内的数据。
在视频点播、软件下载等大文件内容分发场景下,Range回源可有效提高文件分发效率,可以提高缓存命中率,减少回源流量消耗和源站压力,并且提升资源响应速度。说明 Range是HTTP请求头之一,可用来指定需获取的内容的范围。
回源302跟随,指CDN节点代替客户端直接处理源站响应的302状态码的内容,可减少处理流程,加快获取资源的速度。
Referer防盗链,是基于HTTP请求头中Referer字段(例如,Referer黑白名单)来设置访问控制规则,实现对访客的身份识别和过滤,防止网站资源被非法盗用。配置Referer黑白名单后,CDN会根据名单识别请求身份,允许或拒绝访问请求。说明 Referer是HTTP请求头的一部分,携带了HTTP请求的来源地址信息(协议+域名+查询参数),可用于识别请求的来源。
带宽封顶,指通过设置带宽上限,来控制带宽用量,减少因突发流量导致的损失。当指定加速域名在统计周期(1分钟)内产生的平均带宽超出预设上限,CDN将停止为该域名提供加速服务,且该域名会自动下线,并被解析到无效地址offline.***.com
,无法被继续访问。
缓存过期时间,指资源在CDN节点上缓存的时长。资源过期后会自动从CDN节点删除,用户向CDN节点发起的访问请求会被判定为未命中缓存,CDN节点会自动回源站获取最新资源返回给用户,并缓存到CDN节点。
跨域资源共享(CORS),是一种基于HTTP头的访问控制机制,允许Web服务器声明哪些源站(指定的域名、协议、端口)有权限通过浏览器访问指定资源。
边缘脚本(EdgeScript,简称ES)是一个可供您快速实现CDN/DCDN定制配置的工具箱,当CDN/DCDN控制台上的标准配置无法满足您的业务需求时,可以使用边缘脚本通过简单地编程实现定制化业务需求。
边缘程序(EdgeRoutine,简称ER)是一个运行在全球边缘节点上的JavaScript代码运行环境,支持ES6语法和标准的Web Service Worker API。您可以将自行开发的JavaScript代码发布至全球边缘程序运行,在全球边缘节点上就近地处理客户端的请求。
HSTS(HTTP Strict Transport Security,HTTP 严格传输安全),是一种网站用来声明他们只能使用安全连接(HTTPS)访问的方法。网站可通过声明HSTS,来强制客户端(如浏览器)只能使用HTTPS与服务器连接,拒绝所有的HTTP连接并阻止用户接受不安全的SSL证书,降低第一次访问请求被拦截的风险。具体配置方法,请参见配置HSTS。
例如,未开启HSTS的情况下,当您源站使用HTTPS请求时,在浏览器输入HTTP链接,用户请求访问到服务器上的时候,服务器会将该HTTP请求301或302重定向到HTTPS,在用户请求以HTTP协议访问服务器的过程中,HTTP请求可能被恶意拦截或者篡改,存在安全隐患。开启了HSTS以后,客户端只能使用HTTPS协议访问服务器,这样就可以杜绝这类隐患。
QUIC(Quick UDP Internet Connections)是一个基于UDP的通用网络协议,能够保障网络安全性(与TLS/SSL相当),同时具有更低的连接和传输延时,有效避免网络堵塞,在丢包和网络延迟严重的情况下仍可提供可用的服务。
QUIC在应用程序层面就能实现不同的拥塞控制算法,不需要操作系统和内核支持,相比于传统的TCP协议,拥有更好的改造灵活性,非常适合在TCP协议优化遇到瓶颈的业务。
HTTP状态码(英文:HTTP Status Code),是用来表示HTTP响应状态的数字代码,可用来判断和分析服务器的运行状态。当客户端(例如浏览器)向服务器发出请求时,服务器会返回一个包含HTTP状态码的信息头来响应客户端的请求,通过状态码告诉客户端当前请求响应的状态。
HTTP常见状态码分类:
- 1xx:消息
- 2xx:成功
- 3xx:重定向
- 4xx:客户端错误
- 5xx:服务器错误
四、CDN与全站加速的区别
对比项 | CDN | 全站加速 |
---|---|---|
典型应用场景 | 手机App更新、游戏包更新、视频点播(长视频、短视频)、图文网站。 | 在线商城、在线支付、聊天互动、在线教育、全球对战游戏、金融理财。 |
覆盖范围 |
|
|
加速方式 | 以静态内容加速为主,适用于高带宽大流量场景,动态资源直接回源。
| 支持纯动态加速和动静态混合加速。
|
协议支持 |
|
|
调度模式 | 支持DNS、HTTPDNS、302调度。 | 支持DNS、HTTPDNS、302调度。 |
边缘计算 |
|
|
五、CDN的性能衡量指标
您可以通过CDN的性能衡量指标,观察使用CDN前后网站加速的情况,评估CDN加速的效果,帮助您更好地做出业务调整和决策。衡量指标主要包括:您可以根据以下通用性能指标(包括但不限于),观察使用CDN前后您的网站情况。
- 通常使用CDN后的网络延时、丢包率、回源率都会降低,缓存命中率则会提高。但是由于业务场景和业务类型不同,即使您选择了相同配置的CDN服务,实际产生的加速效果也不相同,因此本文仅提供了定性的指标以供观测。
- 表格中提到的回源率、缓存命中率是指使用CDN后的衡量指标,如果您没有使用CDN,回源请求数为100%,缓存命中率为0。
5.1 数据上传路径
5.2 数据下载路径
指标 | 说明 |
---|---|
DNS时间 | 指从浏览器终端发起的访问请求开始,到浏览器终端获得最终访问主机IP地址所消耗的时间。 |
TCP时间 | 指客户端与目标服务器建立TCP连接所消耗的时间。 |
SSL时间 | 指客户端和Web服务器建立安全套接层(SSL)连接的消耗时间。 |
发送时间 | 指SSL握手完成开始发送请求到请求发送完成所消耗的时间。 |
建立连接时间 | 建立连接时间简称为建连时间,如果CDN节点使用HTTP协议加速客户业务,建连时间包含“DNS时间+TCP时间”;如果CDN节点使用HTTPS协议加速客户业务,建连时间包含“DNS时间+TCP时间+SSL时间”。建立连接的时间长短,可以反映CDN服务的节点资源覆盖的丰富程度以及调度能力。 |
响应时间 | 指浏览器发出HTTP请求后,Web服务器进行后台处理以及响应的时间。 |
下载用时 | 指您收到Web服务器返回的第一个数据包,到完成下载的总时间。 |
首包时间 | 指从客户端开始发送请求到收到服务器端返回的第一个HTTP协议数据包之间所需要的时间,首包时间可以反映出CDN服务节点的整体性能。
说明 刚购买的域名,通常解析时间较长,和CDN的缓存时间无关。 |
整体性能 | 指完成整个文件的上传或下载所需要的总时长。 |
丢包率 | 指在网络传输中丢失数据包的数量占发送数据包总数的比率。 |
回源率 | 回源率分为回源请求数比例及回源流量比例两种:
|
缓存命中率 | CDN缓存命中率包括字节命中率和请求命中率,CDN缓存命中率通用指字节命中率,缓存命中率越高,性能越好。
|
博文参考
CDN的性能衡量指标 - CDN - 阿里云