目录
网络编程阶段项目
项目目标
Web服务器开发准备
Html语言基础
Html简介
Html标签介绍
题目标签
文本标签
列表标签
图片标签
超链接标签
http请求消息
请求类型
http响应消息
http常见状态码
http常见文件类型分类
web服务器开发
基于epoll的web服务器
网页服务器总结:
BS模式示意图
web服务器开发流程
汉字乱码问题
浏览器和web服务器通信模式
完整代码
网络编程阶段项目
项目目标
实现一个web服务器
可以在浏览器页面请求资源页面
Web服务器开发准备
为了编写web服务器,我们需要学会编写html页面,以及掌握部分http协议知识,这两部分内容将在接下来进行介绍。这两个准备工作之后,还需要知道web服务器的通信流程是什么?还需要思考如何支持多浏览器并发访问!
Html语言基础
Html简介
Html(Hyper Texture Markup Language)是超文本标记语言,在计算机中以 .html或者.htm作为扩展名,可以被浏览器识别,就是经常见到的网页.
Html的语法非常简洁,比较松散,以相应的英语单词关键字进行组合,html标签不区分大小写,标签大多数成对出现,有开始,有结束,例如 <html></html>,但是并没有要求必须成对出现.同时也有固定的短标签,例如<br/>,<hr/>.
学习html基本可以认为就是学习各种标签,标签也可以设置属性,例如<font color="red">hello, world</font>,示例中color代表标签的颜色属性,red代表标签是红色字体,hello,world为实际显示的内容.可以新建一个文本文档,然后将后缀名修改.html文件,用代码编辑器打开该html文件可以编辑文件(例如notepad++),将上述内容保存到文件中,双击该文件可以看到如下效果:
Html的组成可以分为如下部分:
- <!doctype html> 声明文档类型,可以不写
- <html> 开始 和</html> 结束,属于html的根标签
- <head></head> 头部标签,头部标签内一般有 <title></title>
- <body></body> 主体标签,一般用于显示内容
例如
<html><head><title>这是一个标题</title></head><body><font color="red" size="5">hello, world</font></body></html>
如果想要添加注释,可以使用 <!—我是注释 -->的方式.
也可以指定页面类型和字符编码,下面设置页面类型为html,并且字符编码为utf8
<meta http-equiv="content-Type" content="text/html; charset=utf8">
Html标签属性,可以双引号,单引号,或者不写
Html标签介绍
题目标签
共有6种,<h1>,<h2>,…<h6>,其中<h1>最大,<h6>最小
文本标签
<font>标签,可以设置颜色和字体大小属性
颜色表示方法(可以参考网站: RGB颜色对照表):
- 英文单词 red green blue …
- 使用16进制的形式表示颜色:#ffffff
- 使用rgb(255,255,0)
字体大小可以使用size属性,大小范围为1-7,其中7最大,1最小.
有时候需要使用换行标签 ,这是一个短标签 <br/>
与之对应另外还有一个水平线也是短标签, <hr/>,水平线也可以设置颜色和大小
列表标签
列表标签分无序列表和有序列表,分别对应<ul>和<ol>.
无序列表的格式如下:
<ul>
<li>列表内容1</li>
<li>列表内容2</li>
…
</ul>
无序列表可以设置type属性:
实心圆圈:type=disc
空心圆圈:type=circle
小方块: type=square
有序列表的格式如下:
<ol>
<li>列表内容1</li>
<li>列表内容2</li>
…
</ol>
有序列表同样可以设置type属性
数字:type=1,也是默认方式
英文字母:type=a或type=A
罗马数字:type=i或type=I
图片标签
图片标签使用<img>,内部需要设置若干属性,可以不必写结束标签
属性:
- src=”3.gif” 图片来源,必写
- alt=”小岳岳” 图片不显示时,显示的内容
- title=”我的天呐” 鼠标移动到图片上时显示的文字
- width=”600” 图片显示的宽度
- height=”400” 图片显示的高度
例如:
<img src="3.gif" alt="小岳岳" title="我的天呐!" width="300" height="200" />
注意:当图片未定义宽高,图片百分百比例显示,如果只改变图片宽度或者高度,会等比例缩放
超链接标签
超链接标签使用<a>,同样需要设置属性表明要链接到哪里.
属性:
- href=”传智教育【官网】-好口碑IT职业教育,好口碑IT培训机构,一样的教育,不一样的品质”,前往地址,必填,注意要写http://
- title=”前往传智” 鼠标移动到链接上时显示的文字
- target=”_self”或者”_blank”,_self是默认值,在自身页面打开,_blank是新开页面前往连接地址
示例:
<a href=”传智教育【官网】-好口碑IT职业教育,好口碑IT培训机构,一样的教育,不一样的品质” title=”去往传智” target=”_self” >来传智</a>
当我们访问某个网站的时候,当请求的资源不存在,经常会给我们报告一个错误,显示为404错误,一般会给请求用户返回一个错误页,大家可以自行尝试一下编写一个我们自己的错误页.
http超文本传输协议
http协议和html前面的ht都是超文本的意思,所以http与html是配合非常紧密的一对,我们可以认为http就是为了传输html这样的文件,http位于应用层,侧重于解释.
http协议对消息区分可以分为请求消息和响应消息.
http请求消息
我们要开发的服务器与浏览器通信采用的就是http协议,在浏览器想访问一个资源的时候,在浏览器输入访问地址(例如http://127.0.0.1:8000),地址输入完成后当敲击回车键的时候,浏览器就将请求消息发送给服务器
我们可以先用测试工具创建一个socket服务器
之后通过浏览器请求地址,就会看到浏览器发送过来的请求消息
这个消息看起来很乱很复杂,对应的就是我们说的请求消息.
请求消息分为四部分内容:
- 请求行 说明请求类型,要访问的资源,以及使用的http版本
- 请求头 说明服务器使用的附加信息,都是键值对,比如表明浏览器类型
- 空行 不能省略-而且是\r\n,包括请求行和请求头都是以\r\n结尾
- 请求数据 表明请求的特定数据内容,可以省略-如登陆时,会将用户名和密码内容作为请求数据
请求类型
http协议有很多种请求类型,对我们来说常见的用的最多的是get和post请求。常见的请求类型如下:
- Get 请求指定的页面信息,并返回实体主体
- Post 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
- Head 类似于get请求,但是响应消息没有内容,只是获得报头
- Put 从客户端向浏览器传送的数据取代指定的文档内容
- Delete 请求服务器删除指定的页面
- Connect HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器
- Options 允许客户端查看浏览器的性能
- Trace 回显服务器收到的请求,主要用于测试和诊断
get 和 post 请求都是请求资源,而且都会提交数据,如果提交密码信息用get请求,就会明文显示,而post则不会显示出涉密信息.
http响应消息
响应消息是代表服务器收到请求消息后,给浏览器做的反馈,所以响应消息是服务器发送给浏览器的,响应消息也分为四部分:
- 状态行 包括http版本号,状态码,状态信息
- 消息报头 说明客户端要使用的一些附加信息,也是键值对
- 空行 \r\n 同样不能省略
- 响应正文 服务器返回给客户端的文本信息
示例:
http常见状态码
http状态码由三位数字组成,第一个数字代表响应的类别,有五种分类:
- 1xx 指示信息--表示请求已接收,继续处理
- 2xx 成功--表示请求已被成功接收、理解、接受
- 3xx 重定向--要完成请求必须进行更进一步的操作
- 4xx 客户端错误--请求有语法错误或请求无法实现
- 5xx 服务器端错误--服务器未能实现合法的请求
常见的状态码如下:
- 200 OK 客户端请求成功
- 301 Moved Permanently 重定向
- 400 Bad Request 客户端请求有语法错误,不能被服务器所理解
- 401 Unauthorized 请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
- 403 Forbidden 服务器收到请求,但是拒绝提供服务
- 404 Not Found 请求资源不存在,eg:输入了错误的URL
- 500 Internal Server Error 服务器发生不可预期的错误
- 503 Server Unavailable 服务器当前不能处理客户端的请求,一段时间后可能恢复正常
http常见文件类型分类
http与浏览器交互时,为使浏览器能够识别文件信息,所以需要传递文件类型,这也是响应消息必填项,常见的类型如下:
- 普通文件: text/plain; charset=utf-8
- *.html: text/html; charset=utf-8
- *.jpg: image/jpeg
- *.gif: image/gif
- *.png: image/png
- *.wav: audio/wav
- *.avi: video/x-msvideo
- *.mov: video/quicktime
- *.mp3: audio/mpeg
特别说明
charset=iso-8859-1 西欧的编码,说明网站采用的编码是英文;
charset=gb2312 说明网站采用的编码是简体中文;
charset=utf-8 代表世界通用的语言编码;可以用到中文、韩文、日文等世界上所有语言编码上
charset=euc-kr 说明网站采用的编码是韩文;
charset=big5 说明网站采用的编码是繁体中文;
web服务器开发
我们要开发web服务器已经明确要使用http协议传送html文件,那么我们如何搭建我们的服务器呢?注意http只是应用层协议,我们仍然需要选择一个传输层的协议来完成我们的传输数据工作,所以开发协议选择是TCP+HTTP,也就是说服务器搭建浏览依照TCP,对数据进行解析和响应工作遵循HTTP的原则.
这样我们的思路很清晰,编写一个TCP并发服务器,只不过收发消息的格式采用的是HTTP协议,如下图:
基于epoll的web服务器
由于我们知道epoll在大量并发少量活跃的情况下效率很高,所以本文以epoll为例,介绍epoll开发的主体流程:
对于我们来说,上述的框架基本没问题,除了处理客户端请求部分,我们可以考虑封装成一个函数,思考:函数参数如何设计?
处理客户端请求流程:
思考题:
- 由于每个响应消息都是分为四部分,可以考虑封装为函数,封装几个函数更方便?都分别对应什么功能?
- 目录请求相对复杂,需要遍历目录内的内容,也就是读内容,思考如何做?读到内容形成正文发送的时候,对应的文件类型应该是什么
网页服务器总结:
BS模式示意图
web服务器开发流程
汉字乱码问题
浏览器和web服务器通信模式
网页服务器接收数据可以直接使用epoll模型进行接收数据即可,正常的创建服务器即可,重点在于数据的解析和发送,解析的代码可如下:
//Readline为一行一行读取发送的数据 读取之后读到buf中
// 按行读取数据 读取第一行数据// 里面调用了read函数对信息继续读取n = Readline(cfd, buf, sizeof(buf));if (n < 0){return -1;}// 接收第一行请求头信息// //Get /hanzi.c HTTP/1.1// %[^ ] %[^ ] %[^/r/n] 截取之后的值分别为 //Get /hanzi.c HTTP/1.1// sccanf() 第一个参数 原字符串 "%[^ ]" 表示截取第一个出现 的字符串char reqType[16] = {0};char filename[256] = {0};char httppro[16] = {0};sscanf(buf, "%[^ ] %[^ ] %[^/r/n]", reqType, filename, httppro);printf("reqType = %s\n", reqType);printf("filename = %s\n", filename);printf("httppro = %s\n", httppro);
之后根据解析的信息进行处理后,发送浏览器可以解析的头信息和内容信息,头信息如下:
// 发送头部信息函数
/*
HTTP/1.1 200 OK
Content-Type:text/plain;charset=iso-8859-1(必选项) 告诉服务器发送的什么类型
Content-Length:32 //要么不传 传了就要传对
*/
int send_header(int cfd, char *code, char *msg, char *fileType, int len)
{char buf[1024] = {0};//\r\n换行 HTTP/1.1 200 OKsprintf(buf, "HTTP/1.1 %s %s\r\n", code, msg);// Content-Type:text/plain;charset=iso-8859-1sprintf(buf + strlen(buf), "Content-Type:%s\r\n", fileType);// Content-Length:32if (len > 0){sprintf(buf + strlen(buf), "Content-Length:%d\r\n", len);}// 追加换行strcat(buf, "\r\n");// 发送数据Write(cfd, buf, strlen(buf));return 0;
}
内容代码如下:
// 发送文件内存函数
int send_file(int cfd, char *fileName)
{// 打开文件int fd = open(fileName, O_RDONLY);if (fd < 0){printf("file open error\n");return -1;}// 循环读取文件char buf[1024];int n;while (1){memset(buf, 0x00, sizeof(buf));n = read(fd, buf, sizeof(buf));if (n <= 0){break;}else{Write(cfd, buf, n);}}
}
完整代码
如下,封装了pub.c wrap.c两个常用的方法;
pub.h pub. c
//pub.h#ifndef _PUB_H
#define _PUB_H
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <strings.h>
#include <ctype.h>
char *get_mime_type(char *name);
int get_line(int sock, char *buf, int size);
int hexit(char c); // 16进制转10进制
void strencode(char *to, size_t tosize, const char *from); // 编码
void strdecode(char *to, char *from); // 解码
#endif//pub.c#include "pub.h"
// 通过文件名字获得文件类型
char *get_mime_type(char *name)
{char *dot;dot = strrchr(name, '.'); // 自右向左查找‘.’字符;如不存在返回NULL/**charset=iso-8859-1 西欧的编码,说明网站采用的编码是英文;*charset=gb2312 说明网站采用的编码是简体中文;*charset=utf-8 代表世界通用的语言编码;* 可以用到中文、韩文、日文等世界上所有语言编码上*charset=euc-kr 说明网站采用的编码是韩文;*charset=big5 说明网站采用的编码是繁体中文;**以下是依据传递进来的文件名,使用后缀判断是何种文件类型*将对应的文件类型按照http定义的关键字发送回去*/if (dot == (char *)0)return "text/plain; charset=utf-8";if (strcmp(dot, ".html") == 0 || strcmp(dot, ".htm") == 0)return "text/html; charset=utf-8";if (strcmp(dot, ".jpg") == 0 || strcmp(dot, ".jpeg") == 0)return "image/jpeg";if (strcmp(dot, ".gif") == 0)return "image/gif";if (strcmp(dot, ".png") == 0)return "image/png";if (strcmp(dot, ".css") == 0)return "text/css";if (strcmp(dot, ".au") == 0)return "audio/basic";if (strcmp(dot, ".wav") == 0)return "audio/wav";if (strcmp(dot, ".avi") == 0)return "video/x-msvideo";if (strcmp(dot, ".mov") == 0 || strcmp(dot, ".qt") == 0)return "video/quicktime";if (strcmp(dot, ".mpeg") == 0 || strcmp(dot, ".mpe") == 0)return "video/mpeg";if (strcmp(dot, ".vrml") == 0 || strcmp(dot, ".wrl") == 0)return "model/vrml";if (strcmp(dot, ".midi") == 0 || strcmp(dot, ".mid") == 0)return "audio/midi";if (strcmp(dot, ".mp3") == 0)return "audio/mpeg";if (strcmp(dot, ".ogg") == 0)return "application/ogg";if (strcmp(dot, ".pac") == 0)return "application/x-ns-proxy-autoconfig";return "text/plain; charset=utf-8";
}
/**********************************************************************/
/* Get a line from a socket, whether the line ends in a newline,* carriage return, or a CRLF combination. Terminates the string read* with a null character. If no newline indicator is found before the* end of the buffer, the string is terminated with a null. If any of* the above three line terminators is read, the last character of the* string will be a linefeed and the string will be terminated with a* null character.* Parameters: the socket descriptor* the buffer to save the data in* the size of the buffer* Returns: the number of bytes stored (excluding null) */
/**********************************************************************/
// 获得一行数据,每行以\r\n作为结束标记
int get_line(int sock, char *buf, int size)
{int i = 0;char c = '\0';int n;while ((i < size - 1) && (c != '\n')){n = recv(sock, &c, 1, 0);/* DEBUG printf("%02X\n", c); */if (n > 0){if (c == '\r'){n = recv(sock, &c, 1, MSG_PEEK); // MSG_PEEK 从缓冲区读数据,但是数据不从缓冲区清除/* DEBUG printf("%02X\n", c); */if ((n > 0) && (c == '\n'))recv(sock, &c, 1, 0);elsec = '\n';}buf[i] = c;i++;}elsec = '\n';}buf[i] = '\0';return (i);
}// 下面的函数第二天使用
/** 这里的内容是处理%20之类的东西!是"解码"过程。* %20 URL编码中的‘ ’(space)* %21 '!' %22 '"' %23 '#' %24 '$'* %25 '%' %26 '&' %27 ''' %28 '('......* 相关知识html中的‘ ’(space)是 */
void strdecode(char *to, char *from)
{for (; *from != '\0'; ++to, ++from){if (from[0] == '%' && isxdigit(from[1]) && isxdigit(from[2])){ // 依次判断from中 %20 三个字符*to = hexit(from[1]) * 16 + hexit(from[2]); // 字符串E8变成了真正的16进制的E8from += 2; // 移过已经处理的两个字符(%21指针指向1),表达式3的++from还会再向后移一个字符}else*to = *from;}*to = '\0';
}// 16进制数转化为10进制, return 0不会出现
int hexit(char c)
{if (c >= '0' && c <= '9')return c - '0';if (c >= 'a' && c <= 'f')return c - 'a' + 10;if (c >= 'A' && c <= 'F')return c - 'A' + 10;return 0;
}//"编码",用作回写浏览器的时候,将除字母数字及/_.-~以外的字符转义后回写。
// strencode(encoded_name, sizeof(encoded_name), name);
void strencode(char *to, size_t tosize, const char *from)
{int tolen;for (tolen = 0; *from != '\0' && tolen + 4 < tosize; ++from){if (isalnum(*from) || strchr("/_.-~", *from) != (char *)0){*to = *from;++to;++tolen;}else{sprintf(to, "%%%02x", (int)*from & 0xff);to += 3;tolen += 3;}}*to = '\0';
}
wrap.h wrap.c
//wrap.h#ifndef __WRAP_H_
#define __WRAP_H_
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <strings.h>void perr_exit(const char *s);
int Accept(int fd, struct sockaddr *sa, socklen_t *salenptr);
int Bind(int fd, const struct sockaddr *sa, socklen_t salen);
int Connect(int fd, const struct sockaddr *sa, socklen_t salen);
int Listen(int fd, int backlog);
int Socket(int family, int type, int protocol);
ssize_t Read(int fd, void *ptr, size_t nbytes);
ssize_t Write(int fd, const void *ptr, size_t nbytes);
int Close(int fd);
ssize_t Readn(int fd, void *vptr, size_t n);
ssize_t Writen(int fd, const void *vptr, size_t n);
ssize_t my_read(int fd, char *ptr);
ssize_t Readline(int fd, void *vptr, size_t maxlen);
int tcp4bind(short port, const char *IP);
#endif//wrap.c
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <strings.h>
// 绑定错误显示和退出
void perr_exit(const char *s)
{perror(s);exit(-1);
}int Accept(int fd, struct sockaddr *sa, socklen_t *salenptr)
{int n;again:if ((n = accept(fd, sa, salenptr)) < 0){if ((errno == ECONNABORTED) || (errno == EINTR)) // ECONNABORTED 代表连接失败 ETINTR 代表被信号打断goto again;elseperr_exit("accept error");}return n;
}int Bind(int fd, const struct sockaddr *sa, socklen_t salen)
{int n;if ((n = bind(fd, sa, salen)) < 0)perr_exit("bind error");return n;
}int Connect(int fd, const struct sockaddr *sa, socklen_t salen)
{int n;if ((n = connect(fd, sa, salen)) < 0)perr_exit("connect error");return n;
}int Listen(int fd, int backlog)
{int n;if ((n = listen(fd, backlog)) < 0)perr_exit("listen error");return n;
}int Socket(int family, int type, int protocol)
{int n;if ((n = socket(family, type, protocol)) < 0)perr_exit("socket error");return n;
}ssize_t Read(int fd, void *ptr, size_t nbytes)
{ssize_t n;again:if ((n = read(fd, ptr, nbytes)) == -1){if (errno == EINTR) // 被信号打断应该继续读goto again;elsereturn -1;}return n;
}ssize_t Write(int fd, const void *ptr, size_t nbytes)
{ssize_t n;again:if ((n = write(fd, ptr, nbytes)) == -1){if (errno == EINTR)goto again;elsereturn -1;}return n;
}int Close(int fd)
{int n;if ((n = close(fd)) == -1)perr_exit("close error");return n;
}/*参三: 应该读取的字节数*/
ssize_t Readn(int fd, void *vptr, size_t n)
{size_t nleft; // usigned int 剩余未读取的字节数ssize_t nread; // int 实际读到的字节数char *ptr;ptr = vptr;nleft = n;while (nleft > 0){if ((nread = read(fd, ptr, nleft)) < 0){if (errno == EINTR)nread = 0;elsereturn -1;}else if (nread == 0)break;nleft -= nread; // 防止一次数据没有读完ptr += nread; // 指针需要向后移动}return n - nleft;
}ssize_t Writen(int fd, const void *vptr, size_t n)
{size_t nleft;ssize_t nwritten;const char *ptr;ptr = vptr;nleft = n;while (nleft > 0){if ((nwritten = write(fd, ptr, nleft)) <= 0){if (nwritten < 0 && errno == EINTR)nwritten = 0;elsereturn -1;}nleft -= nwritten;ptr += nwritten;}return n;
}static ssize_t my_read(int fd, char *ptr)
{static int read_cnt;static char *read_ptr;static char read_buf[100]; // 定义了100的缓冲区if (read_cnt <= 0){again:// 使用缓冲区可以避免多次从底层缓冲读取数据--为了提高效率if ((read_cnt = read(fd, read_buf, sizeof(read_buf))) < 0){if (errno == EINTR)goto again;return -1;}else if (read_cnt == 0)return 0;read_ptr = read_buf;}read_cnt--;*ptr = *read_ptr++; // 从缓冲区取数据return 1;
}
// 读取一行
ssize_t Readline(int fd, void *vptr, size_t maxlen)
{ssize_t n, rc;char c, *ptr;ptr = vptr;for (n = 1; n < maxlen; n++){if ((rc = my_read(fd, &c)) == 1){*ptr++ = c;if (c == '\n') // 代表任务完成break;}else if (rc == 0){ // 对端关闭*ptr = 0; // 0 = '\0'return n - 1;}elsereturn -1;}*ptr = 0;return n;
}int tcp4bind(short port, const char *IP)
{struct sockaddr_in serv_addr;int lfd = Socket(AF_INET, SOCK_STREAM, 0);bzero(&serv_addr, sizeof(serv_addr)); // 清空serv_addr地址 对比 memset()if (IP == NULL){// 如果这样使用 0.0.0.0,任意ip将可以连接serv_addr.sin_addr.s_addr = INADDR_ANY;}else{if (inet_pton(AF_INET, IP, &serv_addr.sin_addr.s_addr) <= 0){perror(IP); // 转换失败exit(1);}}serv_addr.sin_family = AF_INET;serv_addr.sin_port = htons(port);int opt = 1;setsockopt(lfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));Bind(lfd, (struct sockaddr *)&serv_addr, sizeof(serv_addr));return lfd;
}
服务器代码:
webserver.c
// web服务器使用epoll模型
#include <unistd.h>
#include <sys/epoll.h>
#include <fcntl.h>
#include <sys/stat.h>
#include <string.h>
#include <signal.h>
#include <dirent.h>#include "pub.h"
#include "wrap.h"// 处理http请求函数
int http_request(int cfd);// 发送头部信息函数
int send_header(int cfd, char *code, char *msg, char *fileType, int len);// 发送文件内存函数
int send_file(int cfd, char *fileName);
int main()
{// 改变文件运行目录 将目录修改为具有文件的目录下char path[255] = {0};sprintf(path, "%s/%s", getenv("HOME"), "test3/网络编程/webpath");chdir(path);// 创建socketint lfd = tcp4bind(9999, NULL);// 设置监听Listen(lfd, 128);// 创建epoll树int epfd = epoll_create(1024);if (epfd < 0){perror("epoll create error");close(lfd);return -1;}// 将监听文件描述符上树struct epoll_event ev;ev.data.fd = lfd;ev.events = EPOLLIN;epoll_ctl(epfd, EPOLL_CTL_ADD, lfd, &ev);int nready;struct epoll_event events[1024];int cfd;int socketfd;while (1){nready = epoll_wait(epfd, events, 1024, -1);printf("nready = %d\n", nready);if (nready < 0){if (errno == EINTR){continue;}break;}for (int i = 0; i < nready; i++){socketfd = events[i].data.fd;// 如果新的客户端到来,那么返回的fd等于监听描述符if (socketfd == lfd){// 开始接收数据cfd = Accept(lfd, NULL, NULL);// 设置cfd为非阻塞int flag = fcntl(cfd, F_GETFL);flag |= O_NONBLOCK;fcntl(cfd, F_SETFL, flag);// 将描述符上树ev.data.fd = cfd;ev.events = EPOLLIN;epoll_ctl(epfd, EPOLL_CTL_ADD, cfd, &ev);}else{// 有新的数据过来http_request(cfd);}}}
}// 发送头部信息函数
/*
HTTP/1.1 200 OK
Content-Type:text/plain;charset=iso-8859-1(必选项) 告诉服务器发送的什么类型
Content-Length:32 //要么不传 传了就要传对
*/
int send_header(int cfd, char *code, char *msg, char *fileType, int len)
{char buf[1024] = {0};//\r\n换行 HTTP/1.1 200 OKsprintf(buf, "HTTP/1.1 %s %s\r\n", code, msg);// Content-Type:text/plain;charset=iso-8859-1sprintf(buf + strlen(buf), "Content-Type:%s\r\n", fileType);// Content-Length:32if (len > 0){sprintf(buf + strlen(buf), "Content-Length:%d\r\n", len);}// 追加换行strcat(buf, "\r\n");// 发送数据Write(cfd, buf, strlen(buf));return 0;
}// 发送文件内存函数
int send_file(int cfd, char *fileName)
{// 打开文件int fd = open(fileName, O_RDONLY);if (fd < 0){printf("file open error\n");return -1;}// 循环读取文件char buf[1024];int n;while (1){memset(buf, 0x00, sizeof(buf));n = read(fd, buf, sizeof(buf));if (n <= 0){break;}else{Write(cfd, buf, n);}}
}// 处理http请求函数
int http_request(int cfd)
{int n;char buf[1024];memset(buf, 0x00, sizeof(buf));// 按行读取数据 读取第一行数据// 里面调用了read函数对信息继续读取n = Readline(cfd, buf, sizeof(buf));if (n < 0){return -1;}// 接收第一行请求头信息// //Get /hanzi.c HTTP/1.1// %[^ ] %[^ ] %[^/r/n] 截取之后的值分别为 //Get /hanzi.c HTTP/1.1// sccanf() 第一个参数 原字符串 "%[^ ]" 表示截取第一个出现 的字符串char reqType[16] = {0};char filename[256] = {0};char httppro[16] = {0};sscanf(buf, "%[^ ] %[^ ] %[^/r/n]", reqType, filename, httppro);printf("reqType = %s\n", reqType);printf("filename = %s\n", filename);printf("httppro = %s\n", httppro);// 因为上面获取的文件名具有 / 因此需要对/进行去除再访问char *pFile = filename + 1;// 将剩下的数据读完// 因为这里是阻塞函数 所以要将cfd设置为非阻塞状态 否则会阻塞在该处while (n = Readline(cfd, buf, sizeof(buf)) > 0){};// 判断文件是否存在struct stat st;// 文件不存在if (stat(pFile, &st) < 0){printf("file is not exit\n");// 发送头部信息 get_mime_type获取文件类型 error.html为错误文件信息send_header(cfd, "404", "Not Found", get_mime_type(".html"), 0);// 发送内容send_file(cfd, "error.html");}else // 文件存在 man 2 stat查看文件的属性 包括文件类型和大小等信息{// 普通文件if (S_ISREG(st.st_mode)){printf("file exist\n");// 发送头部信息send_header(cfd, "200", "OK", get_mime_type(pFile), st.st_size);// 发送文件内容send_file(cfd, pFile);}// 目录文件else if (S_ISDIR(st.st_mode)){}}
}
gcc -o web webserver.c wrap.c pub.c编译代码
./web执行即可