Linux 文件 IO 管理（第一讲）

回顾 C 语言文件操作，提炼理解
- 新创建的文件为什么被放在可执行文件的同级目录下？
- 上述 log.txt 何时被创建？又是谁在打开它？
- 那文件没有被打开的时候在哪里？
- 一个进程可以打开多个文件吗？
- 如何管理？
认识文件
理解文件
- 用户如何通过进程操作文件呢？
- 使用系统调用对文件操作
- - open
  - - 权限掩码
    - flags 参数（标记位传参）
  - close
  - write
- 几个问题
- - open 的返回值
  - 文件描述符
  - - 文件描述符分配规则
  - 理解读写
  - - 读
    - 写
    - 结论
  - open 的作用
理解 Linux 系统一切皆文件
文件描述符 fd 和 C 语言库函数里的 FILE*

回顾 C 语言文件操作，提炼理解

下面的 C 语言代码一定很熟悉才对：

#include <stdio.h>
int main()
{FILE* fp = fopen("log.txt", "w");if (fp == NULL){perror("fopen");return 1;}fclose(fp);return 0;
}

代码意思很简单，就是以 'w' 的方式打开一个名为 log.txt 的文件：

失败，则返回失败原因并退出（perror 可以看成，底层封装类似 strerror 的函数，根据错误码给你描述错误原因）
成功就有情况了：
- 如果存在 log.txt 文件，就会清空 log.txt 里的内容，从文件开头写入（可以直接理解 输出重定向 > 的工作机制）
- 如果不存在 log.txt 文件，就会在可执行文件的同级目录下创建 log.txt 文件

新创建的文件为什么被放在可执行文件的同级目录下？

这个问题也可以先揪住最核心的矛盾：系统怎么知道可执行文件的路径呢？

前面进程的内容就说了，代码跑起来变成进程后，进程会维护自己的工作目录，那么创建文件总不能胡乱位置创建，和自己的可执行文件放在一起当然是更好的选择

所以这个路径有个更普适的名字，叫做当前路径

上述 log.txt 何时被创建？又是谁在打开它？

是在你 gcc 编译的时候吗？并不是吧

而是你运行被编译后的可执行文件的时候

也就是说，我们要进行文件操作，前提是要把我们的程序跑起来变成进程：就像文件的打开和关闭，是 CPU 执行到这部分代码的原因啊

所以打开文件，本质上是进程打开文件

那文件没有被打开的时候在哪里？

再理解一下问题：
如果现在 已经存在 log.txt 文件，再次运行上述代码， log.txt 文件 在没有被打开的时候 在哪里？

磁盘硬盘对吧，总不能直接加载到空间紧张的内存里吧

一个进程可以打开多个文件吗？

可以，一定是可以的

那 OS 里有那么多进程，所以在大多数情况下，OS 内部一定存在大量的被打开的文件

打开这么多文件 OS 不会混乱吗？还真是不会，毕竟 OS 是管理者，会对文件进行管理

如何管理？

先描述，再组织：

一定是会存在和类似进程 PCB 一样的结构体来描述文件属性的！！！通过此结构体，OS 可以有效管理计算机内的文件属性（通过管理文件的数据）

而既然是进程打开文件，那么最后一定是演化为两个结构体之间的指针关系

认识文件

你真的认识文件吗？如果是，那文件是什么呢？

文件里会存放数据，毋庸置疑；那如果现在新创建一个文件，里面毛都没有，请问这个新文件占据磁盘空间吗？占据吧？虽然里面没有内容，但是这个文件的文件名，创建时间，大小，权限，类型，路径，最近修改时间等等都要知道吧？

不说别的，你把数据存放在文件里是为什么？是为了有朝一日能更好的找到它并且顺利的把数据拿出来吧！既如此，文件的相关属性就必不可少！！！

所以：文件 = 文件属性 + 文件内容，那么 描述文件的结构体 大差不差是 存放管理文件的相关属性 的！！！

理解文件

不要受程序语言影响，我们 在意的一直都是进程和文件的关系，语言编译运行后不就是进程吗？

所以操作文件的本质是：进程在操作文件

用户如何通过进程操作文件呢？

文件是在磁盘硬盘上的，磁盘硬盘是外设啊，是硬件资源，所以你向文件中写入本质上就是向外设中写入！

你是用户啊，你有资格直接写入吗？不好意思，没有

因为 OS 才是软硬件的管理者，要想写入文件，也就是外设，你绕不开 OS ，那怎么办？

OS 就必须为我们提供系统调用，而我们在任何一门语言里使用的文件接口函数，一定是对 系统调用 封装的结果

所以除了 库函数，我们还可以直接使用 系统调用 来操作文件

使用系统调用对文件操作

open

这是打开文件的系统调用

使用 man 2 open 命令查看该 系统调用 原型：

int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);

需要包以下头文件：

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

仔细阅读以下代码：

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>int main()
{// system callumask(0);int fd = open("log.txt", O_WRONLY | O_CREAT, 0666);if (fd < 0){perror("open");return 1;}return 0;
}

此时，如果当前路径没有此 log.txt 文件，那将会被创建：

上面的代码创建出来的 log.txt 文件权限是 -rw-rw-rw- ，即：所有角色都具有读写权限
- 现在大可以把 open 的第三个参数去掉，用第一个原型 open ；会发现编译运行后的 log.txt 文件权限是乱码哦
- 为什么？使用 系统调用 就是让 OS 帮你做事情，OS 如何得知你要创建的文件应该是什么权限呢？所以第三个参数就是要指明，被创建的文件的权限！
- 那 umask(0); 是什么意思？如果不带这一行代码，会发现编译运行后的 log.txt 文件权限是 -rw-rw-r-- ，就是 权限掩码 造成的
而 open 第二个参数作用，就是指明打开文件的操作，O_WRONLY 是只写，O_CREAT 是创建（如果没有此文件就创建）
- 那为什么会存在两个 open 呢？因为第一个两个参数的 open 是操作已存在的文件呐！所以压根不需要传什么看不懂的权限

权限掩码

umask(0); 这一步，是在程序编译为可执行文件运行之后，动态的 调整 当前进程 对应的创建文件时的掩码；可是系统中人家自己就有 权限掩码 （umask 命令就能查询），那上述代码里是要创建权限为 666 的文件，进程会使用哪个掩码呢？
一般采用就近原则，有自己设置的就用自己设置的，没有就用系统的

flags 参数（标记位传参）

这似乎是个 int 整型对吧，那为何是上述代码样式的传参呢？

O_WRONLY | O_CREAT

我们知道一个 int 整型是 32 位 bit ，所以一定可以使用比特位进行标志位的传递，这是 OS 设计很多系统调用的常见方法

通俗点讲，这个 flags 看起来是个整数，但咱是按比特位来使用；所以在本质上，flags 是一张位图

而类似 O_WRONLY 这样的参数全部都是大写的，按照编程习惯，很容易就能想到这是一个宏

我们直接设计一个传递 位图标记位 的函数来帮助理解，仔细观察下面代码：

#include <stdio.h>#define ONE     1         // 1 0000 0001
#define TWO    (1 << 1)   // 2 0000 0010
#define THREE  (1 << 2)   // 4 0000 0100
#define FOUR   (1 << 3)   // 8 0000 1000void Print(int flags)
{if (flags & ONE)printf("one\n");if (flags & TWO)printf("two\n");if (flags & THREE)printf("three\n");if (flags & FOUR)printf("four\n");
}int main()
{Print(ONE);printf("\n");Print(TWO);printf("\n");Print(ONE | TWO);printf("\n");Print(ONE | TWO | THREE);printf("\n");Print(ONE | FOUR);printf("\n");Print(ONE | TWO | THREE | FOUR);printf("\n");return 0;
}

很显然，这和上面 open 里的用法一模一样

使用标记位组合的方式一次向指定函数传递多种标记位，日后可以将 one two three 的打印变成函数调用，轻松实现相关功能

这就是 标记位传参

所以 O_WRONLY 和 O_CREAT 等等之类的选项就可以直接理解了，是只有一个比特位为 1 的宏，彼此之间宏值不重复，而此时我们只需要理解更多的像这样的选项表示的含义即可（见名知意）！！！

close

这是 关闭文件 的系统调用

还是 man 2 命令查看：

man 2 close

查看该 系统调用 原型：

int close(int fd);

需要包以下头文件：

#include <unistd.h>

参数就是 open 返回值呢 ^ ^

write

这是向文件写入的系统调用，将指定缓冲区写入指定文件，需指明缓冲区的大小

使用 man 2 write 命令查看该 系统调用 原型：

ssize_t write(int fd, const void *buf, size_t count);

需要包以下头文件：

#include <unistd.h>

此系统调用的原型，一看便知其意，应该无需解释，下面演示使用：

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <string.h>
#include <fcntl.h>
#include <unistd.h>int main()
{// system callumask(0);int fd = open("log.txt", O_WRONLY | O_CREAT, 0666);if (fd < 0){perror("open");return 1;}const char* message = "Hello Linux File!!!\n";write(fd, message, strlen(message));close(fd);return 0;
}

这里需要注意，我们使用的是 strlen 而不是 sizeof ，因为字符串后面要有 '\0' 是你 C 语言的规定，关我文件什么事？而 '\0' 也不是我们要的内容，所以不能是 sizeof

编译通过，删除原 log.txt 文件，运行可执行文件，会有新 log.txt 生成，可使用 cat log.txt 命令查看文件内容

这很简单，无需解释

现在我们将 message 内容改为 "aaaa" ，此时重新编译，不删除原 log.txt 文件，直接运行可执行文件，会是什么结果？

运行 cat log.txt 命令，如下结果：

aaaao Linux File!!!

诶？竟然是从头开始写入，但老内容没有被清空，而是覆盖写入！！！，所以 O_WRONLY | O_CREAT 虽然表示 文件不存在即创建，存在即打开写入，但默认不清空文件

那我就是要 清空文件 呢？带上 O_TRUNC 选项（意思为截断）即可：

int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);

那么现在的意思是：以写的方式打开文件，文件不存在就创建，存在就打开并清空原内容

好样的，就是本文开头使用 C 语言库函数 fopen 的 'w' 打开方式文件的含义

那如果现在我想要追加写入怎么办？就是 C 语言库函数 fopen 的 'a' 打开文件方式的含义

还是核心要义：现在只需找到和意义对应的选项即可！就是 O_APPEND 选项，如下使用即可：

int fd = open("log.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);

几个问题

open 的返回值

成功了就会创建一个新的文件描述符用来返回，失败了就返回 -1

那这个 int 类型的 fd 究竟是什么呢？

如果你打印 fd 的值就会发现，最小的值是从 3 开始的，那 0，1，2 去哪了？没有并不是不用，而是被其他文件占据了

其实是以下含义：

0：标准输入 --> 常规对应键盘
1：标准输出 --> 常规对应显示器
2：标准错误 --> 常规对应显示器

当然啦，在 C 语言中也会 默认给我们打开 相应的这三个文件流：

stdin ：标准输入流
stdout ：标准输出流
stderr ：标准错误流

下图把这几个文件流是当作文件来看的！！！
因为从类型可以看出，和 C 语言库函数 fopen 函数的返回值是一样的！！！

在这里插入图片描述

所以，printf 可以做的操作，fprintf 也可以做，就是需要指明是什么流罢了

既然上面 fd 值为 1，2，3 的文件是默认打开的，那也就是说我可以直接向 标准输出文件 写入内容，看看会不会在 显示器 上打印就是了，编译运行如下代码即可：

int main()
{    const char* message = "Hello System Call!!!\n";write(1, message, strlen(message));return 0;
}

验证过的都知道，一定是可以的！！！

文件描述符

上面的例子也看到了，调用 write 系统调用 向特定文件里写入居然是使用 fd 这样的整型数字，这到底是什么意思？

现在我们站在 OS 的角度宏观调查 文件管理 的方式：

前面提到能操作文件的是进程；但一个进程可以打开很多文件，一台机器里运行那么多进程，在磁盘中可能有上万文件，光是被打开就可能有上百文件，OS 要知道哪些文件被打开了，哪些文件正在被读，哪些文件正在被写，哪些文件正准备要被关闭等等；所以 OS 得具备准确管理大量文件的能力

OS 怎么对 被打开的文件 做管理呢？先描述，再组织，所以 OS 一定会对每一个被打开的文件创建 内核数据结构，名为 struct file ，里面一定包含可以完整描述文件的属性：权限，以什么方式被打开，标记位……

那么在 OS 内核里，有多少文件就有多少 struct file ，所以在 OS 内核里一定会有大量 struct file ，怎么被组织起来呢？高效的数据结构（Linux 是双链表），那么 OS 内部就会使用 双链表组织 这些 struct file ，那么 OS 对文件的管理就转变为了对链表的增删查改！！!

而 struct file 内部一定会有一个指针，指向 文件内核级的缓存，其实就是 OS 给我们申请的一块内存；而 文件 = 属性 + 内容 ，那么将来 OS 会使用磁盘文件的属性初始化 struct file 的内容，而内容会直接 load 进这片 文件内核级的缓存

未来想读，直接从这片缓存里读；想修改写入，会先在这片缓存里修改写入，再由 OS 刷新进入磁盘里

注意：每一个被打开的文件都有自己的 struct file ，而每一个 struct file 都有自己的 文件内核级的缓存

但现在有这么多 struct file ，怎么知道它们都是被哪个进程打开的呢？所以一定要有方法可以表征进程和它打开的文件的关系，因为 OS 把文件是管理在一起的！那么在进程 PCB 里存在属性结构体 struct files_struct* files ，而在其内部，会包含一个数组！！！数组的原型为 struct file* fd_array[N] ，只要是数组，就必定有自己的下标，而这个数组是指针为 struct file* 的 指针数组，想要进程和文件产生关系，只需要将文件 struct file 的地址依次填入特定的下标中，现在每一个 struct file 结构体也都对应一个下标

所以现在一个 进程要想操控文件，只需要把此文件的 struct file 对应在 struct file* fd_array[N] 数组中的下标返回给上层，上层拿着这个 int 下标，也就是 fd 就可以访问文件了

所以 fd 的本质就是：内核进程和文件映射关系的数组下标，而 fd 的名字就叫做：文件描述符

在这里插入图片描述

文件描述符分配规则

在 files_struct 数组当中，找到当前没有被使用的最小的一个下标，作为新的文件描述符

理解读写

读

如果现在一个进程要想读文件 log.txt ，肯定会先打开文件 log.txt ，接着利用磁盘内有关属性初始化对应的 struct file ，然后将其内容拷贝进 文件内核级的缓存

然后会把 文件内核级的缓存 里的数据拷贝进上层应用层

如果进程要读的数据不在这个该缓冲区里，OS 就会将你的进程阻塞住（或者挂起），然后从磁盘里把想要的数据拷贝进缓冲区，完事之后再唤醒该进程，再做拷贝（拷贝数据时进程是被链接到磁盘的等待队列里的，详情见往期本人拙作）

写

如果文件缓冲区没有内容倒也好说，直接将数据拷贝进缓冲区里，然后再由 OS 刷新到磁盘里

那缓冲区要是有数据呢？是修改数据呢？一样的，是先把数据读进缓冲区里修改，然后再由 OS 定期刷新即可

所以对文件的修改是内存级的修改，是读进来之后把文件改完再刷出去的，哪怕只是修改一个字节，一个比特

结论

无论读写，都必须在合适的时候，让 OS 把文件的内容读到文件缓冲区中

所以无论对于 write 还是 read ，本质上都是拷贝作用！

open 的作用

创建 文件结构体 file
开辟 文件缓冲区 的空间，加载文件数据（可能会延后）
查进程的 文件描述符表
将 文件结构体 file 地址填入对应表的下标中
返回下标

理解 Linux 系统一切皆文件

现在可以理解 OS 内核数据结构里的文件，可以是一台机器不止 OS ，还有硬件呢

都知道可以从键盘读数据，往显示器打印刷新数据，那请问如何做到呢？这可是硬件，而读写数据肯定都是从文件角度出发的，不然要重新搞一套机制实现硬件的读写吗，那怎么可能，所以文件和这些硬件有什么关系呢？

所有像磁盘键盘鼠标什么的外设，在冯诺依曼体系结构里被称为 IO 设备，而每一种设备我们关心的就俩：属性和操作方法！！！

同样的，OS 要对每一种设备做管理，同样的六字真言：先描述，再组织，所以每一种设备都存在可以完美描述它的结构体 struct device ，里面拥有必不可少的属性：名字，类型，状态，厂商等等

虽然属性不一样，但他们的类别是一样的！都是用结构体 struct device 描述的，可是刚刚这些属性并不重要，重要的是方法

每一个设备需不需要方法？需要，不然你怎么操作它？以读和写操作为例：键盘需要读写方法吗？键盘似乎是用来读的，好像没有往键盘写的需求，但依然需要写的函数，只是会将它置为空！！！

这个理解太重要了，没有往键盘写的需求为什么要设计一个这样的空函数呢？不急我们继续往下说：

除了读写，键盘肯定还会有其他这样的操作函数；而其他设备也一样，会有和键盘一样的读写函数以及其他操作函数；但经验告诉我，每一个设备的操作方法函数实现一定是不一样的，不然为啥是不同的设备呢？而这一层操作往往是设计硬件的工程师完成的，叫做驱动

驱动控制我们的设备去操作，例如读写之类的，这也可以理解，下面重点来了：

OS 依然会对每一个被打开的硬件设备做管理，而对每一个设备，OS 都会构建 struct file ，虽然里面会包含相关文件的属性，但也一定会包含可以调用底层驱动的 函数指针，因为不同硬件相同功能的驱动接口设计一定是大差不差的，在 struct file 里存放对应驱动的 函数指针 ；如此一来，每一个硬件对应的 struct file 都会有全部操作的 函数指针，因为 OS 毕竟不知道每一个硬件的特性，所以类似没有往键盘写的需求情况下，依然要给出写的驱动，就是这个原因

所以 struct file 在底层还要有自己的方法指针表，里面都是 函数指针

如果现在要从键盘读数据，OS 就可以找到键盘的 struct file ，调用其内部的关于 read 的 函数指针，紧接着通过 函数指针 找到键盘关于 read 的驱动，就可 完美实现键盘和文件的关联

其他硬件也是如此，现在站在 OS 的角度，不需要关心底层硬件的差异，因为我们读写硬件外设的方法都是调用对应的 函数指针 ：想读谁，直接调用谁的 struct file 里关于读的 函数指针，至于如何实现读，那是驱动的事，和我 OS 没有半毛钱关系！！！

以上技术叫什么呀？如果是使用 C++ 的类来封装这个 struct file ，那这一定会使用多态技术！！！

所以在上层看到的视角就是一切皆文件

而 OS 操作系统这一层又叫做 vfs （virtual file system）：虚拟文件系统

在这里插入图片描述

那么现在就有很多事情都能说的通了，比如键盘输入为什么有缓冲区？这是因为你的键盘对于 OS 而言是个文件，是文件自然有文件缓冲区啊；所以 OS 从键盘文件的缓冲区读数据，键盘也会将数据送进自己对应的文件缓冲区，而键盘也就是对应 标准输入流（stdin），文件描述符 为 0 的 struct file ，就这么简单

文件描述符 fd 和 C 语言库函数里的 FILE*

通过上面的理解，OS 只认 文件描述符 fd 来操作文件，那 C 语言库函数 里的 FILE* 是如何操控文件的呢？

那第一个问题就是 FILE 是什么？这是 C 语言提供的 结构体类型

但是由于 OS 只认 文件描述符 fd 来操作文件，所以直接大胆猜想，文件结构体 FILE 底层一定封装了 文件描述符 fd ，而在 FILE 里，是一个名为 _fileno 的成员，代码证明：

int main()
{FILE* fp = fopen("log.txt", "w");if (NULL == fp){perror("fopen");return 1;}// 文件描述符 fd 打印printf("fp: %d\n", fp->_fileno);fwrite("Hello", 5, 1, fp);fclose(fp);return 0;
}

咱们之前不是说 stdin ， stdout ， stderror 不是对应文件描述符 0，1，2 吗？验证：

printf("stdin -> fd: %d\n", stdin->_fileno);
printf("stdout -> fd: %d\n", stdout->_fileno);
printf("stderr -> fd: %d\n", stderr->_fileno);

结论：所有 C 语言上的文件操作函数，底层本质都是对 系统调用 的封装