-
目录
一.什么是文件?
二.为什么要使用文件?
三.文件的分类
3.1.程序文件
3.2.数据文件
四.二进制文件和文本文件
五.文件的打开和关闭 (重点)
5.1流和标准流
5.1.1何为流?
5.1.2.标准流
5.2文件指针
5.3文件的打开和关闭
六.文件的顺序读写
6.1顺序读写函数介绍
6.2对比一组函数
七.文件的随机读写
7.1fseek
7.2ftell
7.3rewind
八.文件读取结束的判定
8.1易被误用的feof
8.2ferror
8.3 文本文件和二进制文件读取结束标志
九.文件缓冲区
一.什么是文件?
文件是指存储在硬盘(磁盘)上的数据集,例如我们C盘,D盘等硬盘中存储的就是一个个文件。
文件名:每一个文件都对应着一个唯一的文件标识。以便于用户的识别和引用。
一个文件名往往包含三个部分:文件路径+文件名主干+文件后缀
eg:c:\code\text.txt
为了方便起见,文件标识被称为文件名。
二.为什么要使用文件?
在程序设计中,我们写入的数据是存储在电脑的内存当中的,当程序结束或退出时,内存就会回收,而其中的数据就会丢失,而如果将数据存储在磁盘当中,数据便可以保存下来。可见,如果想要对数据进行持久化的保存,我们就可以使用文件。
三.文件的分类
3.1.程序文件
程序文件包括三部分:源程序文件(后缀为.c),⽬标文件(windows环境后缀为.obj),可执行程序(windows 环境后缀为.exe)。
3.2.数据文件
文件的内容不一定是程序,也可以是程序运行时读写的一些数据,比如程序运行中需要从中读取数据的文件,或者需要输出数据的文件。
本篇将着重探讨【数据文件】
在之前的学习过程中,数据的输入输出都是以终端为对象的,比如从终端的键盘上输入数据,运行结果在显示器上输出。
实际上我们有时候需要将信息输出到磁盘上,当需要的时候我们再读取硬盘的数据到内存中使用,这里我们处理的对象就是磁盘上的数据文件。
四.二进制文件和文本文件
根据数据的组织形式,数据文件又被分为文本文件或二进制文件。
如果数据在内存中以二进制的形式存储,且不加转换地输出到外存的文件中,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在文件中是怎么存储的呢?
字符:一律按ASCII形式存储;
数值型数据:可以使用ASCII形式存储,也可以使用二进制形式存储;
eg:10000在文件中的存储(两种方式)
可以看出,数值型数据10000即可以看作5个字符的组合,也可以转换为二进制再存储。
对ASCII值记不清的小伙伴我也找到了1和0对应的二进制帮助大家理解。
接下来为大家演示一个以二进制形式存储的文件案例:
#include<stdio.h>
int main()
{int a = 10000;FILE* pf = fopen("text.txt", "wb");fwrite(&a, 4, 1, pf);//以二进制的形式写到文件中fclose(pf);pf = NULL;return 0;
}
代码目前看不懂没关系,这个就是一个将10000转换为二进制外存到文件中的代码示例,那我们如何找到我们写入数据的文件呢?当我们打开存放代码的文件路径打开text.txt文件时,我们会发现我们打开的文件是一个乱码,如下图:
那我们如何找到我们存入数据的文件呢?这需要我们在vs中打开这个文件:
解决方案资源管理器->源文件->添加->现有项
此时我们再次找到我们这个项目工程的文件里面:
然后我们的源文件路径下就会出现text.txt的文件了,接着我们需要选择打开方式:选择二进制文本编辑器。如图:
然后我们就能如愿以偿地找到我们以二进制写入数据的文件了:
但是为什么是10 27 00 00这个数字呢?实际上,这是为了简化数据长度,使用十六进制方便我们观察的,在前面我们已经知道10000按二进制存储的对应数字,又因为VS使用的是小端存储,再将它转换为十六进制就得到了这样一串数字。(四个二进制位表示一个十六进制位)。
对大小端存储还不清楚的同学可以移步之前内容:C语言数据在内存中的存储
五.文件的打开和关闭 (重点)
5.1流和标准流
5.1.1何为流?
在介绍文件操作之前,需要先介绍一个非常重要的概念——流。我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备输入输出的操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念。这样程序员在读写的数据时仅仅只需使用各自对应的流,具体流是如何实现的那就是C语言自身底层的事情了。
可以将流理解为一种数据输入输出的通道,宛如一条流淌着数据的河流,从一头流向另一头。
C程序针对文件,画面,键盘等的数据输入输出操作都是通过流操作的。
一般情况下,我们想要向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
5.1.2.标准流
我们知道,当我们输入,输出数据的时候,必须要先打开流,这样有同学就会想,在之前的使用中我们已经从键盘输入数据,向终端(屏幕)中输出数据,为什么没有打开流呢?
那是因为C程序在启动的时候,默认打开了3个流:
正因为默认打开了这3个流,我们使用scanf,printf等函数就可以直接进行输入输出操作的。
例如,当我们搜索scanf函数原型时,就会发现它是的数据是从stdin中读取的。
stdin、stdout、stderr三个流的类型是: FILE * ,通常称为文件指针。
C语言中,就是通过 FILE* 的文件指针来维护流的各种操作的。
5.2文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件名,文件状态以及当前文件位置等)。这些信息保存在一个结构体变量中的。改结构体类型是由系统声明的,取名FILE。
例如,在VS2022编译环境提供的stdio.h的头文件中就有以下的文件类型申明:
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
一般都是通过一个FILE类型的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够间接找到与它关联的文件。如图:
5.3文件的打开和关闭
相信大家都听过这样一个逻辑小故事:把大象装进冰箱需要几步?1.打开冰箱;2.把大象装入冰箱;3.关闭冰箱。文件的操作亦类似于此,文件在读写之前应该先打开文件,使用结束之后应该关闭文件。
在编写程序的时候,打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC标准规定:使用fopen函数来打开文件,fclose来关闭文件。
函数原型如下:
//打开文件
FILE* fopen(const char* filename, const char* mode);
//关闭文件
int fclose(FILE* stream);
mode表示文件的打开模式,以下为文件的各种打开方式,根据实际情况进行选择:
这里需要解释一下“读”和“写”指的是什么,实际上它们分别代表从文件中输出和输入数据:
示例:
#include<stdio.h>
int main()
{FILE* pfile;//打开文件pfile = fopen("myfile.txt", "w");//文件操作if (pfile == NULL){perror("fopen");return 1;}else{fputs("fopen example", pfile);//关闭文件fclose(pfile);}pfile = NULL;return 0;
}
因为我们指定的文件不存在,所以会新创建一个以myfile为文件名的文本文件:
并且成功向此文件写入了数据:
六.文件的顺序读写
6.1顺序读写函数介绍
上面说的适用于所有输入流一般指使用于标准输入流(stdin)和其他输入流(如文件输入流),所有输出流同理。
这里我们将一一介绍这些顺序读写函数是如何使用的:(在学习新函数的时候一定要学会主动查函数原型,观察其参数) 网址:cplusplus.com - The C++ Resources Network
1.fputc:
#include<stdio.h>
int main()
{//打开文件FILE* pf = fopen("text.txt", "w");if (pf == NULL){perror("fopen");return 1;}//写文件char ch = 0;for (ch = 'a';ch <= 'z';ch++){fputc(ch, pf);
//这里fputc第一个参数不是一个字符吗?但是函数原型第一个参数是整型。
//实际上,字符传递给函数的时候传递的是它的ASCII值}//关闭文件fclose(pf);pf = NULL;return 0;
}
text.txt:abcdefghijklmnopqrstuvwxyz
这个代码成功地将26个字母写入了文件text.txt中,注意的是,当写入一个字符后,文件中的光标也会跟着向后移动一位,这样才会使数据按顺序一一排列。 接下来我们使用fgetc将它们读取出来:
2.fgetc:
#include<stdio.h>
int main()
{//打开文件FILE* pf = fopen("text.txt", "r");if (pf == NULL){perror("fopen");return 1;}//读文件int ch = 0;while ((ch = fgetc(pf)) != EOF){printf("%c", ch);}//关闭文件fclose(pf);pf = NULL;return 0;
}
结果:abcdefghijklmnopqrstuvwxyz
3.fputs:向文件中写入一个字符串。
#include<stdio.h>
int main()
{//1. 打开文件FILE*pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}//写文件fputs("hello world\n", pf);fputs("hello bit", pf);//2. 关闭文件fclose(pf);pf = NULL;return 0;
}
4.fgets:从文件中获取一个字符串.
#include<stdio.h>
int main()
{//1. 打开文件FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen");return 1;}//读文件char arr[20] = {0};while (fgets(arr, 20, pf) != NULL){printf("%s", arr);}//2. 关闭文件fclose(pf);pf = NULL;return 0;
}
5.fwrite:以二进制的方式向文件中写入数据。
int main()
{int arr[] = { 1,2,3,4,5 };FILE*pf = fopen("test.txt", "wb");if (pf == NULL){perror("fopen");return 1;}//写数据int sz = sizeof(arr) / sizeof(arr[0]);fwrite(arr, sizeof(arr[0]), sz, pf);//以二进制的形式写进去的fclose(pf);pf = NULL;return 0;
}
结果是二进制打印出来的,我们是看不懂的。此时需要我们再用fread以二进制形式打印出来。
6.fread: 以二进制的形式读出数据。
int main()
{int arr[5] = {0};FILE* pf = fopen("test.txt", "rb");if (pf == NULL){perror("fopen");return 1;}//读数据fread(arr, sizeof(arr[0]), 5, pf);//以二进制的形式打印出int i = 0;for (i = 0; i < 5; i++){printf("%d ", arr[i]);//1 2 3 4 5}
//法二:处理未知数据个数/*int i = 0;while (fread(arr + i, sizeof(arr[0]), 1, pf)){printf("%d ", arr[i]);i++;}*/fclose(pf);pf = NULL;return 0;
}
6.2对比一组函数
scanf fscanf sscanf
printf fprintf sprintf
1.fprintf和fscanf:
struct S
{char name[20];int age;float score;
};
//fprintf:按照指定格式输出
int main()
{struct S s = { "张三", 20, 65.5f };//想把s中的数据存放在文件中FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}//写文件 - 是以文本的形式写进去的fprintf(pf, "%s %d %f", s.name, s.age, s.score);fclose(pf);pf = NULL;return 0;
}//fscanf:按照指定格式输入
int main()
{struct S s = { 0 };//想从文件test.txt中读取数据放在s中FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen");return 1;}//读文件 fscanf(pf, "%s %d %f", s.name, &(s.age), &(s.score));//注意数组名就代表首地址,可以不用加取地址符&//打印在屏幕上看看printf("%s %d %f\n", s.name, s.age, s.score);//fprintf(stdout, "%s %d %f\n", s.name, s.age, s.score);fclose(pf);pf = NULL;return 0;
}
这里为了方便对应将两个主函数放在一起,望读者理解。
2.sprintf和sscanf :
#include<stdio.h>
struct S
{char name[20];int age;float score;
};int main()
{char buf[200] = { 0 };struct S s = { "张三", 20, 65.5f };sprintf(buf, "%s %d %f", s.name, s.age, s.score);printf("1:以字符串的形式: %s\n", buf);//1struct S t = {0};sscanf(buf, "%s %d %f", t.name, &(t.age), &(t.score));printf("2:按照格式打印 : %s %d %f\n", t.name, t.age, t.score);//2return 0;
}
七.文件的随机读写
上面我们介绍了文件的一种读取方式即顺序读写,即数据只能按指定方向或顺序被输入和输出,十分不灵活,那么我们如何做到从任意位置处处理数据呢?这就要介绍一下文件的随机读写。
7.1fseek
功能:根据文件指针的位置和偏移量来定位文件指针(文件内容的光标)。
在我们打开一个文件时,鼠标光标默认设置在第一位的:
如若我们想随机访问数据,就需要改变光标位置。例如上图我们想要从字母e处开始访问,就需要让光标跳过4个偏移量,fssek就是通过设定不同的偏移量来做到灵活处理数据的。
函数原型如下:
int fseek(FILE* stream, long int offset, int origin);
// 流 偏移量 起始位置
而对于起始位置origin 有如下选择:可根据实际情况进行选择。
在使用fseek函数的时候,偏移量是根据起始位置不同而不同的。
示例如下:
eg1:
#include<stdio.h>
int main()
{FILE* pf = fopen("example.txt", "wb");fputs("This is an apple.", pf);fseek(pf, 9, SEEK_SET);fputs(" sam", pf);//注意空格也属于字符fclose(pf);pf = NULL;return 0;
}
结果:This is a sample.
eg2:注意:偏移量是可以为负的。
text.txt:
#include<stdio.h>
int main()
{FILE* pf = fopen("text.txt", "r");if (pf == NULL){perror("fopen");return 1;}//读文件char ch = 0;fseek(pf, -4, SEEK_END);ch = fgetc(pf);printf("%c\n", ch);//wfclose(pf);pf = NULL;return 0;
}
7.2ftell
- 功能:返回文件指针相对于起始位置的偏移量。
- 函数原型如下:
long int ftell(FILE* stream);
- 示例:
myfile.txt:
#include<stdio.h>
int main()
{FILE* pFile=fopen("myfile.txt","rb");long size = 0;if (pFile == NULL){perror("Error opening file");}else{fseek(pFile, 0, SEEK_END);size = ftell(pFile);fclose(pFile);printf("Size of myfile.txt: %ld bytes.\n", size);}return 0;
}
结果:13
7.3rewind
- 功能:让文件指针的位置回到文件的起始位置。
- 函数原型如下:
void rewind(FILE* stream);
- 示例:
#include<stdio.h>
int main()
{int n;FILE* pFile;char buffer[27];pFile = fopen("myfile.txt", "w+");for (n = 'A'; n <= 'Z'; n++)fputc(n, pFile);rewind(pFile);//将鼠标光标重置到起始位置fread(buffer, 1, 26, pFile);fclose(pFile);buffer[26] = '\0';printf(buffer);return 0;
}
八.文件读取结束的判定
8.1易被误用的feof
许多人会误将feof(end of file)的返回值作为文件读取结束的判断。
实际上,feof的作用是:当文件读取结束的时候,判断读取结束的原因是否是——遇见文件末尾结束。
8.2ferror
文件读取结束不仅仅只有遇到文件末尾,也可能是读取错误导致文件读取异常,此时就需要使用ferror函数判断。
ferror的作用是:当文件读取结束的时候,判断读取结束的原因是否是——文件读取是否异常
示例1:
#include<stdio.h>
int main()
{FILE* pf = fopen("text.txt", "r");if (pf == NULL){perror("fopen");return 1;}//读char ch = 0;while ((ch = fgetc(pf)) != EOF){printf("%c\n", ch);}//判断是什么原因导致文件读取结束的if (feof(pf)){printf("遇到文件末尾,读取正常结束.\n");}else if (ferror(pf)){perror("fgetc");}return 0;
}
示例2:
#include<stdio.h>
int main()
{FILE* pf = fopen("text.txt", "r");if (pf == NULL){perror("fopen");return 1;}//写char ch = 0;for (ch = 'a';ch <= 'z';ch++){fputc(ch, pf);}if (feof (pf)){printf("遇到文件末尾,读取正常结束./n");}else if (ferror(pf)){perror("fputc");}return 0;
}
8.3 文本文件和二进制文件读取结束标志
- 文本文件读取是否结束,判断返回值是否为EOF(fgetc),或者NULL(fgets);
- 二进制文件读取结束判断,判断返回值是否小于实际要读的个数。
示例1:
#include <stdio.h>
#include <stdlib.h>int main(void)
{int c; // 注意:int,⾮char,要求处理EOF FILE* fp = fopen("test.txt", "r");if(!fp) {perror("File opening failed");return EXIT_FAILURE;}//fgetc 当读取失败的时候或者遇到⽂件结束的时候,都会返回EOF while ((c = fgetc(fp)) != EOF) // 标准C I/O读取⽂件循环 { putchar(c);}//判断是什么原因结束的 if (ferror(fp))puts("I/O error when reading");else if (feof(fp))puts("End of file reached successfully");fclose(fp);
}
示例2:
#include <stdio.h>enum { SIZE = 5 };
int main(void)
{double a[SIZE] = {1.,2.,3.,4.,5.};FILE *fp = fopen("test.bin", "wb"); // 必须⽤⼆进制模式 fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组 fclose(fp);double b[SIZE];fp = fopen("test.bin","rb");size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组 if(ret_code == SIZE) {puts("Array read successfully, contents: ");for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);putchar('\n');} else { // error handlingif (feof(fp))printf("Error reading test.bin: unexpected end of file\n");else if (ferror(fp)) {perror("Error reading test.bin");}}fclose(fp);
}
以上示例仅做了解。
九.文件缓冲区
ANSIC标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每⼀个正在使用的文件开辟⼀块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
为什么会存在缓冲区的这个概念呢?其实很好了解,如果没有缓冲区,每次向文件中输入或从中输出数据的时候,内存都需要时刻为它分配接口处理数据,这会使内存负担加重,因而创造出文件缓冲区,当向文件中传输的数据达到一定的数目的时候,再一并打包处理。
示例:
#include <stdio.h>
#include <windows.h>
//VS2022 WIN11环境测试
int main()
{FILE*pf = fopen("test.txt", "w");fputs("abcdef", pf);//先将代码放在输出缓冲区 printf("睡眠10秒-已经写数据了,打开test.txt⽂件,发现⽂件没有内容\n");Sleep(10000);printf("刷新缓冲区\n");fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘) //注:fflush 在⾼版本的VS上不能使⽤了 printf("再睡眠10秒-此时,再次打开test.txt⽂件,⽂件有内容了\n");Sleep(10000);fclose(pf);//注:fclose在关闭⽂件的时候,也会刷新缓冲区 pf = NULL;return 0;
}
结论: 正是因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
以上,便是对C语言文件操作的介绍,望屏幕前的你能有所收获。
创作不易,希望大家多多支持!