C进阶_字符串库函数

news/2025/1/1 14:25:36/

目录

求字符串长度

strlen

常规实现

递归实现

指针-指针实现

长度不受限制的字符串函数

strcpy

模拟实现strcpy

strcat

模拟实现strcat

strcmp

模拟实现strcmp 

长度受限制的字符串函数

strncpy

strncat

strncmp


求字符串长度

strlen

size_t strlen ( const char * str );

字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包
含 '\0' )。

参数指向的字符串必须要以 '\0' 结束。

注意函数的返回值为size_t,是无符号的( 易错 )。

学会strlen函数的模拟实现:

常规实现

int my_strlen(const char* str)
{assert(str!=NULL);int count = 0;while (*str != 0){count++;str++;}return count;
}

递归实现

int my_strlen(const char* str)
{assert(str != NULL);if (*str != '\0')return 1 + my_strlen(str + 1);elsereturn 0;
}

指针-指针实现

int my_strlen(const char* str)
{const char* start = str;assert(str != NULL);while (*str){str++;}return str - start;
}

在strlen的文档中,返回类型是size_t

size_t strlen( const char *string );

为什么是size_t?这是因为strlen是求字符长度的,求出的长度是不可能为负数的,而size_t其实就是unsigned int即无符号整型。

但是注意size_t有它的坏处,见下:

int main()
{if (strlen("abc") - strlen("abcdef") > 0)printf(">");elseprintf("<");return 0;
}

执行这段代码,结果竟然是>。这是因为3-6虽然是-3,但由于是无符号整型,它就被当成正数了。

长度不受限制的字符串函数

strcpy

char* strcpy(char * destination, const char * source );

Copies the C string pointed by source into the array pointed by destination, including the
terminating null character (and stopping at that point).

源字符串必须以\0结束。

会将源字符串中的\0拷贝到目标空间。

目标空间必须足够大,以确保能存放源字符串。

目标空间必须可变。

为什么源字符串必须以\0结束?如果不以\0结束,编译器就会在内存中持续往后读取字符,直到遇到\0,比如:

int main()
{char arr1[100] = {0};char arr2[] = { 'h','e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd' };strcpy(arr1, arr2);printf("%s", arr1);return 0;
}

并没有成功返回0。

那什么是会将源字符串中的\0拷贝到目标空间?

int main()
{char arr1[100] = {0};char arr2[] = { 'h','e', 'l', 'l', '\0', ' ', 'w', 'o', 'r', 'l', 'd' };char arr3[] = "hello\0world";strcpy(arr1, arr2);printf("%s\n", arr1);strcpy(arr1, arr3);printf("%s\n", arr1);return 0;
}

目标空间不够大会怎样?

int main()
{char arr1[5] = { 0 };char arr2[] = "hello world";strcpy(arr1, arr2);printf("%s\n", arr1);return 0;
}

 

虽然成功打印了,但会报错。

什么是目标空间必须可变?

int main()
{char* p = "abcdefghijklm";char arr[] = "hello world";strcpy(p, arr);printf("%s\n", p);return 0;
}

可以看到程序崩溃了。这是因为abcdefghijklm是常量字符串,而不是变量。所以要用数组来存放字符串。

模拟实现strcpy

char* my_strcpy(char* dest,const char* src)
{char* ret = dest;assert(dest&&src);while (*dest++ = *src++){;}return ret;
}
int main()
{char arr1[30] = "";char arr2[] = "hello world";my_strcpy(arr1, arr2);printf("%s\n", arr1);return 0;
}

strcat

请看strcat的文档

Append a string.

char *strcat( char *strDestination, const char *strSource );

Return Value

Each of these functions returns the destination string (strDestination). No return value is reserved to indicate an error.

Parameters

strDestination

Null-terminated destination string

strSource

Null-terminated source string

可以看到函数原型和strcpy的原型几乎一样。

但作用不同,strcat的作用是Append a string即在目标字符串后追加源字符串。

目标空间要有\0,源字符串必须以\0结束。

为什么?假设我要把world追加到hello后边……

编译器先去目标空间中找到\0,从源字符串中,从w开始\0覆盖掉,然后依次把字符传到目标空间,直到遇到\0结束。

不论是目标字符串还是源字符串,都是遇到\0结束。

目标空间必须有足够的大,能容纳下源字符串的内容。

目标空间必须可修改。道理同strcpy。

先来模拟实现下strcat。

模拟实现strcat

char* my_strcat(char* dest, const char* src)
{assert(dest && src);char* ret = dest;//1. 找目标空间的\0while (*dest){dest++;}//2. 追加while (*dest++ = *src++){;}return ret;
}

字符串自己给自己追加,如何?可能会有问题。

当字符串给自己追加时……比如要将"abcdef"追加给"abcdef",dest会在while循环中找到\0。

之后\0被a覆盖。接着在a后边追加bcdef直到*dest被赋值成\0停止循环。

可是在这里\0已经被覆盖掉了,怎么遇到\0?这就是问题所在

 

strcmp

在MSDN中查阅strcmp的文档:

Remarks

The strcmp function compares string1 and string2 lexicographically and returns a value indicating their relationship.

Return Value

The return value for each of these functions indicates the lexicographic relation of string1 to string2.

ValueRelationship of string1 to string2
< 0string1 less than string2
0string1 identical to string2
> 0string1 greater than string2

可以发现strcmp是按字典序对两个字符串比较大小,当string1小于string2时返回值小于0,当string1等于string2时返回值等于0,当string1大于string2时返回值大于0。

在Visual Studio环境下,是小于的情况返回-1,是等于的情况返回0,是大于的情况返回1。但这并不意味着在所有IDE或编译器下都返回-1、0、1。

现在对abc和abcdef进行比较:

#include <stdio.h>
#include <string.h>
int main()
{char arr1[] = "abq";char arr2[] = "abcdef";int ret = strcmp(arr1,arr2);printf("%d", ret);return 0;
}

在ASCII码中,q的值大于c,所以返回值为1:

模拟实现strcmp 

#include <assert.h>
int my_strcmp(const char* str1, const char* str2)
{assert(str1 && str2);while (*str1 == *str2){if (*str1 == '\0')return 0;str1++;str2++;}if (*str1 > *str2)return 1;elsereturn -1;
}

有一种情况是str1和str1大小一样时返回0,所以在进入while循环后就要判断*str1是不是等于\0,如果是就说明两个字符串大小相等,就返回0。

当遇到不同的字符时,while循环会结束,如果*str1大于*str2就返回1,否则,也就是*str小于*str2时返回-1。

刚刚提到:

不意味着在所有IDE或编译器下都返回-1、0、1。

那就来模拟下不是返回-1、0、1的情况:

#include <assert.h>
int my_strcmp(const char* str1, const char* str2)
{assert(str1 && str2);while (*str1 == *str2){if (*str1 == '\0')return 0;str1++;str2++;}return *str1 - *str2;
}

注意看最后,return *str1-str2;就是直接返回两个字母的ASCII值的差。

虽然C语言有它的标准,但标准并没有具体规定大于和小于的情况返回多少,只规定返回的值是大于0还是小于0。

像strcpy、strcat、strcmp这些函数都是长度不受限制的字符串函数。不受限制也就意味着相对来说不安全,比如刚才演示的strcat,让字符串自己给自己追加,如果没有遇到\0就会陷入死循环。如果限制了长度们就不会陷入死循环。

长度受限制的字符串函数

为了尽可能地提高安全性,后来C语言又引入了一些新的函数,这些函数是长度受限制的字符串函数。这里仅作简单介绍,会用即可~

strncpy

它的函数原型是:

char *strncpy( char *strDest, const char *strSource, size_t count );

作用是:

拷贝num个字符从源字符串到目标空间。

如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

调试以下代码:

#include <string.h>
#include <stdio.h>
int main()
{char arr1[20] = "xxxxxxxxxx";strncpy(arr1, "abcdef", 3);printf("%s", arr1);return 0;
}

 对arr1进行监视,会发现strncpy不会在拷贝后给字符串加上\0。

当拷贝10个字符时:

#include <string.h>
#include <stdio.h>
int main()
{char arr1[20] = "xxxxxxxxxx";strncpy(arr1, "abcdef", 10);printf("%s", arr1);return 0;
}

这印证了刚才提到的

如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

strncat

它的函数原型是:

char *strncat( char *strDest, const char *strSource, size_t count );

查阅strncat的文档可得知

Appends the first num characters of source to destination, plus a terminating null-character.
If the length of the C string in source is less than num, only the content up to the terminating
null-character is copied.

可知在追加后会加上\0。此外如果源字符串的长度小于第三个参数的值,那么只会对源字符的\0之前的字符进行拷贝。

下面调试以下代码: 

#include <string.h>
#include <stdio.h>
int main()
{char arr1[20] = "abc";strncat(arr1, "abcdef", 4);printf("%s", arr1);return 0;
}

可以发现abcdef的长度明显大于4,那么只会拷贝前四个字符。

再来调试以下代码:

#include <string.h>
#include <stdio.h>
int main()
{char arr1[20] = "abc\0xxxxxx";strncat(arr1, "abcdef", 4);printf("%s", arr1);return 0;
}

可以看到,是从目标字符串的\0开始追加字符,追加四个字符,到最后添加\0。 

在追加后如果打印此字符串,最后的xx就不会被打印了。

strncmp

它的函数原型是:

int strncmp( const char *string1, const char *string2, size_t count );

与strcmp一样,都是按字典序对两个字符串比较大小,当string1小于string2时返回值小于0,当string1等于string2时返回值等于0,当string1大于string2时返回值大于0。

调试以下代码:

#include <string.h>
#include <stdio.h>
int main()
{char* p1 = "abcdef";char* p2 = "abcqwer";int ret = strncmp(p1, p2, 3);printf("%s", ret);return 0;
}

这是只比较前三个字符,输出结果为:

如果比较前四个字符,调试下边的代码:

#include <string.h>
#include <stdio.h>
int main()
{char* p1 = "abcdef";char* p2 = "abcqwer";int ret = strncmp(p1, p2, 4);printf("%s", ret);return 0;
}

输出结果为:

这是因为在ASCII中,q的值大于d,所以返回-1。


http://www.ppmy.cn/news/12314.html

相关文章

Java学习(83)Java集合——List概述,在List中存储并操作字符串信息

Java集合——List概述&#xff0c;在List中存储并操作字符串信息List概述1. List特点2. ArrayList案例&#xff1a;在List中存储并操作字符串信息List概述 1. List特点 (1) List是元素有序并且可以重复的集合&#xff0c;称为序列。 (2) List可以精确地控制每个元素的插入位置…

通过windows命令行dos连接mysql数据库服务器命令

首先进入mysql bin目录&#xff0c;然后执行以下命令即可。C:\Program Files\MySQL\MySQL Server 8.0\bin>mysql -u root -pEnter password: ********Welcome to the MySQL monitor. Commands end with ; or \g.Your MySQL connection id is 19Server version: 8.0.31 MySQL…

linux 0-入个门先

0. 给个好天气,过年可以打&#x1f3c0; 常用的一些指令了,大学基本都多少接触到的 1. 文本浏览 shell 注释 # cat fileName # 查看整一个文本 # 直接输出到控制台的head [-n 指定展示的行数] fileName tail [-n 指定展示的行数] fileNameless fileName # 滚动浏览 # 上下控制…

ArcGIS10.8保姆式安装教程,超详细;附安装包

安装前请关闭杀毒软件&#xff0c;系统防火墙&#xff0c;断开网络连接 参考链接&#xff1a;请点击 下载链接&#xff1a; 通过百度网盘分享的文件&#xff1a;ArcGIS10.8zip 链接:https://pan.baidu.com/s/1023fbyQpt6r6U6wtgBuReg 提取码:820w 复制这段内容打开「百度网盘A…

对象转换工具MapStruct落地实践分享

一、序言 随着系统模块分层不断细化,在Java日常开发中不可避免地涉及到各种对象的转换,如:DO、DTO、VO等等,在v4.1.2 大量手动的属性映射是一个繁琐重复且还易错的工作,让开发人员很痛苦,一个好的工具辅助,减轻了工作量、提升开发工作效率的同时还能减少bug的发生。 二…

Windows 系统中 CMD 工具常用命令

目录版本查看命令Maven的常用命令MySql 常用的命令Redis 命令String 数据类型哈希 hash 数据类型列表 list 数据类型集合 set 数据类型有序集合 sorted set 数据类型Git 命令Java 现阶段开发必备的工具有 JDK、Maven、Node.js&#xff08;npm&#xff09;、Git、MySql。 相应的…

【7】SCI易中期刊推荐——图像处理领域(中科院4区)

🚀🚀🚀NEW!!!SCI易中期刊推荐栏目来啦 ~ 📚🍀 SCI即《科学引文索引》(Science Citation Index, SCI),是1961年由美国科学信息研究所(Institute for Scientific Information, ISI)创办的文献检索工具,创始人是美国著名情报专家尤金加菲尔德(Eugene Garfield…

【ROS】—— 机器人系统仿真 —Rviz中控制机器人模型运动与URDF集成Gazebo(十五)

文章目录前言1. Arbotix使用流程1.1 安装 Arbotix1.2 创建新功能包&#xff0c;准备机器人 urdf、xacro 文件1.3 添加 Arbotix 配置文件1.4 编写 launch 文件配置 Arbotix1.5 启动 launch 文件并控制机器人模型运动2. URDF集成Gazebo2.1 URDF与Gazebo基本集成流程2.2 URDF集成G…