【C进阶】——字符串操作函数及strlen、strcpy、strcat、strcmp

举报
YIN_尹 发表于 2023/08/04 10:55:18 2023/08/04
【摘要】 这篇文章给大家介绍一些C语言中处理字符串的 库函数 以及它们的使用和注意事项,一起来学习吧!!!本篇文章介绍的函数需要包含的头文件都是#include前言C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串 中或者 字符数组 中。字符串常量 适用于那些对它不做修改的字符串函数.1.求字符串长度——strlenstrlen是库函数,我们要知道库函数...

这篇文章给大家介绍一些C语言中处理字符串的 库函数 以及它们的使用和注意事项,一起来学习吧!!!

本篇文章介绍的函数需要包含的头文件都是#include


前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串 中或者 字符数组 中。

字符串常量 适用于那些对它不做修改的字符串函数.


1.求字符串长度——strlen

strlen是库函数,我们要知道库函数的参数和它的功能是C语言标准规定好的,那我们怎么看它的参数是什么呢?


之前的文章里给大家提到过一个查询库函数的网站(cplusplus.com):

链接: link


那我们来看一下C语言标准规定strlen的参数和功能是怎么样的的:

a8fbcac7312a46779f8cd40a612667fc.png

1.1 使用及注意事项

相信这个函数大家以及比较熟悉了,但这里还是带大家一起来复习一下,并强调一些注意事项:


字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。


举个例子:

#include <string.h>
#include <stdio.h>
int main()
{
    char arr[] = "abcdef";
    char arr2[] = { 'a','b','c','d','e','f','\0' };
    printf("%d\n", strlen(arr));
    printf("%d\n", strlen(arr2));

    return 0;
}

看下结果:

9c9761848c974abb8de22ef3356949b5.png

字符’\0’之前有6个字符,所以结果是6,相信大家都能明白。

参数指向的字符串必须要以 ‘\0’ 结束。

我们知道字符串的结束标志是’\0’,那如果一个字符串中没有’\0’,还能用strlen计算它的长度吗?

int main()
{
    char arr[] = { 'a','b','c','d','e','f' };
    char arr2[] = { 'a','b','f'};
    printf("%d\n", strlen(arr));
    printf("%d\n", strlen(arr2));

    return 0;
}

大家思考一下结果会是什么?

cfa4b9c820174e458c8cf6a6f9a6f6bf.png

19和31,为什么会是这个结果,是巧合吗?我们再运行一次:

2e660ee09e6442c299e9c6a8dfcd8ed9.png

19和31,为什么会是这个结果,是巧合吗?我们再运行一次:

2e660ee09e6442c299e9c6a8dfcd8ed9.png

又一个不同的结果,为啥呢?


因为如果我们不加’\0’,去求一个没有结束标志的字符串,它的结果将会是一个随机值,为什么呢?

因为函数strlen 求的是字符串中’\0’之前的字符个数,但是上面的两个字符串(C语言没有字符串类型,我们放到了字符数组中)中没有’\0’,所以strlen函数就会一直向后寻找,直至遇到’\0’,但数组后面的内存空间放的是什么我们是不知道的,所以我们不知道什么时候会遇到’\0’,因此结果是一个随机值。


注意函数的返回值为size_t,是无符号的( 易错 )


大家可能不是太明白,我们来先看一段代码:

#include <stdio.h>
int main()
{
 const char*str1 = "abcdef";
 const char*str2 = "bbb";
 if(strlen(str2)-strlen(str1)>0)
 {
 printf("str2>str1\n");
 } 
 else
 {
 printf("srt1>str2\n");
 }
 return 0; }

大家思考一下结果是啥?

str1的长度为6,str2的长度为3,所以strlen(str2)-strlen(str1)的结果是-3,小于0,if判断为假,所以打印"srt1>str2"

如果你是这样想的那就错了!!!

我们来看一下结果是啥?

0816b6a7f4744327a241aad4092689af.png

结果是str2>str1,与我们想的不一样,原因就在于函数strlen的返回值为size_t。

解释:9cbcb051de9a46129a49c49cee12f328.png

不知道大家有没有注意到,库函数strlen的返回类型是size_t。

那什么是size_t呢?我们来看一下:

06ef7b3fe9e9400b894bb11642d4ab81.png

怎么看,在vs2022中输入一个size_t,鼠标右键转到定义或直接按F12即可查看:

7e172bfb20a149c698e5a65160f65f8a.png

我们看到,size_t其实就是unsigend int (无符号整型),因为typedef unsigned int size_t的意思其实就是把类型unsigned int 重命名为 size_t。

由于strlen的返回类型是size_t,所以strlen(str2)-strlen(str1)的结果就也是size_t了。

那么3-6=-3,我们知道内存中存的是补码:

a3a7eebec7f0425dba488f22013402cc.png

那如果11111111111111111111111111111101被当作一个无符号整型,转化为10进制将是一个非常大的正数,肯定大于0,所以结果才是str2>str1。


1.2 strlen的模拟实现

那我们现在已经知道了函数strlen的参数以及它的功能,我们是不是可以尝试去模拟实现一下strlen呢?

bb31c2bf839d4e12984b538884b88f13.png

这里我们介绍三种方法去模拟实现strlen:

  1. 计数器方式

怎么实现呢?

把字符串的首字符地址传给函数,用指针接收,用该指针遍历字符串,如果指针指向的内容不是’\0’,计数器++,指针继续向后移动,直至遇到’\0’停止,返回计数器的值。

size_t my_strlen(const char* str) 
{
    int count = 0;
    while (*str)
    {
        count++;
        str++;
    }
    return count;
}

看一下能不能达到效果:

070ce5becec6410ab71e0a67e925ae51.png

  1. 递归实现

怎么递归呢?

我们对传过来的首字符地址直接解引用,如果是’\0’,那就返回0。

如果不是’\0’,那说明至少有一个有效字符,让指针+1,返回1+my_strlen(str+1),直至遇到’\0’,开始回归得出结果。

size_t my_strlen(const char* str) 
{
    if (*str == '\0')
        return 0;
    else
        return 1 + my_strlen(str + 1);
}

也能得到正确结果:3143976073174ff5a4324c4fccc64478.png

  1. 指针-指针

在指针的学习中我们已经知道,指针-指针得到的是两个指针之间的元素个数,那我们让一个指针指向首字符,另一个指针指向’\0’,后者减前者,得到的元素个数不就是字符串长度吗?

size_t my_strlen(char* s) 
{
    char* p = s;
    while (*p != '\0')
        p++;
    return p - s;
}

这样依然可行:

e158d9c17dfa448da304133d2db6f6e2.png

2.字符串拷贝——strcpy

先来认识一下它吧:

2bd6be376ab74e128e053501f521162e.png

2.1 使用及注意事项

源字符串必须以 ‘\0’ 结束

我们知道字符串的结束标志是’\0’,也就是说,strcpy在拷贝源字符串时,遇到’\0’才会停止拷贝,而跟字符串的长度无关,只要不遇到’\0’,就一直往后继续拷贝,那如果我们的源字符串中没有’\0’,会出现什么后果呢?

int main()
{
    char arr1[20] = { 0 };
    char arr2[] = {'a','b','c'};
    strcpy(arr1, arr2);
    return 0;
}

将arr2中的字符串拷贝到arr1中,但是arr2中的字符串并没有’\0’,会出现什么样的结果呢?

062958b0fa3a47bb906c68cf512026a1.png

我们调试可以发现,这样是会发生错误的,因为在字符’a’、‘b’、‘c’的后面并没有放’\0’,所以strcpy会一直向后拷贝,我们不知道什么时候才会遇到’\0’停止下来,而且arr1我们申请的空间也是有限的,也不能无限的向里面放东西,所以这样就有可能造成越界,而且在’a’、‘b’、'c’后面会拷贝什么内容我们也不知道,这是不可行的。

因此,源字符串必须以 ‘\0’ 结束。


会将源字符串中的 ‘\0’ 拷贝到目标空间

strcpy在拷贝的时候会将源字符串的’\0’也拷贝到目标空间


我们来验证一下:

int main()
{
    char arr1[20] = "*****************";
    char arr2[] = "abc";
    strcpy(arr1, arr2);
    printf("%s", arr1);
    return 0;
}

8d1de1ad54124224ac309e070f58fc05.png

  1. 目标空间必须足够大,以确保能存放源字符串

既然我们要把源字符串拷贝放到目标空间,那一定要确保目标空间足够大,能够放得下源字符串,如果目标空间大小不够,肯定也会出现问题的。

int main()
{
    char arr1[] = "abc";
    char arr2[] = "xxxxxx";
    strcpy(arr1, arr2);
    printf("%s", arr1);
    return 0;
}

04c90367ae054272804eda77e875441e.png

  1. 目标空间必须可变

什么意思呢,就是目标空间放的内容必须是可修改的,因为我们要把源字符串的内容拷贝放进目标空间中(相当于修改了目标空间的内容),如果目标空间不可变,那肯定是不行的。

比如:

int main()
{
    char* p = "hello world";
    char arr[] = "abc";
    strcpy(p, arr);
    return 0;
}

f0ba18632e8b435b883839ca7b1d8a48.png

2.2 strcpy的模拟实现

接下来我们来模拟实现一下strcpy,直接上代码:

char* my_strcpy(char* dest, const char* src)
{
    assert(dest && src);
    char* ret = dest;
    while (*dest++ = *src++)
    {
        ;
    }
    return ret;
}

解释一下:

338f04a62fe442038ea6a3d09fd60ce4.png

看一下效果:

e5cd838a15624ec8bf22c030728d2530.png

3.字符串追加函数——strcat

一起来认识一下:

845e10c3d5db477d8f7f5e849a476e8e.png

6c178570e448484588a326c9da2e10a7.png

其实就是在一个字符串的后面追加上另外一个字符串。追加的字符串从目标字符串(即被追加的字符串)的结束标志’\0’处开始追加(会覆盖目标字符串的’\0’),追加至’\0’停止。

演示一下:

#include <stdio.h>
#include <string.h>

int main()
{
    char arr1[20] = "hello ";
    char arr2[] = "world";
    strcat(arr1, arr2);
    printf("%s\n", arr1);
    return 0;
}

看看效果:

4ed6b2f648a84dbcb75f8a304b7cc5d7.png

3.1使用及注意事项

  1. 源字符串必须以 ‘\0’ 结束。

因为追加的时候还是遇到’\0’停止,如果源字符串中没有’\0’,就会一直继续向后追加,而后面的空间是不属于我们的,里面放的是什么东西也是未知的,这样肯定会出现问题的。

0f0da0cb88214657bdf6fa150cce2582.png

目标空间必须有足够的大,能容纳下源字符串的内容。

32738968d3ab4065affbfc4d64573e54.png

  1. 目标空间必须可修改

跟strcpy一样,要操作的目标空间必须是可变的,因为追加字符串相当于对目标空间做出了修改,所以目标空间必须是可变的,不能是字符串常量。

bbea755f685d40bab8ad1e463aa81184.png

3.2 strcat的模拟实现

现在我们已经知道了strcat的参数和工作原理,那我们就来模拟实现一下它:


怎么搞呢?

我们知道strcat在追加字符串时是从目标字符串的结束标志’\0’处开始追加的(会覆盖掉目标字符串的’\0’),直至遇到’\0’追加结束,当然源字符串的’\0’也会追加上去。


那我们先用一个指针找到目标字符串的’\0’,然后的操作是不是就跟strcpy一样了啊,把源字符串的内容拷贝到目标字符串的’\0’之后不就行了嘛。


实现一下:

char* my_strcat(char* dest, const char* src)
{
    assert(dest && src);
    //1.找到目标字符串的'\0'
    char* p = dest;
    while (*p != '\0')
    {
        p++;
    }
    //2.将源字符串拷贝到目标空间的'\0'之后
    while (*p++ = *src++)
    {
        ;
    }
    return dest;
}

看看效果:

b7960d796587491eb12ae06bb5970719.png

3.3思考

现在我们已经了解了这个函数了,那我们来思考一个问题,使用strcat可不可以实现 字符串自己给自己追加?


这样是不可行的!!!

为啥尼?

因为如果是字符串自己给自己追加,那么目标字符串和源字符串就是同一个字符串了,我们已经知道strcat在进行追加时是会将目标字符串的’\0’覆盖掉的,因为它是从’\0’处开始向后追加,那这样一来,源字符串中就没有’\0’,遇不到’\0’的话指针就会一直向后走,这样肯定会出现问题的。

所以这样的操作是不行的。

060a5cb75fe249c0ba0662020ca2f4f1.png

那有没有什么方法可以实现字符串自己给自己追加呢?

方法是有的,别着急,我们在后面给大家解答!

4.字符串比较函数——strcmp

先来认识一下:

b69298bdb4034710bb7634022511ac44.png

4.1使用及注意事项

注意strcmp在比较字符串的时候不是比较两个字符串的长度,而是比较它们对应位置的字符,一个一个的比较,如果相等就比较下一个,不相等的时候,看两个字符谁大谁小(ASCII码值),返回对应的值。

下面我们来练习一下它的使用:

#include <stdio.h>
#include <string.h>
int main()
{
    char arr[] = "abx";
    char arr2[] = "abcfg";
    printf("%d", strcmp(arr, arr2));
    return 0;
}

arr和arr1进行比较,前两个字符ab都相同,第三对字符arr的’x’大于arr1的’c’,所以arr大于arr1,返回1。

看看结果是不是:

00d67cdda8a64be28ce47ed66f689b6e.png

4.2strcmp 的模拟实现

思路就很明白了,我们就一对一对的比较就行了。

如果两个字符串是一样的,那就一直往后比,直到遇到’\0’停止,返回0。

不一样的话,还是先一直往后比,比到不相同的那一对字符,判断它们的大小关系,返回对应值就行了。

我们来实现一下:

int my_strcmp(const char* s1, const char* s2)
{
    assert(s1 && s2);
    while (*s1 == *s2)
    {
        if (*s1 == '\0')
            return 0;
        s1++;
        s2++;
    }
    if (*s1 > *s2)
        return 1;
    else
        return -1;
}

看看效果:

3b8f28c4ecac4aef9845796b90bbbe3f.png

当然这里我们实现的和strcmp一样,返回的是1,0,-1。

但其实不一定非得是1,-1,因为标准规定只要是大于0,小于0的数字就行了,所以我们还可以简化一下,直接返回*s1 - *s2,这样得到的是它们的ASCII码的差值,也符合要求。

int my_strcmp(const char* s1, const char* s2)
{
    assert(s1 && s2);
    while (*s1 == *s2)
    {
        if (*s1 == '\0')
            return 0;
        s1++;
        s2++;
    }
    return *s1 - *s2;
}

5.小结

学到这里,我们来回顾一下刚才学的几个函数,strcpy、strcat、strcmp,我们会发现,这几个操作字符串的函数跟字符串的长度的是没有关系的,关键在于’\0’:

strcpy拷贝完’\0’就停止拷贝

strcat追加完’\0’就停止追加

strcmp比较完’\0’就停止比较

我们把它叫做长度不受限制的字符串操作函数。


那接下来,我们再来学习一组字符串操作函数,大家对比一下,和上面这几个有什么区别!

见下一篇文章...

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。