本篇文章聊一下strcpy和memcpy的代码实现,这两个也是c和c++面试中常考的问题点。
1. 手写strcpy
首先看一下,一份标准的strcpy
的实现如下:
char *strcpy(char* strDest, const char* strSrc)
{
assert( (strDest != NULL) && (strSrc != NULL));
char *address = strDest;
while((*strDest++ = *strSrc++) != '\0');
return address;
}
这里有如下几点需要注意:
- 源字符串要使用const类型,避免在程序中被修改;
- 在函数入口处要加上断言,检查源字符串指针和目标字符串指针是否有为空的,否则会产生不可预料的错误;
- 使用while循环要简单而清晰,使用尽量精简的代码;
- 返回值要是
char*
,且返回了目标字符串指针的原值,使得函数可以支持链式表达式,增加了函数的附加值。
以上这些点不只适用于strcpy这里,而是我们任何时候写代码都尽量遵循这些规则,这样才能写出高可用、高健壮性的代码。
对于以上代码,我们可以看出来,它是存在隐患的,当源字符串的长度超出目标字符串时,会导致把数据写入到我们无法控制的地址中去,存在很大的风险,所以就有了strncpy,下面也给一个strncpy的实现,如下:
char *strncpy(char* strDest, const char* strSrc, size_t n)
{
assert( (strDest != NULL) && (strSrc != NULL));
char *address = strDest;
while ( n-- && (*strDest++ = *strSrc++) != '\0');
return address;
}
要根据输入的长度做一个控制,而往往我们使用的时候,输入的长度都是目标字符串的长度减1,因为要留一个位置给结束符'\0'
。
2. memcpy的实现
memcpy的实现其实可以参考strncpy的实现,比如我们把指针类型转换成char*来实现拷贝,这种方式就是按照一个字节一个字节来进行拷贝了,首先还是一睹代码为快,如下:
#include <stdio.h>
#include <string.h>
struct people
{
int iAge;
char szName[12];
char szSex[3];
};
//模拟memcpy的实现
void * mymemcpy(void *dest, const void *src, size_t n)
{
if (dest == NULL || src == NULL)
return NULL;
char *pDest = static_cast <char*>(dest);
const char *pSrc = static_cast <const char*>(src);
if (pDest > pSrc && pDest < pSrc+n)
{
for (size_t i=n-1; i != -1; --i)
{
pDest[i] = pSrc[i];
}
}
else
{
for (size_t i= 0; i < n; i++)
{
pDest[i] = pSrc[i];
}
}
return dest;
}
int main()
{
people stPeople1, stPeople2;
memset((void*)&stPeople1, 0x00, sizeof(stPeople1));
memset((void*)&stPeople2, 0x00, sizeof(stPeople2));
stPeople1.iAge = 32;
mymemcpy(stPeople1.szName, "li lei", sizeof(stPeople1.szName));
mymemcpy(stPeople1.szSex, "man", sizeof(stPeople1.szSex));
mymemcpy((void*)&stPeople2, (void*)&stPeople1, sizeof(stPeople2));
printf("this people age is %d, name is %s, sex is %s\n", stPeople2.iAge, stPeople2.szName, stPeople2.szSex);
return 0;
}
我们看mymemcpy的实现,此时是一个字节的实现,但它与strncpy实现不能一样,看一下memcpy实现的注意点:
- 同样的,在函数入口处要检查源字符串指针和目标字符串指针是否有为空的,否则会产生不可预料的错误;
- 因为是按照一个字节拷贝,那就要把形参转换成
char*
类型来操作; - 要检查源内存和目标内存是否存在内存重叠,如果目标内存首地址在源内存的中间,则要从后往前拷贝,因为如果从前往后拷贝,那从目标内存首地址开始的地方就会被覆盖掉,如果没有重叠,或者源内存地址在目标内存的中间,那没有关系,可以从前往后拷贝;
- 不能使用
'\0'
来判断拷贝的结束,因为它是对一整块内存的拷贝,举一个浅显的例子,假设拷贝一个结构体,类似上面代码,那么它很可能拷贝到中间的某个地方就停止了,这个拷贝就相当于没有完成; - 同样的,memcpy也要返回目标字符串地址;
但是这个时候如果面试官问你,按照4个字节来拷贝,该怎么实现呢?
根据前面的逻辑,其实按照4个字节拷贝就是把指针类型转换成int*来拷贝,不过有一点不同的是,如果按照4个字节来拷贝,就没办法去判断内存重叠的情况了,因为内存的基本单位是一个字节,4个字节是没有办法避免覆盖情况的,一个可用的4个字节拷贝代码如下:
void * mymemcpy(void *dest, const void *src, size_t n)
{
if (dest == NULL || src == NULL)
return NULL;
int *pDest = (int*)dest;
int *pSrc = (int*)src;
int iWordNum = n/4;
int iSlice = n%4;
while(iWordNum--)
{
*pDest++ = *pSrc++;
}
char* pcDest = (char*)pDest;
char* pcSrc = (char*)pSrc;
while(iSlice--)
{
*pcDest++ = *pcSrc++;
}
return dest;
}
按照4个字节判断,一个清晰的思路是满足4个字节的按照int类型去拷贝,不满足4个字节的就还是按照char类型去拷贝。
好了,关于strcpy和memcpy的实现就介绍到这里,如果我的创作对你有用的话,麻烦点个赞呗。