如何用C/C++实现去除字符串头和尾指定的字符

编程时我们经常需要对字符串进行操作,其中有一项操作就是去除字符串的头(尾)指定的字符,比如空格。通常我们会使用封装好的库函数或者类函数的Trim方法来实现,如果自己动手写一个TrimHead和TrimTail函数该如何实现呢?
 
本文针对字符串头(尾)部指定的字符的去除,分别给出两个实现方法。并分别比较一下改进后的性能如何?

一、从头部开始去除指定字符

首先从头遍历,直到遇见第一个非指定字符,此后将后续字符按顺序逐一前移。

// 实现方式一 void TrimHead(char* pszSrc, char chTrim) { 	if(NULL == pszSrc) 		return; 	 	// 从头部开始跳过chTrim指定的字符 	char* psz = pszSrc; 	while (*psz && *psz == chTrim)  		psz++; 	 	// 将后面字符逐一拷贝到前面 	int i = 0; 	while(*psz) 	{ 		*(pszSrc+i) = *psz; 		i++; 		psz++; 	} 	*(pszSrc+i) = 0; } 

上述函数中,在找到第一个非指定字符后,通过while函数逐一前移字符,如果后续字符串很长的话,性能是不是会比较低?我们改进一下,使用memmove函数替换while操作,下面是实现方法,代码更加简洁易读。

// 实现方式二 void TrimHeadEx(char* pszSrc, char chTrim) { 	if(NULL == pszSrc) 		return;  	// 从头部开始跳过chTrim指定的字符 	int iStrLen = strlen(pszSrc); 	char* psz = pszSrc; 	while (*psz && *psz == chTrim)  		psz++;  	// psz指向第一个非指定字符的位置 	if(psz != pszSrc) 	{ 		// 计算新字符串长度 		iStrLen = iStrLen - (psz - pszSrc); 		memmove(pszSrc, psz, (iStrLen+1));	// +1表示将末尾的0也一并拷贝 	} } 

方法二的代码要比方法一的简洁,那么它的速度会比方法一的快么?文末会给出答案。

 

二、去除尾部指定的字符

// 实现方式一 void TrimTail(char* pszSrc, char chTrim) { 	if(NULL == pszSrc) 		return;  	char* psz = pszSrc; 	char* pszLast = NULL; 	 	// 从头开始遍历直到整个字符串结束 	while(*psz) 	{ 		// 遇到指定字符,则用pszLast记住该位置 		if(*psz == chTrim) 		{ 			if(NULL == pszLast) 				pszLast = psz; 		} 		else 			pszLast = NULL; 		psz++; 	} 	 	// 如果找到末尾的第一个指定字符,则作为字符串的结尾 	if(pszLast != NULL) 		*pszLast = 0; } 

上述方法中,我们需要遍历完整个字符串,如果字符串很长的话,或者遇到极端情况,就是结尾没有指定字符时,也要将整个字符串遍历完毕。显然这种实现方式的效率并不高。 那么我们改进一下算法,从字符串的尾部进行遍历。

// 实现方式二 void TrimTailEx(char* pszSrc, char chTrim) { 	if(NULL == pszSrc) 		return;  	// 从尾部开始跳过chTrim指定字符 	int iStrLen = strlen(pszSrc); 	char* pszStr = pszSrc; 	int iLastIdx = iStrLen - 1; 	while(iLastIdx >= 0 && *(pszStr+iLastIdx) == chTrim) 		iLastIdx--; 	 	// 计算新字符串长度并在结尾赋值为0 	iStrLen = iLastIdx+1; 	*(pszSrc+iStrLen) = 0; } 

上述实现方式是从字符串的尾部进行遍历,实现的方式也更加的简洁。如果结尾没有指定字符,该函数会在遍历第一个字符后就退出,性能显然要好过方式一。

那么对于TrimHead和TrimTail的两种实现,方式二和方式一到底谁快呢?是不是和我们想象的一样有差距或者差距很大呢?
 

三、测试比较

这里写了一个测试函数TestSpeedTrim,为了让时间更加明显,在该函数中设置的循环次数为10000000。大家可以亲自运行测试一下,看看debug和release两个版本的差异,结果一定会让你吃惊,可能和你想的并不一样哦。

#include <time.h> #include <stdio.h> #include <string.h> #include <stdlib.h> void TestSpeedTrim(bool bTrimHead) { 	char szTrim1[256] = {0}; 	char szTrim2[256] = {0}; 	 	char* pszOrigin = "     This is a trim test head/tail    "; 	strcpy(szTrim1, pszOrigin); 	strcpy(szTrim2, pszOrigin); 	 	int i = 0; 	int iCount = 10000000; 	clock_t cStart = 0; 	 	// 第一种Trim方法 	cStart = clock(); 	for(i = 0; i < iCount; i++) 	{ 		bTrimHead ? TrimHead(szTrim1, ' ') : TrimTail(szTrim1, ' '); 	} 	clock_t cSpan1 = clock() - cStart; 	 	// 第二种Trim方法 	cStart = clock(); 	for(i = 0; i < iCount; i++) 	{ 		bTrimHead ? TrimHeadEx(szTrim2, ' ') :	TrimTailEx(szTrim2, ' '); 	} 	clock_t cSpan2 = clock() - cStart; 	 	printf("cSpan1 = %d, cSpan2 = %drn", cSpan1, cSpan2); 	printf("szTrim1=[%s]rn", szTrim1); 	printf("szTrim2=[%s]rn", szTrim2); }  int main(int argc, char* argv[]) { 	// 测试头 	printf("删除头部的空字符:rn"); 	TestSpeedTrim(true);  	// 测试尾 	printf("rn删除尾部的空字符:rn"); 	TestSpeedTrim(false);  	getchar(); 	return 0; } 

这里就不给出比较结果了,因为只有自己亲自动手实现并跑一遍后,才会记得更加牢靠。

发表评论

相关文章