经典算法面试题目-设计算法移除字符串中重复的字符(1.3)

举报
谙忆 发表于 2021/05/28 06:37:10 2021/05/28
【摘要】 题目 Design an algorithm and write code to remove the duplicate characters in a string without using any additional buffer. NOTE: One or two additional variables are fine. An extra copy o...

题目

Design an algorithm and write code to remove the duplicate characters in a string without using any additional buffer. NOTE: One or two additional variables are fine. An extra copy of the array is not.

FOLLOW UP

Write the test cases for this method.

设计算法并写出代码移除字符串中重复的字符,不能使用额外的缓存空间。注意: 可以使用额外的一个或两个变量,但不允许额外再开一个数组拷贝。

进一步地,

为你的程序写测试用例。

解答

这道题目其实是要你就地(in place)将字符串中重复字符移除。你可以向面试官问清楚, 不能使用额外的一份数组拷贝是指根本就不允许开一个数组,还是说可以开一个固定大小, 与问题规模(即字符串长度)无关的数组。

如果根本就不允许你再开一个数组,只能用额外的一到两个变量。那么,你可以依次访问 这个数组的每个元素,每访问一个,就将该元素到字符串结尾的元素中相同的元素去掉( 比如置为’\0′).时间复杂度为O(n2 ),代码如下:

void removeDuplicate(char s[])
{ int len = strlen(s); if(len < 2) return;//只有一个字符,肯定没有重复的 int p = 0;//相当于一个游标 //从0开始找不重复的字符 for(int i=0; i < len; ++i) { if(s[i] != '\0') { s[p++] = s[i]; for(int j=i+1; j < len; ++j) if(s[j]==s[i]) s[j] = '\0'; } } s[p] = '\0';
}
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18

如果可以开一个固定大小,与问题规模(即字符串长度)无关的数组,那么可以用一个数组来 表征每个字符的出现(假设是ASCII字符,则数组大小为256),这样的话只需要遍历一遍字符 串即可,时间复杂度O(n)。代码如下:

void removeDuplicate(char s[])
{ int len = strlen(s); if(len < 2) return; bool c[256];//这个用true来标识这个字符出现过了。相比上个节省了时间。 memset(c, 0, sizeof(c)); int p = 0; for(int i=0; i < len; ++i) { if(!c[s[i]]) { s[p++] = s[i]; c[s[i]] = true; } } s[p] = '\0'; }
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

如果字符集更小一些,比如只是a-z,即字符串里只包含小写字母,那么使用一个int变量中 的每一位来表征每个字符的出现,一样可以在O(n)的时间里移除重复字符,而且还不需要额 外开一个数组。代码如下:

void removeDuplicate(char s[])
{ int len = strlen(s); if(len < 2) return; int check = 0, p = 0; for(int i=0; i < len; ++i) { //int变量本身在内存中占4字节也就是32位!! int v = (int)(s[i]-'a'); //如果没有出现重复的字母(字母种数小于32种),就不会出现(check & (1 << v)==1的情况! if((check & (1 << v))==0) { s[p++] = s[i]; check |= (1 << v); } } s[p] = '\0';
}
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18

测试用例:

不包含重复字符的字符串,比如:abcd
字符串全是重复字符,比如:aaaa
空字符串
重复字符连续出现,比如:aaabbb
重复字符不连续出现,比如:abababa
完整代码如下:

#include <iostream>
#include <cstring>
using namespace std;

string removeDuplicate1(string s)
{ int check = 0; int len = s.length(); if(len < 2) return s; string str = ""; for(int i=0; i<len; ++i) { int v = (int)(s[i]-'a'); if((check & (1<<v)) == 0) { str += s[i]; check |= (1<<v); } } return str;
}

string removeDuplicate2(string s)
{ int len = s.length(); if(len < 2) return s; string str = ""; for(int i=0; i<len; ++i) { if(s[i] != '\0') { str += s[i]; for(int j=i+1; j<len; ++j) if(s[j]==s[i]) s[j] = '\0'; } } return str;
}

void removeDuplicate3(char s[])
{ int len = strlen(s); if(len < 2) return; int p = 0; for(int i=0; i<len; ++i) { if(s[i] != '\0') { s[p++] = s[i]; for(int j=i+1; j<len; ++j) if(s[j]==s[i]) s[j] = '\0'; } } s[p] = '\0';
}

void removeDuplicate4(char s[])
{ int len = strlen(s); if(len < 2) return; bool c[256]; memset(c, 0, sizeof(c)); int p = 0; for(int i=0; i<len; ++i) { if(!c[s[i]]) { s[p++] = s[i]; c[s[i]] = true; } } s[p] = '\0'; }

void removeDuplicate5(char s[])
{ int len = strlen(s); if(len < 2) return; int check = 0, p = 0; for(int i=0; i<len; ++i) { int v = (int)(s[i]-'a'); if((check & (1<<v))==0) { s[p++] = s[i]; check |= (1<<v); } } s[p] = '\0';
}
int main()
{ string s1 = "abcde"; string s2 = "aaabbb"; string s3 = ""; string s4 = "abababc"; string s5 = "ccccc"; cout<<removeDuplicate1(s1)<<" "<<removeDuplicate2(s1)<<endl; cout<<removeDuplicate1(s2)<<" "<<removeDuplicate2(s2)<<endl; cout<<removeDuplicate1(s3)<<" "<<removeDuplicate2(s3)<<endl; cout<<removeDuplicate1(s4)<<" "<<removeDuplicate2(s4)<<endl; cout<<removeDuplicate1(s5)<<" "<<removeDuplicate2(s5)<<endl; char ss1[] = "abcde"; char ss2[] = "aaabbb"; char ss3[] = ""; char ss4[] = "abababc"; char ss5[] = "ccccc"; removeDuplicate5(ss1); removeDuplicate5(ss2); removeDuplicate5(ss3); removeDuplicate5(ss4); removeDuplicate5(ss5); cout<<ss1<<" "<<ss2<<" "<<ss3<<" "<<ss4<<" "<<ss5<<endl; return 0;
}
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • 106
  • 107
  • 108
  • 109
  • 110
  • 111
  • 112
  • 113
  • 114
  • 115
  • 116
  • 117

测试结果如下:

文章来源: chenhx.blog.csdn.net,作者:谙忆,版权归原作者所有,如需转载,请联系作者。

原文链接:chenhx.blog.csdn.net/article/details/51994424

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。