剑指offer之最小的K个数

举报
chenyu 发表于 2021/07/26 23:47:29 2021/07/26
【摘要】 1 问题 输入N个整数,找出其中最小的K个,例如输入数组6、5、1、4、 2、 7、 3、 8,最小的4个数是1、2、3、4       2 分析 1)我们可以用快速排序从小到大,但是时间复杂度是O(nlogn) 我们取出最前面的K个数就行。 2)用partition算法,时间复杂度是O(n) 我之前的博客讲解partition算...

1 问题

输入N个整数,找出其中最小的K个,例如输入数组6、5、1、4、 2、 7、 3、 8,最小的4个数是1、2、3、4

 

 

 

2 分析

1)我们可以用快速排序从小到大,但是时间复杂度是O(nlogn) 我们取出最前面的K个数就行。

2)用partition算法,时间复杂度是O(n)

我之前的博客讲解partition算法的总结如下:

我们使用partition算法的时候,从我们上面代码第一次调用来看,我们选择的第一个数字5作为中间轴,然后执行一次后,我们的 partition函数返回的start或者i值都是4,然后我们最后一步把5也插入了vector[4]那里,就是说明我们左边有4个值比当前数字5作为中间轴都小,也能说明这左边的4个值和中间轴数5都是数组里面最小的5个值,如果我们需要求出一个数组里面最小的5个值,我们只需要partition算法返回值是4就行,然后在左边的数组的前5个数字就是这个数组里面最小的5个数,所以这里的数组里面最小的多少K个数确保partition返回的index或者start的关系是:index = K - 1; 或者start = K -1关系,也就是说partition函数返回index或者start值的时候,数组里面从坐标0到index或者start的值就是数组里面最小的元素,也就是index+1个元素。
 

简言之:也就是说我们只需要确保partition算法这里返回值是3就行,然后我们再取数组前面的4个数字就是我们需要得到的结果

优点:这里时间复杂度为O(n)。

缺点:修改了数组的数据,然后适合数组数据量比较小。 

 

3) 我们单独可以一个空间(这里用mulitSet 配上greater 就可以使得数据可以按照从大到小排序,而且中间数据的插入,删除,查找的时间复杂度可以保持在O(logk) )保存K个数,然后遍历所有数据,如果这个数据小于空间K个数的最大值,我们把空间最大值踢出来,把这个数添加到空间里面去

优点:适合海量数据,因为一次性没有那么大空间装那么多数据,我么可以借助辅助空间。

 

 

3 代码实现

这里的partitionOne函数和partitionTwo函数和partitionTreee函数效果一样,我们用其中的一个就行了。


  
  1. #include <iostream>
  2. #include <vector>
  3. using namespace std;
  4. void swap(int* a, int* b)
  5. {
  6. int temp = *a;
  7. *a = *b;
  8. *b = temp;
  9. }
  10. void printVector(vector<int> v)
  11. {
  12. for (int i = 0; i < v.size(); ++i)
  13. {
  14. std::cout << v[i] << "\t";
  15. }
  16. std::cout << std::endl;
  17. }
  18. /*
  19. *partition算法 记得如果这里是C++我们传递的是vector类型,我们记得要加引用,
  20. *不然改变不了数据,这里和java传递ArrayList不一样,ArrayList作为参数可以改变集合里面的值,
  21. *所以C++如果函数传递非基本数据类型,一半都是带引用的
  22. */
  23. int partitionOne(vector<int>& vector, int start, int end)
  24. {
  25. if (start > end)
  26. {
  27. std::cout << "vector is empty or start > end" << std::endl;
  28. return -1;
  29. }
  30. int pivot = vector[start];
  31. while (start < end)
  32. {
  33. //我们先从尾巴开始
  34. while (start < end && pivot <= vector[end])
  35. {
  36. --end;
  37. }
  38. //这里用的数组赋值,而不是直接用swap交换函数,那么下面的2步也是用数组赋值,而不是用swap交换函数
  39. vector[start] = vector[end];
  40. while (start < end && pivot >= vector[start])
  41. {
  42. ++start;
  43. }
  44. vector[end] = vector[start];
  45. }
  46. //std:cout << "start is " << start << "end is " << end << std::endl;
  47. vector[start] = pivot;
  48. //printVector(vector);
  49. return start;
  50. }
  51. /*
  52. *partition算法, 这里只不过增加了2个变量i和j
  53. *,
  54. */
  55. int partitionTwo(vector<int>& vector, int start, int end)
  56. {
  57. if (start > end)
  58. {
  59. return -1;
  60. }
  61. int i = start;
  62. int j = end;
  63. int pivot = vector[start];
  64. while (i < j)
  65. {
  66. //我们先从尾巴开始
  67. while (i < j && pivot <= vector[j])
  68. {
  69. --j;
  70. }
  71. //这里用的数组赋值,而不是直接用swap交换函数,那么下面的2步也是用数组赋值,而不是用swap交换函数
  72. vector[i] = vector[j];
  73. while (i < j && pivot >= vector[i])
  74. {
  75. ++i;
  76. }
  77. vector[j] = vector[i];
  78. }
  79. vector[i] = pivot;
  80. //printVector(vector);
  81. // quickSort1(vector, start, i - 1);/*最后用同样的方式对分出来的左边的小组进行同上的做法*/
  82. // quickSort1(vector, i + 1, end);
  83. return i;
  84. }
  85. /*
  86. *partition算法, 这里只不过增加了2个变量i和j,然后使用了交换函数swap
  87. *,
  88. */
  89. int partitionThree(vector<int>& vector, int start, int end)
  90. {
  91. if (start > end)
  92. {
  93. return -1;
  94. }
  95. int i = start;
  96. int j = end;
  97. int pivot = vector[start];
  98. while (i < j)
  99. {
  100. //我们先从尾巴开始
  101. while (i < j && pivot <= vector[j])
  102. {
  103. --j;
  104. }
  105. while (i < j && pivot >= vector[i])
  106. {
  107. ++i;
  108. }
  109. //这里用的shiswap交换函数,那么下面的是是也是swap交换函数
  110. swap(vector[i], vector[j]);
  111. }
  112. swap(vector[i], vector[start]);
  113. //printVector(vector);
  114. return i;
  115. }
  116. /**
  117. *快速排序 调用第一个partitionOne
  118. */
  119. void quickSortOne(vector<int>& vector, int start, int end)
  120. {
  121. if (vector.size() < 0 || start > end)
  122. return;
  123. int index = partitionOne(vector, start, end);
  124. quickSortOne(vector, start, index - 1);
  125. quickSortOne(vector, index + 1, end);
  126. }
  127. /**
  128. *快速排序 调用第二个partitionTwo
  129. */
  130. void quickSortTwo(vector<int>& vector, int start, int end)
  131. {
  132. if (vector.size() < 0 || start > end)
  133. return;
  134. int index = partitionTwo(vector, start, end);
  135. quickSortTwo(vector, start, index - 1);
  136. quickSortTwo(vector, index + 1, end);
  137. }
  138. /**
  139. *快速排序 调用第三个partitionThree
  140. */
  141. void quickSortThree(vector<int>& vector, int start, int end)
  142. {
  143. if (vector.size() < 0 || start > end)
  144. return;
  145. int index = partitionThree(vector, start, end);
  146. quickSortThree(vector, start, index - 1);
  147. quickSortThree(vector, index + 1, end);
  148. }
  149. /**
  150. * 得到数组里面最小的几个数
  151. */
  152. void getLeastNumber(vector<int>& input, int inputLen, vector<int>& output, int k)
  153. {
  154. if (input.size() <= 0 || inputLen <= 0 || k > inputLen || k <= 0)
  155. {
  156. std::cout << "input size is zero or inputLen <=0 or k > inputLen or k<= 0" << std::endl;
  157. return;
  158. }
  159. int start = 0;
  160. int end = inputLen - 1;
  161. int index = partitionTwo(input, start, end);
  162. while (index != k - 1)
  163. {
  164. if (index < k - 1)
  165. {
  166. start = index + 1;
  167. index = partitionTwo(input, start, end);
  168. }
  169. else
  170. {
  171. end = index - 1;
  172. index = partitionTwo(input, start, end);
  173. }
  174. }
  175. for (int i = 0; i < k; ++i)
  176. {
  177. output.push_back(input[i]);
  178. }
  179. }
  180. int main()
  181. {
  182. vector<int> v2;
  183. v2.push_back(6);
  184. v2.push_back(5);
  185. v2.push_back(1);
  186. v2.push_back(4);
  187. v2.push_back(2);
  188. v2.push_back(7);
  189. v2.push_back(3);
  190. v2.push_back(8);
  191. vector<int> v3;
  192. getLeastNumber(v2, v2.size(), v3, 4);
  193. printVector(v3);
  194. return 0;
  195. }

 

 

 

 

 

4 运行结果

2	1	3	4	

 

 

 

 

 

5 借助辅助空间的赛选海量数据代码实现


  
  1. #include <iostream>
  2. #include <vector>
  3. #include <set>
  4. #include <functional>
  5. using namespace std;
  6. //typedef multiset<int, greater<int> > intSet; 这样写错了,中间还要一个空格
  7. typedef multiset<int, greater<int> > intSet;
  8. typedef multiset<int, greater<int> >::iterator setIterator;
  9. void printSet(intSet set)
  10. {
  11. setIterator iter = set.begin();
  12. std::cout << "----" << std::endl;
  13. for (; iter != set.end(); ++iter)
  14. {
  15. std::cout << "value is " << *iter << endl;
  16. }
  17. std::cout << "----" << std::endl;
  18. }
  19. /**
  20. * 得到数组里面最小的几个数
  21. */
  22. void getLeastNumberOne(vector<int>& input, int inputLen, intSet& output, int k)
  23. {
  24. if (input.size() <= 0 || inputLen <= 0 || k > inputLen || k <= 0)
  25. {
  26. std::cout << "input size is zero or inputLen <=0 or k > inputLen or k<= 0" << std::endl;
  27. return;
  28. }
  29. for (vector<int>::iterator iter = input.begin(); iter != input.end(); ++iter)
  30. {
  31. if (output.size() < k)
  32. {
  33. output.insert(*iter);
  34. }
  35. else
  36. {
  37. setIterator setIter = output.begin();
  38. if (*iter < *setIter)
  39. {
  40. //output.erase(*setIter)错错了
  41. //erase函数不是删除的指针值,是删除的指针
  42. output.erase(setIter);
  43. output.insert(*iter);
  44. }
  45. }
  46. }
  47. }
  48. int main()
  49. {
  50. vector<int> v2;
  51. v2.push_back(6);
  52. v2.push_back(5);
  53. v2.push_back(1);
  54. v2.push_back(4);
  55. v2.push_back(2);
  56. v2.push_back(7);
  57. v2.push_back(3);
  58. v2.push_back(8);
  59. intSet v3;
  60. getLeastNumberOne(v2, v2.size(), v3, 4);
  61. setIterator iter = v3.begin();
  62. for (; iter != v3.end(); ++iter)
  63. {
  64. std::cout << "value is " << *iter << endl;
  65. }
  66. return 0;
  67. }

 

 

 

 

 

6 运行结果


  
  1. value is 4
  2. value is 3
  3. value is 2
  4. value is 1

 

 

 

 

7 总结

如果看到了什么海量数据的话,我么可以单独借助辅助空间,然后辅助空间里面以以时间复杂度最小来进行删除、增加、查找操作。

文章来源: chenyu.blog.csdn.net,作者:chen.yu,版权归原作者所有,如需转载,请联系作者。

原文链接:chenyu.blog.csdn.net/article/details/102645478

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。