2020-07-03:有1亿个数字,其中有2个是重复的,快速找到它,时间和空间要最优 来自

举报
福大大架构师每日一题 发表于 2020/08/19 10:56:19 2020/08/19
【摘要】 福哥答案2020-07-03:1.双重遍历。时间复杂度是O(N^2)。2.排序。采用外部排序。时间复杂度是O(NlogN)。3.遍历加哈希存储。空间换时间,时间复杂度是O(N),空间复杂度是O(N)。这种方法适用于小数据量,在这里用明显不合适。4.布隆过滤器。根据公式计算,万分之一的失误率需要228M内存。个人感觉这种方法不太合适。5.压缩位图。根据我目前的分析,压缩位图适合稀疏存储,在这里...

福哥答案2020-07-03:

1.双重遍历。
时间复杂度是O(N^2)。

2.排序。
采用外部排序。时间复杂度是O(NlogN)。

3.遍历加哈希存储。
空间换时间,时间复杂度是O(N),空间复杂度是O(N)。这种方法适用于小数据量,在这里用明显不合适。

4.布隆过滤器。
根据公式计算,万分之一的失误率需要228M内存。个人感觉这种方法不太合适。

5.压缩位图。
根据我目前的分析,压缩位图适合稀疏存储,在这里用,效果不明显。32位整数总共有42亿个,这道题有1亿个数字,1/42算不算稀疏,就不得而知了。时间有限,没测试。

6.哈希分组。
这1亿个数字整数范围不限。
一个分组里有两个参数,一个参数保存数据,另一个参数保存个数DataCount。重复的数字一定在同一个分组中,然后对每一个分组进行遍历加哈希存储。如果DataCount过大,再次哈希分组。

7.位图。
32位整数范围,占用内存4G/8=512M。
最大值和最小值范围,占用内存 (max-min)/8+1,最小占用内存 1亿/8=不到12M。

结论:方法6和方法7都行。方法6适用的范围广,浮点数也行。方法7只适用于32位整数。


【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。