C语言实现用堆解决 TOP-K 问题
【摘要】 生活中我们经常能见到TopK问题,例如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。所以,TopK问题即求出一组数据中前K个最大或最小的元素,一般情况下,数据量都比较大。对于TopK问题,我们首先想到的可能是排序,对数据排好序以后,取前K个元素。但是,面对庞大的数据量时,排序并不适用,因为加载庞大的数据到内存中是个不小的消耗。所以,对于TopK问题,最佳的解决方式是用堆
目录
生活中我们经常能见到TopK问题,例如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
所以,TopK问题即求出一组数据中前K个最大或最小的元素,一般情况下,数据量都比较大。
对于TopK问题,我们首先想到的可能是排序,对数据排好序以后,取前K个元素。但是,面对庞大的数据量时,排序并不适用,因为加载庞大的数据到内存中是个不小的消耗。
所以,对于TopK问题,最佳的解决方式是用堆。
思路如下:
1.取数据前K个元素来建堆;
若要求前K个最大的元素,则建小堆;
若要求前K个最小的元素,则建大堆;
2.用剩余的N-K个元素依次与堆顶元素进行比较,若大于堆顶元素,则赋值给堆顶元素,并向下调整。(取前K个最小元素则是小于)。
将剩余N-K个元素依次与堆顶元素比较完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
此算法的时间复杂度为 O(N*log K)。
TopK函数实现
如何测试
生成1000个小于1000000的随机数,将其中10个修改为大于1000000的数,若程序执行后可以得到这10个数,即测试成功。
结果如下:
完整源码
若对堆的知识不太了解,没关系,这里为你准备了简要但透彻的堆的讲解⇢
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)