【愚公系列】2023年12月 数据结构(十三)-堆

举报
愚公搬代码 发表于 2023/12/31 00:03:11 2023/12/31
【摘要】 数据结构是计算机科学中的一个重要概念,它描述了数据之间的组织方式和关系,以及对这些数据的访问和操作。常见的数据结构有:数组、链表、栈、队列、哈希表、树、堆和图。

🏆 作者简介,愚公搬代码
🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,阿里云专家博主,腾讯云优秀博主,掘金优秀博主,51CTO博客专家等。
🏆《近期荣誉》:2022年CSDN博客之星TOP2,2022年华为云十佳博主等。
🏆《博客内容》:.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、大数据、人工智能、U3D游戏、小程序等相关领域知识。
🏆🎉欢迎 👍点赞✍评论⭐收藏

🚀前言

数据结构是计算机科学中的一个重要概念,它描述了数据之间的组织方式和关系,以及对这些数据的访问和操作。常见的数据结构有:数组、链表、栈、队列、哈希表、树、堆和图。

  1. 数组(Array):是一种线性数据结构,它将一组具有相同类型的数据元素存储在一起,并为每个元素分配一个唯一的索引。数组的特点是具有随机访问的能力。

  2. 链表(Linked List):也是一种线性数据结构,它由一系列的节点组成,每个节点包含数据和指向下一个节点的引用。链表的特点是可以动态地插入或删除节点,但访问某个节点时需要从头开始遍历。

  3. 栈(Stack):是一种后进先出(LIFO)的数据结构,它只能在栈顶进行插入和删除操作。栈通常用于实现递归算法、表达式求值和内存管理等场景。

  4. 队列(Queue):是一种先进先出(FIFO)的数据结构,它可以在队尾插入元素,在队头删除元素。队列通常用于数据的缓存、消息队列和网络通信等场景。

  5. 哈希表(Hash Table):也称为散列表,它是一种根据关键字直接访问数据的数据结构。哈希表通常由数组和散列函数组成,可以在常数时间内进行插入、删除和查找操作。

  6. 树(Tree):是一种非线性数据结构,它由一系列的节点组成,每个节点可以有若干个子节点。树的特点是可以动态地插入或删除节点,常见的树结构包括二叉树、平衡树和搜索树等。

  7. 堆(Heap):是一种特殊的树结构,它通常用于实现优先队列和堆排序等算法。堆分为最大堆和最小堆,最大堆的每个节点的值都大于等于其子节点的值,最小堆则相反。

  8. 图(Graph):是一种由节点和边组成的非线性数据结构,它可以用来表示各种实体之间的关系,如社交网络、路线图和电路图等。图的遍历和最短路径算法是常见的图算法。

🚀一、堆

🔎1.基本思想

堆是一种基于完全二叉树的数据结构,它分为大根堆和小根堆两种,基本思想如下:

  1. 大根堆:每个节点的值都大于或等于其左右子节点的值,最大值在堆的根节点上。

  2. 小根堆:每个节点的值都小于或等于其左右子节点的值,最小值在堆的根节点上。

  3. 堆的插入:将元素插入堆的末尾,然后调整堆结构,使其保持堆的性质。

  4. 堆的删除:将堆的根节点删除,然后将堆的末尾节点移动到根节点,然后再次调整堆结构。

  5. 堆排序:将待排序的数组建立成堆,然后重复执行删除堆顶元素并调整堆结构的过程,直到堆为空,就可以得到一个有序的序列。

  6. 堆的应用:堆可以用来解决一些优先级相关的问题,比如优先级队列、求TopK等。

在这里插入图片描述

🔎2.堆的常用操作

public class heap {
    public void testPush(PriorityQueue<int, int> heap, int val) {
        heap.Enqueue(val, val); // 元素入堆
        Console.WriteLine($"\n元素 {val} 入堆后\n");
        PrintUtil.PrintHeap(heap);
    }

    public void testPop(PriorityQueue<int, int> heap) {
        int val = heap.Dequeue(); // 堆顶元素出堆
        Console.WriteLine($"\n堆顶元素 {val} 出堆后\n");
        PrintUtil.PrintHeap(heap);
    }
    [Test]
    public void Test() {
        /* 初始化堆 */
        // 初始化小顶堆
        PriorityQueue<int, int> minHeap = new PriorityQueue<int, int>();
        // 初始化大顶堆(使用 lambda 表达式修改 Comparator 即可)
        PriorityQueue<int, int> maxHeap = new PriorityQueue<int, int>(Comparer<int>.Create((x, y) => y - x));
        Console.WriteLine("以下测试样例为大顶堆");

        /* 元素入堆 */
        testPush(maxHeap, 1);
        testPush(maxHeap, 3);
        testPush(maxHeap, 2);
        testPush(maxHeap, 5);
        testPush(maxHeap, 4);

        /* 获取堆顶元素 */
        int peek = maxHeap.Peek();
        Console.WriteLine($"堆顶元素为 {peek}");

        /* 堆顶元素出堆 */
        // 出堆元素会形成一个从大到小的序列
        testPop(maxHeap);
        testPop(maxHeap);
        testPop(maxHeap);
        testPop(maxHeap);
        testPop(maxHeap);

        /* 获取堆大小 */
        int size = maxHeap.Count;
        Console.WriteLine($"堆元素数量为 {size}");

        /* 判断堆是否为空 */
        bool isEmpty = maxHeap.Count == 0;
        Console.WriteLine($"堆是否为空 {isEmpty}");

        /* 输入列表并建堆 */
        var list = new int[] { 1, 3, 2, 5, 4 };
        minHeap = new PriorityQueue<int, int>(list.Select(x => (x, x)));
        Console.WriteLine("输入列表并建立小顶堆后");
        PrintUtil.PrintHeap(minHeap);
    }
}

🔎3.堆的实现

/* 大顶堆 */
class MaxHeap {
    // 使用列表而非数组,这样无须考虑扩容问题
    private readonly List<int> maxHeap;

    /* 构造函数,建立空堆 */
    public MaxHeap() {
        maxHeap = new List<int>();
    }

    /* 构造函数,根据输入列表建堆 */
    public MaxHeap(IEnumerable<int> nums) {
        // 将列表元素原封不动添加进堆
        maxHeap = new List<int>(nums);
        // 堆化除叶节点以外的其他所有节点
        var size = parent(this.size() - 1);
        for (int i = size; i >= 0; i--) {
            siftDown(i);
        }
    }

    /* 获取左子节点索引 */
    int left(int i) {
        return 2 * i + 1;
    }

    /* 获取右子节点索引 */
    int right(int i) {
        return 2 * i + 2;
    }

    /* 获取父节点索引 */
    int parent(int i) {
        return (i - 1) / 2; // 向下整除
    }

    /* 访问堆顶元素 */
    public int peek() {
        return maxHeap[0];
    }

    /* 元素入堆 */
    public void push(int val) {
        // 添加节点
        maxHeap.Add(val);
        // 从底至顶堆化
        siftUp(size() - 1);
    }

    /* 获取堆大小 */
    public int size() {
        return maxHeap.Count;
    }

    /* 判断堆是否为空 */
    public bool isEmpty() {
        return size() == 0;
    }

    /* 从节点 i 开始,从底至顶堆化 */
    void siftUp(int i) {
        while (true) {
            // 获取节点 i 的父节点
            int p = parent(i);
            // 若“越过根节点”或“节点无须修复”,则结束堆化
            if (p < 0 || maxHeap[i] <= maxHeap[p])
                break;
            // 交换两节点
            swap(i, p);
            // 循环向上堆化
            i = p;
        }
    }

    /* 元素出堆 */
    public int pop() {
        // 判空处理
        if (isEmpty())
            throw new IndexOutOfRangeException();
        // 交换根节点与最右叶节点(即交换首元素与尾元素)
        swap(0, size() - 1);
        // 删除节点
        int val = maxHeap.Last();
        maxHeap.RemoveAt(size() - 1);
        // 从顶至底堆化
        siftDown(0);
        // 返回堆顶元素
        return val;
    }

    /* 从节点 i 开始,从顶至底堆化 */
    void siftDown(int i) {
        while (true) {
            // 判断节点 i, l, r 中值最大的节点,记为 ma
            int l = left(i), r = right(i), ma = i;
            if (l < size() && maxHeap[l] > maxHeap[ma])
                ma = l;
            if (r < size() && maxHeap[r] > maxHeap[ma])
                ma = r;
            // 若“节点 i 最大”或“越过叶节点”,则结束堆化
            if (ma == i) break;
            // 交换两节点
            swap(i, ma);
            // 循环向下堆化
            i = ma;
        }
    }

    /* 交换元素 */
    void swap(int i, int p) {
        (maxHeap[i], maxHeap[p]) = (maxHeap[p], maxHeap[i]);
    }

    /* 打印堆(二叉树) */
    public void print() {
        var queue = new Queue<int>(maxHeap);
        PrintUtil.PrintHeap(queue);
    }
}

public class my_heap {
    [Test]
    public void Test() {
        /* 初始化大顶堆 */
        MaxHeap maxHeap = new MaxHeap(new int[] { 9, 8, 6, 6, 7, 5, 2, 1, 4, 3, 6, 2 });
        Console.WriteLine("\n输入列表并建堆后");
        maxHeap.print();

        /* 获取堆顶元素 */
        int peek = maxHeap.peek();
        Console.WriteLine($"堆顶元素为 {peek}");

        /* 元素入堆 */
        int val = 7;
        maxHeap.push(val);
        Console.WriteLine($"元素 {val} 入堆后");
        maxHeap.print();

        /* 堆顶元素出堆 */
        peek = maxHeap.pop();
        Console.WriteLine($"堆顶元素 {peek} 出堆后");
        maxHeap.print();

        /* 获取堆大小 */
        int size = maxHeap.size();
        Console.WriteLine($"堆元素数量为 {size}");

        /* 判断堆是否为空 */
        bool isEmpty = maxHeap.isEmpty();
        Console.WriteLine($"堆是否为空 {isEmpty}");
    }
}

在这里插入图片描述

🔎4.建堆操作

在堆排序中,建堆是指将一个无序的序列变为一个堆(binary heap)。建堆操作的时间复杂度为O(n),是堆排序的第一步。

堆是一种完全二叉树,其中每个节点的值都大于或等于其左右子节点的值,称为大根堆(max heap);或者每个节点的值都小于或等于其左右子节点的值,称为小根堆(min heap)。

建堆的过程就是将无序序列按照堆的性质调整为一个堆的过程。在建堆的过程中,从最后一个非叶子节点(叶子节点的父节点)开始,依次向上调整堆,对于每个节点,比较其与左右子节点的大小,将最大/最小的节点作为父节点。如果当前节点被交换,继续向下调整该节点,重复以上步骤,直到所有节点都满足堆的性质。

建堆操作的时间复杂度为O(n),因为只需要调整非叶子节点,即n/2个节点。

在这里插入图片描述

🔎5.Top-K 问题

堆是一种完全二叉树,满足堆序性质:每个节点的值都大于等于(或小于等于)其左右子节点的值。堆的Top-K问题即为从一个未排序的数组中找出前K个最大(或最小)的元素。

解决堆的Top-K问题的基本思路是维护一个大小为K的小(或大)根堆,遍历数组时将元素与小(或大)根堆堆顶元素比较,若大于(或小于)堆顶元素,则将堆顶元素弹出并将该元素加入堆中。遍历完成后,堆中保存的即为前K个最大(或最小)的元素。

具体实现分为两种:

1.堆排序法:使用堆排序的思想,构建一个小根堆,然后将未排序的元素加入堆中,并弹出堆顶元素直至堆大小为K,最后堆中的元素即为前K个最大的元素。

2.快速选择法:采用快速排序的思想,对数组进行划分,使得左边的数都比右边的数小,然后根据K的大小判断继续在左半边或右半边进行划分,直到找到前K个最大的数。

🦋5.1 遍历选择

在这里插入图片描述

🦋5.2 排序

在这里插入图片描述

🦋5.3 堆

/* 基于堆查找数组中最大的 k 个元素 */
using NUnit.Framework;

static PriorityQueue<int, int> topKHeap(int[] nums, int k)
{
    PriorityQueue<int, int> heap = new PriorityQueue<int, int>();
    // 将数组的前 k 个元素入堆
    for (int i = 0; i < k; i++)
    {
        heap.Enqueue(nums[i], nums[i]);
    }
    // 从第 k+1 个元素开始,保持堆的长度为 k
    for (int i = k; i < nums.Length; i++)
    {
        // 若当前元素大于堆顶元素,则将堆顶元素出堆、当前元素入堆
        if (nums[i] > heap.Peek())
        {
            heap.Dequeue();
            heap.Enqueue(nums[i], nums[i]);
        }
    }
    return heap;
}

int[] nums = { 1, 7, 6, 3, 2,8,9 };
int k = 3;
PriorityQueue<int, int> res = topKHeap(nums, k);
Console.WriteLine("最大的 " + k + " 个元素为");

在这里插入图片描述

在这里插入图片描述

🔎6.优点和缺点

堆(Heap)是一种完全二叉树结构,同时满足堆序性质(Heap property),即父节点的值永远小于或大于子节点的值。堆在数据结构中具有以下优点和缺点:

优点:

  1. 快速找到最值:堆是一种优秀的数据结构,可以快速找到最值。在最小堆中,根节点总是存储最小元素;在最大堆中,根节点总是存储最大元素。这使得堆非常适合实现优先队列。

  2. 插入和删除元素的效率高:堆的插入和删除元素的时间复杂度通常为O(log n)。这是因为堆是一棵完全二叉树,插入和删除操作只需对树进行最多O(log n)次比较和交换即可完成。

  3. 可以高效地处理动态数据集合:堆能够高效地处理动态数据集合,即在元素数量不断变化的情况下,能够快速地找到最值。

缺点:
4. 不支持查找任意元素:虽然堆可以快速找到最值,但是如果需要查找任意元素,则需要对所有节点进行遍历,时间复杂度为O(n)。

  1. 不支持快速修改元素:当堆中某个元素值发生变化时,需要重新调整堆以维持堆序性质,这通常需要O(n)的时间复杂度。

  2. 无法保证结构平衡:堆不像平衡二叉树那样能够保证结构平衡,可能会导致某些操作的最坏时间复杂度较高。例如,在极端情况下,堆可能退化为一条链表,导致插入和删除操作的时间复杂度为O(n)。

🔎7.应用场景

堆是一种基于完全二叉树的数据结构,在实际应用中有很多应用场景,以下是一些常见的应用场景:

1.堆排序:堆排序是一种高效的排序算法,利用堆的性质实现时间复杂度为O(nlogn)的排序。

2.优先队列:堆可以用来实现优先队列,优先队列可以在O(logn)时间内找到最小或最大元素。

3.求top k问题:如求一组数据中前k大或前k小的数据,可以使用堆来实现。

4.求中位数:使用堆可以在O(logn)时间内求出一组数据的中位数。

5.图搜索的最短路径算法:如Dijkstra算法和Prim算法,都需要使用堆来实现优先队列。

总之,堆是一种非常有用的数据结构,能够在许多应用场景中发挥重要作用。


🚀感谢:给读者的一封信

亲爱的读者,

我在这篇文章中投入了大量的心血和时间,希望为您提供有价值的内容。这篇文章包含了深入的研究和个人经验,我相信这些信息对您非常有帮助。

如果您觉得这篇文章对您有所帮助,我诚恳地请求您考虑赞赏1元钱的支持。这个金额不会对您的财务状况造成负担,但它会对我继续创作高质量的内容产生积极的影响。

我之所以写这篇文章,是因为我热爱分享有用的知识和见解。您的支持将帮助我继续这个使命,也鼓励我花更多的时间和精力创作更多有价值的内容。

如果您愿意支持我的创作,请扫描下面二维码,您的支持将不胜感激。同时,如果您有任何反馈或建议,也欢迎与我分享。

在这里插入图片描述

再次感谢您的阅读和支持!

最诚挚的问候, “愚公搬代码”

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。