【C++】STL——容器适配器priority_queue(优先级队列)详解 及 仿函数的介绍和使用

举报
YIN_尹 发表于 2023/09/25 21:44:35 2023/09/25
【摘要】 这篇文章我们接着上一篇的内容,再来学一个STL里的容器适配器——priority_queue(优先级队列)1. priority_queue的介绍和使用1.1 priority_queue的介绍我们上一篇文章学了queue(队列),那优先级队列也是在里面的:和queue一样,priority_queue也是一个容器适配器,那他和queue有什么区别呢?我们一起来认识一下priority_qu...

这篇文章我们接着上一篇的内容,再来学一个STL里的容器适配器——priority_queue(优先级队列)

1. priority_queue的介绍和使用

1.1 priority_queue的介绍

我们上一篇文章学了queue(队列),那优先级队列也是在里面的:

b2fc210af63b47aca2c9990c14cf40e9.png

queue一样,priority_queue也是一个容器适配器,那他和queue有什么区别呢?我们一起来认识一下priority_queue

3a3e16baec9749ef84ae77cc769cce72.png

优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。

此上下文类似于堆,在堆中可以随时插入元素,并且只能检索最大堆元素(优先队列中位于顶部的元素)。

优先队列被实现为容器适配器,容器适配器即将特定容器类封装作为其底层容器类,queue提供一组特定的成员函数来访问其元素。元素从特定容器的“尾部”弹出,其称为优先队列的顶部。

底层容器可以是任何标准容器类模板,也可以是其他特定设计的容器类。容器应该可以通过随机访问迭代器访问,并支持以下操作:

empty():检测容器是否为空

size():返回容器中有效元素个数

front():返回容器中第一个元素的引用

push_back():在容器尾部插入元素

标准容器类vector和deque满足这些需求。默认情况下,如果没有为特定的priority_queue类实例化指定容器类,则使用vector。

需要支持随机访问迭代器,以便始终在内部保持堆结构。容器适配器通过在需要时自动调用算法函数make_heap、push_heap和pop_heap来自动完成此操作。

9af0f14536ae4c0a85658a251f6fe6e3.png

首先我们看到它的默认底层容器不再是deque了,而是vector

e98ba3e702b047279e458377349ba919.png

当然不是只能用vector,只要支持这些操作的容器都可以,另外我们看到他对容器的迭代器是有要求的,要求得是随机迭代器random access iterators 

那现在问一下大家,听到优先级队列有没有感到有点熟悉?

或者我们可以来看一下它的成员函数:

4289244190be4441a706dd43310d3383.png

有没有感觉有点熟悉?

🆗,这不就是我们之前数据结构学过的堆嘛(如果大家之前没有了解过堆或者遗忘了可以去看一下之前的文章)

5da834e137e849c1a07cb04b80693350.png

3cacc9aa413c488f8d7cb3c5d5b91bff.png

我们在讲解堆的时候也提到过,优先级队列就是堆。

1.2 priority_queue的使用

优先级队列默认使用vector作为其底层存储数据的容器,在vector上又使用了堆算法将vector中元素构造成堆的结构,因此priority_queue就是堆,所有需要用到堆的位置,都可以考虑使用priority_queue。注意:默认情况下priority_queue是大堆。

3aedb16cb00d4f3e8043f5f764e608c9.png

经过数据结构阶段的学习,这些常见的接口我们是可以直接上手使用的,其它的接口如果后续用到大家可以自己查阅文档,这里就不展开介绍了。

【注意】

默认情况下,priority_queue是大堆(大的优先级高)

我们来验证一下:

int main()
{
    priority_queue<int> q;
    q.push(1);
    q.push(0);
    q.push(5);
    q.push(2);
    q.push(1);
    q.push(7);
    while (!q.empty())
    {
        cout << q.top() << " ";
        q.pop();
    }
    cout << endl;

    return 0;
}

看一下结果:

9bfdb5841b6b4a36aa82e7be65325e68.png

那如果我们想使用小堆怎么做呢?

🆗,这时候就要用到一个东西叫做仿函数

怎么做呢?40a76d94b824466d8f6d747fa2045db8.png

我们要多传一个参数,即对应第三个模板参数。

不过呢,因为Compare 这个模板参数被设计在了第三个位置,所以我们要传第三个的话,也要传一下第二个。

那我们现在优先级队列里面放的是整型,就可以传一个greater,让它变成大堆:c8548e44fff44a54a8c93f47c3ad8701.png

int main()
{
    priority_queue<int, vector<int>, greater<int>> q;
    q.push(1);
    q.push(0);
    q.push(5);
    q.push(2);
    q.push(1);
    q.push(7);
    while (!q.empty())
    {
        cout << q.top() << " ";
        q.pop();
    }
    cout << endl;

    return 0;
}

那这个地方大家可能有这样的疑惑:

543a96aa46704de283c855e8dcbe23ba.png

我们看到第三个模板参数给的缺省值是less ,less不是较小的意思嘛,但是默认对应的却是大堆;而我们把它变成小堆传的是 greater ,而greater却是较大的意思。

那除此之外:

e50b1fb63c2e4a8ebad7761b20d10269.png

第二个模板参数是不是放到第三个位置比较好一点啊,因为默认容器我们一般不会去动它,但是第三个参数控制这个优先级,我们可能需要经常换,那这样我们传递三个参数的时候就必须把第二个也传上,但第二个一般我们不需要动,用默认的就是比较好的。

所以这个地方感觉设计的好像不是很好。

1.2.1 仿函数介绍

然后我们来解释一下这里用到的 greater是个啥?

那我们先来认识一个东西——仿函数

4387dc9d08ca4b62a9845c0bbf2bb326.png

他也是STL的六大组件之一。

那什么是仿函数呢?

image.png

🆗,仿函数(又称函数对象)其实就是一个类重载了(),使得这个类的使用看上去像一个函数。

举个栗子:

我们来写一个判断小于的仿函数,怎么做呢?

定义一个类,重载一下()就行了,函数体的实现根据我们的需求去写:

17131da828024d1d8f4d347361eb601a.png

ps:也可以用class,区别只是它的的默认访问限定符不同。

那我们来用一下这个仿函数:

23c3524a2d8a40499a744d638b07775b.png

1小于2为真,所以打印结果为1。

🆗,那如果我们只看这一行:

f1bb25bc59314ded972827c46389db44.png

这是不是就像是一个函数调用啊。

当然它本质是去调用了类里面的operator()。

那要告诉大家的是仿函数它的作用和价值还是很大的,不过我们现在还不能很好的体会到。

C++其实本质搞出这个东西是因为函数指针太复杂了,而仿函数在很多场景能达到一个替代函数指针的作用。

就比如我们这里优先级队列控制这个大堆小堆,我们之前实现过堆,我们知道控制大堆小堆其实就是就是控制里面元素的比较方式不同。

那我们C语言解决这样的问题是不是就是去传一个函数指针嘛,就比如C语言里面那个qsort函数:


它是不是就是通过传递一个函数指针来控制元素的比较方式啊。

而C++的sort就可以传仿函数去控制:

1909a46c8eef4f0c887a1f17bc8eac96.png

当然不是只能传仿函数,我们看到它给的是一个模板。

那我们上面用到的greater包括默认给的less其实就是库里面提供的仿函数。

当然我们看到它可以写成这样greater,那库里面的其实是实现成模板了。

529741bb25bf410c92924654c23390d8.png

而我们刚才这样写的是只针对整型,如果像比较任意类型我们就可以将他实现成模板:e01e5b3a983c428da9356d84778ec612.png

1.2.2 在OJ中的使用:数组中的第K个最大元素

下面我们来看一个题:数组中的第K个最大元素

0995df63b4ad452cb4593a7e1997e99f.png

思路1:排序

那这道题我们最容易想到的方法应该就是堆数组排个序,如果数组是有序的,那我们想拿到第k个最大的元素,不是轻而易举嘛。

那直接用sort排序就行了,要注意sort默认是升序。

class Solution {
public:
    int findKthLargest(vector<int>& nums, int k) {
        sort(nums.begin(),nums.end());
        return nums[nums.size()-k];
    }
};

b91d92f720d64179a0c79bfaeb4358db.png

但是题目要求时间复杂度为 O(n) ,那我们还有没有其它更好的算法呢?


思路2:priority_queue

🆗,我们是不是可以考虑使用优先级队列(堆)来搞啊。


那我们现在要使用优先级队列的话,还需要自己写吗?

是不是可以直接用啊——priority_queue。

怎么做呢?

那我们知道它默认是大堆,那我们就用大堆,首先我们拿数组的数据建堆,怎么建?

9459916a066e4832a9abd7337cb8cead.png

我们可以选择这个迭代器区间的这个构造函数。

拿建好堆之后,默认是大堆,那我们就可以pop k-1次,然后堆顶的那个数据不就是第K个最大的数了嘛。

class Solution {
public:
    int findKthLargest(vector<int>& nums, int k) {
        priority_queue<int> q(nums.begin(),nums.end());
        while(--k)
        {
            q.pop();
        }
        return q.top();
    }
};

f5d8f7b5910f4db79352b479fa0b9b6e.png

那这种写法的时间复杂度应该是多少呢?

🆗,应该是O(N+k*logN),大家可以自己算一下,这里建堆包括pop的时间复杂度我们之前二叉树的文章也讲过。


那还要其它方法吗?


思路3:TOP-K思想

我们还可以考虑用TOP-K的思想去解决这道题:

首先我们来复习一下TOP-K(时间复杂度是O(N*log2K))的思想,这也是我们之前文章讲过的内容:

c395b3f3825f475cad7038e1cd2ea21c.png

那这道题我们可以怎么做呢?


我们是不是可以先拿前K个数建堆,这里我们想要获取最大得前K个,应该建小堆,然后一个个比较,不符合大小关系就调整,最终堆中得数据就是最大的前K个,那此时堆顶得数据不就是我们要的数嘛。

当然我们现在用的是库里面的priority_queue,没有向下调整这些接口,而且top返回的也是引用,也不能直接替换堆顶数据,所以我们可以先pop,然后再push。

class Solution {
public:
    int findKthLargest(vector<int>& nums, int k) {
        //建小堆
        priority_queue<int,vector<int>,greater<int>> q(nums.begin(),nums.begin()+k);
        for(size_t i=k;i<nums.size();++i)
        {
            if(nums[i]>q.top())
            {
                q.pop();
                q.push(nums[i]);
            }
        }
        return q.top();
    }
};

b8bc54162ae44c9b95b1cf02a6d4671b.png

2. priority_queue的模拟实现

那我们接下来就对priority_queue进行一个模拟实现:

那我们还是按照库里面的来,把它实现成一个容器适配器的类模板

1ef26efe51594bd3af55d6b9088a0775.png

那它的结构就是这样的,第三个模板参数即比较的仿函数我们放到后面再搞。


2.1 核心接口

然后先我们来实现一下它的几个核心的接口:


首先写一下push:

那我们再来复习一下,堆的push怎么搞的?

🆗,堆的逻辑结构是一个完全二叉树,其物理结构,即底层实际的存储结构是一个一维数组(我们这里使用的是vector),我们push的时候先尾插一个数据,然后是不是要对它进行向上调整啊,确保插入新数据之后它还是一个堆。

1de62c78c21e41d79d95a03e3661d907.png

39928b4942d94d1b84e4dabce95caa48.png

那我们待会还要实现一下向上调整。

然后pop,再来回忆一下,堆的删除怎么搞?

🆗,是不是将堆顶的数据跟最后一个数据进行交换,然后删除数组最后一个数据,再进行向下调整啊。

image.png

c056135455ed461b987ac5205bccfbad.png

当然待会我们也要写一下向下调整。

然后top,那就简单了:

image.png

然后还有size:

e5ad62f02b9b49939f6a4d027d843c07.png

empty:

3a05a7303d924ff0bc086264ac1483d4.png

然后我们回过头来把向上调整实现一下。

2.2 向上调整

向上调整怎么搞(这里我们默认先按大堆来搞),回忆一下:

怎么调?

首先进行向上调整要保证之前的数据必须是一个堆。

然后看插入的数据满足不满足对应的大小关系,不满足就进行交换,直到满足为止。

100这个结点是不是大于它的父亲啊,那大堆中大的才应该做父亲,所以呢,就应该交换100和30这两个结点。

e3bc20ef1468493babd96b8b406d36e1.png

那调整一次就完了吗?

如果调整一次后满足了,那确实就结束了,但是现在是不是还不满足是一个大堆啊,那就要继续调整。

100还是大于它的父亲70:

1d965f2daed84fc99bd9d788469ec6f5.png

所以:


这个调整应该是一个循环的过程,那循环什么时候结束呢?

当调整到所有结点都满足大堆或小堆的关系时,或者需要一直调整,当插入的新数据一直交换到成为根结点时就结束了。

当然如果插入的数据直接满足,那一次也不需要调整。


我们把这种从下往上调整的算法叫做向上调整。

52d3ea693ef74e27b7d03929d798d1cb.png

思路还是和我们之前讲的一样。

void adjust_up(size_t child)
{
    size_t parent = (child - 1) / 2;
    while (child > 0)
    {
        if (_con[child] > _con[parent])
        {
            swap(_con[child], _con[parent]);
            child = parent;
            parent = (child - 1) / 2;
        }
        else
            break;
    }
}

2.3 向下调整

然后向下调整呢?

如何调整:

其实思路跟向上调整一样,只不过这次我们是从上往下,不符合关系的进行交换,直至使它成为一个新的大堆。

我们开始调整:

55a73e10951c4b099f605f77372fe26e.png

18在这里肯定不合适,它比自己的孩子还要小,所以要交换。

和谁交换?

34可以吗,34换到堆顶,它是不是还撑不住啊。

所以我们要选择它的孩子中大的那一个进行交换。

那在这里就是49。

ecfb57677ea241c9a68272d175a97f79.png

那现在18坐到原来49的位置,现在这个位置怎么样?

🆗,18是不是还是坐不稳啊。

还得进行交换。

选择18的孩子中大的那一个交换:

b26c0d9ea8e7459997c6c575a219ae8d.png

现在是不是就可以了啊。

我们交换了两次完成了,所以这还是一个循环的过程。

那这个循环的交换过程应该什么时候停止?

是不是当交换到满足大小关系或者一直交换,直到自己成为叶子结点时结束啊。

void adjust_down(size_t parent)
{
    size_t child = parent * 2 + 1;
    while (child < _con.size())
    {
        //得出较大(小堆则较小)的那个孩子
        if (child + 1 < _con.size()
            && _con[child] < _con[child + 1])
            child++;

        if (_con[parent] < _con[child])
        {
            swap(_con[parent], _con[child]);
            parent = child;
            child = parent * 2 + 1;
        }
        else
            break;
    }
}

那我们来测试一下我们写的priority_queue

99abc65a43e04e52ae0c98d05c58b059.png

没问题。

2.4 仿函数less和greater模拟实现及使用

那然后呢我们把第三个模板参数加上,把仿函数实现一下:

我们刚才实现的是大堆,那我们想要小堆怎么办?

我们之前数据结构学习堆的时候就知道了,是不是把向上向下调整里面的比较的大于号换成小于就行了啊

35f35ee307b6400fa93476c4ca200aa8.png

但是,经过我们上面的学习以及对仿函数的介绍,我们是不是可以通过传仿函数去控制啊。

所以我们要增加一个模板参数,然后通过两个仿函数去控制比较大于还是比较小于,以此控制大堆还是小堆。

aeefea2bfb6f47b781a57d18542f14db.png

那怎么使用第三个参数呢?

我们这里和库里面保持一样,默认第三个参数class Compare的缺省值是仿函数less,对应的是大堆。

那这样做就可以了:e28f2ea913fb49ed9e8f0ffa4a6bd85e.png

82d6f125634c4e1bad9c7eeb666a7ab7.png

那这下我们就可以通过仿函数去控制大小堆 了。

来试一下:

现在默认用less是大堆:5a062bac0f56490fbeeed4665538c1f2.png

那想要小堆怎么办?用greater就行了:0c3b045581694d30be20d463a1b04871.png

🆗,就好了,大家理解一下这个过程:

00efb96982914db79ae94bf9b7f6f180.png


当然也可以这样写c08d4457c7b14838b1185514b8dfab45.png

就是用匿名对象嘛。

3. priority_queue 存放自定义类型数据

下面我们再来研究一个问题:

class Date
{
public:
    Date(int year = 1900, int month = 1, int day = 1)
        : _year(year)
        , _month(month)
        , _day(day)
    {}
    bool operator<(const Date& d)const
    {
        return (_year < d._year) ||
            (_year == d._year && _month < d._month) ||
            (_year == d._year && _month == d._month && _day < d._day);
    }
    bool operator>(const Date& d)const
    {
        return (_year > d._year) ||
            (_year == d._year && _month > d._month) ||
            (_year == d._year && _month == d._month && _day > d._day);
    }
    friend ostream& operator<<(ostream& _cout, const Date& d);
private:
    int _year;
    int _month;
    int _day;
};
ostream& operator<<(ostream& _cout, const Date& d)
{
    _cout << d._year << "-" << d._month << "-" << d._day;
    return _cout;
}

现在有一个日期类,并重载了<<><

那现在呢,我想用我们的priority_queue(优先级队列)去存我们的自定义类型数据——日期类的变量,可以吗?

我们来试一下:

67c47779b2f3422ea445d3731f801453.png

没问题,可以,现在默认是大堆嘛,所以top是最大的那个日期。

如果换成小堆:

b9d502c20bbb4a809e649fccaaa609d7.png

那堆顶就是最小的。

那这里为什么可以,其实是因为我们的日期类重载了><,因为它里面建堆的过程是不是要进行比较啊。86e9c4db3196478d944cfa24fbba08d8.png

如果没有><的重载就不行了。

所以:

如果在priority_queue中放自定义类型的数据,用户需要在自定义类型中提供> 或者< 的重载

4. 拓展

🆗,再来看,如果是这样呢:ffa19b6f9ff9444f9f32c61058868c4a.png

现在它里面存的是Date* 的指针,我们来看下结果:


ff04a0d63e81432eb39ea9ebb9488a90.png

好像没什么问题,不过结果好像不对。

而且:9569296570244c588ec7607119740f37.png

我们重新编译一下,再运行

59d156da104b4cf789cf2ac0af8e8d56.png

哎呀,怎么回事。

c49cff3bf6014aa5baafb90113f57b87.png

怎么结果会变化啊,为什么呢?


🆗,原因在于:


我们现在里面存的是啥,是Date* 的指针变量,那指针能比较大小嘛?

当然也可以,它是内置类型,指针比较大小的话就是去比较对应地址的大小嘛。

但是这里我们new出来的地址,它们的大小关系可认为是随机的,所以虽然可以比,但是这结果是我们想要的嘛,是不是不是啊。

我们想要的的是不是去比较它们指针指向的Date类对象的大小啊。


指针是内置类型,我们也没法重载它的比较操作,那怎么办呢?


我们是不是可以使用仿函数来解决啊。

5c1ccf66dd5547f3b4cd7a8807ad15b8.png


然后我们再运行:

52d9594b862b451e8e288718f2c98477.png

63a3a7ad73e84df09a1e34d78c6a0703.png

就会发现结果正确并且不会变化了。

那如果要小堆,很简单,再搞一个仿函数:

6b4578f5ffab41a896ee39b0252573b0.png

就可以了。

所以这里我们看到有了仿函数,即使是内置类型,这里我们也可以去控制它的比较方式。

这篇文章的内容就先到这里,欢迎大家指正!!!

5caaf0b73e264f3f97e0cbf11d955533.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。