客快物流大数据项目(八十四):Impala优化

举报
Lansonli 发表于 2022/12/20 17:25:55 2022/12/20
【摘要】 ​Impala优化一、​​​​​​​Impala关键配置分配给此角色的内存软限制,由 Linux 内核强制执行。当达到此限制时,内核将只在主机面临内存压力时回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。分配给此角色的内存硬限制,由 Linux 内核强制执行。当达到此限制时,内核将会回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。Impala Daemon 服务的...

​Impala优化

一、​​​​​​​Impala关键配置

分配给此角色的内存软限制,由 Linux 内核强制执行。当达到此限制时,内核将只在主机面

临内存压力时回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。

1.png


分配给此角色的内存硬限制,由 Linux 内核强制执行。当达到此限制时,内核将会回收已分

配给进程的页面。如果回收失败,内核可能会停止这些进程。

2.png


Impala Daemon 服务的内存限制(以字节为单位)。如果达到该限制,Impalad Daemon 上运

行的查询会被停止。

3.png


二、Impala查询分析

从 CM 主页进入 Impala 服务页面,点击查询按钮。

4.png


选择执行查询的时间范围,例如,昨天的上午 9 点到今天中午 12 点,使用 Impala 执行

过 SQL 查询。

5.png


选择一个查询,并点击右侧的“查询详细信息”。

6.png


“查询详细信息”中的 SQL 脚本。

7.png


“查询详细信息”中的 SQL 脚本对应的执行计划。

8.png


“查询详细信息”中的 SQL 脚本对应的查询耗时。

9.png


“查询详细信息”中的 SQL 脚本对应的查询实例。

每一个查询段实例名称,与查询计划中是一一对应的,查询段中包括总耗时、缓冲池内

存使用、入队和出队的内存和耗时开销。

10.png


三、​​​​​​​​​​​​​​Impala优化思路

  • 查看执行计划:explain sql;
  • 当SQL执行完成后, 使用profile输出底层的执行计划详细信息 :profile;
  • 当SQL执行完成后,使用summary输出查询时间和占用内存信息 :summary;
  • 大表和小表JOIN时,确保大表在左侧,小表在右侧( Impala 会广播小表到所有节点);
  • 大表和大表JOIN时, 需要使用partitioned join。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。