客快物流大数据项目(八十四):Impala优化
【摘要】 Impala优化一、Impala关键配置分配给此角色的内存软限制,由 Linux 内核强制执行。当达到此限制时,内核将只在主机面临内存压力时回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。分配给此角色的内存硬限制,由 Linux 内核强制执行。当达到此限制时,内核将会回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。Impala Daemon 服务的...
Impala优化
一、Impala关键配置
分配给此角色的内存软限制,由 Linux 内核强制执行。当达到此限制时,内核将只在主机面
临内存压力时回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。
分配给此角色的内存硬限制,由 Linux 内核强制执行。当达到此限制时,内核将会回收已分
配给进程的页面。如果回收失败,内核可能会停止这些进程。
Impala Daemon 服务的内存限制(以字节为单位)。如果达到该限制,Impalad Daemon 上运
行的查询会被停止。
二、Impala查询分析
从 CM 主页进入 Impala 服务页面,点击查询按钮。
选择执行查询的时间范围,例如,昨天的上午 9 点到今天中午 12 点,使用 Impala 执行
过 SQL 查询。
选择一个查询,并点击右侧的“查询详细信息”。
“查询详细信息”中的 SQL 脚本。
“查询详细信息”中的 SQL 脚本对应的执行计划。
“查询详细信息”中的 SQL 脚本对应的查询耗时。
“查询详细信息”中的 SQL 脚本对应的查询实例。
每一个查询段实例名称,与查询计划中是一一对应的,查询段中包括总耗时、缓冲池内
存使用、入队和出队的内存和耗时开销。
三、Impala优化思路
- 查看执行计划:explain sql;
- 当SQL执行完成后, 使用profile输出底层的执行计划详细信息 :profile;
- 当SQL执行完成后,使用summary输出查询时间和占用内存信息 :summary;
- 大表和小表JOIN时,确保大表在左侧,小表在右侧( Impala 会广播小表到所有节点);
- 大表和大表JOIN时, 需要使用partitioned join。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)