参数检查(经验贴)
为了系统上线后稳定运行,从操作系统和数据库两个角度,建议检查以下参数:
- 操作系统角度:
############################################################################################
## HCS以Ruby用户登录到数据库节点
## ESL以omm用户登录到数据库节点
## 功能:获取操作系统相关的参数信息
## 参数: xxx 待补充
## 其他:需提前上传check_os_core.sh文件
############################################################################################
#!/user/bin/bash
#line 4操作系统是否在DWS兼容性清单内
echo "start: line 4 操作系统是否在DWS兼容性清单内"
cat /etc/*-release
uname -a
echo "end: line 4 操作系统是否在DWS兼容性清单内"
#line 6 网络速率检测
echo "start: line 6 网络速率检测"
su - Ruby
cd xxx
gs_check -i CheckNetSpeed -l ./check.log
#监测报告存放路径:${BIGDATA_HOME}/mppdb/wisequery/script/gspylib/inspection/output/CheckReport_xxxxxxxx.tar.gz"
echo "end: line 6 网络速率检测"
#line 10 查询集群规模
echo "start: line 10 查询集群规模"
cm_ctl query -Cvd
echo "end: line 10 查询集群规模"
#line 17 检查DN审计日志是否关闭
echo "start: line 17 检查DN审计日志是否关闭"
gs_guc check -Z datanode -N all -I all -c "audit_enabled";
echo "end: line 17 检查DN审计日志是否关闭"
#line 23 检查DN审计日志是否关闭
echo "start: line 23 检查DN审计日志是否关闭"
gs_guc check -Z cm -N all -I all -c "coordinator_heartbeat_timeout"
echo "end: line 23 检查DN审计日志是否关闭"
#line 30 检查topsql配置
echo "start: line 30 检查DN审计日志是否关闭"
gs_guc check -N all -I all -Z coordinator -Z datanode -c "enable_resource_track=on" -c "resource_track_level= query " -c "enable_resource_record=on" -c "resource_track_duration=10s" -c "enable_track_record_subsql=on" -c "resource_track_cost=0"
echo "end: line 30 检查DN审计日志是否关闭"
#line 36 检查是否配置操作系统core(每个节点都需要执行一次)
echo "start: line 36 检查DN审计日志是否关闭"
sh check.sh -s unlimited
echo "end: line 36 检查DN审计日志是否关闭"
#line 37 检查是否已安装gdb等定位分析工具
echo "start: line 37 检查DN审计日志是否关闭"
gdb --help
gstack
pg_xlogdump --help
pagehack --help
echo "end: line 37 检查DN审计日志是否关闭"
#line 38 检查gs_dbmonitor是否已部署
echo "start: line 38 检查DN审计日志是否关闭"
ps -ef | grep gs_dbmonitor
echo "end: line 38 检查DN审计日志是否关闭"
- 数据库角度:
-------------------------------------------------------------------------
-- 登录到任意一个可以以gsql登录到数据库的服务器,然后,以gsql执行。
-- 功能:获取数据库相关的参数信息
-- 参数:xxxx --待补充
--
-------------------------------------------------------------------------
--line 5 获取版本信息
\echo "------start: line 5 获取版本信息-------"
select version();
\echo "------end : line 5 获取版本信息-------"
--line 10 获取集群规模
\echo "------start: line 10 获取集群规模 -------"
select * from pgxc_node;
\echo "------end : line 10 获取集群规模 -------"
--line 11 database字符集及兼容模式
\echo "------start: line 11 database字符集及兼容模式-------"
selct * from pg_database ;
\echo "------end : line 11 database字符集及兼容模式-------"
--line 12 获取数据库时区
\echo "------start: line 12 获取数据库时区-------"
show time zone;
\echo "------end : line 12 获取数据库时区-------"
--line 13 获取默认存储模式
\echo "------start: line 13 获取默认存储模式-------"
show default_orientation;
\echo "------end : line 13 获取默认存储模式-------"
--line 19 获取max stream pool
\echo "------start: line 19 获取max stream pool-------"
show max_stream_pool;
\echo "------end : line 19 获取max stream pool-------"
--line 20 获取vacuum_freeze_min_age
\echo "------start: line 20 获取vacuum_freeze_min_age-------"
show vacuum_freeze_min_age;
show autovacuum_freeze_max_age;
\echo "------end : line 20 获取vacuum_freeze_min_age-------"
--line 21 获取plog_merge_age
\echo "------start: line 21 获取plog_merge_age-------"
show plog_merge_age;
\echo "------end : line 21 获取plog_merge_age-------"
--line 22 获取cn个数
\echo "------start: line 22 获取cn个数-------"
select * from pgxc_node;
\echo "------end : line 22 获取cn个数-------"
--line 29 获取审计日志是否打开
\echo "------start: line 29 获取审计日志是否打开-------"
show audit_enabled;
\echo "------end : line 29 获取审计日志是否打开-------"
--line 31 获取session_timeout信息
\echo "------start: line 31 获取session_timeout信息-------"
show session_timeout;
\echo "------end : line 31 获取session_timeout信息-------"
--line 32 获取statement_timeout信息
\echo "------start: line 32 获取session_timeout信息-------"
show statement_timeout;
SELECT * FROM PG_EXCEPT_RULE;
SELECT * FROM gs_respool_exception_info('respool');
\echo "------end : line 32 获取session_timeout信息-------"
--line 33 获取内存熔断参数
\echo "------start: line 33 获取内存熔断参数-------"
show query_max_mem;
SELECT * FROM gs_respool_exception_info('respool');
\echo "------end : line 33 获取内存熔断参数-------"
--line 34 配置空间熔断
\echo "------start: line 34 配置空间熔断-------"
select * from pg_user;
show sql_use_spacelimt;
show temp_file_limit;
SELECT * FROM gs_respool_exception_info('respool');
\echo "------end : line 34 配置空间熔断-------"
--line 35 获取stream数量熔断
\echo "------start: line 35 获取stream数量熔断-------"
show max_streams_per_query;
\echo "------end : line 35 获取stream数量熔断-------"
--line 50 排查是否存在1.0的表
\echo "------start: line 50 排查是否存在1.0的表-------"
select count(oid::regclass) as cnt from pg_class where reloptions::text ~ 'colversion=1.0';
\echo "------end : line 50 排查是否存在1.0的表-------"
- 点赞
- 收藏
- 关注作者
评论(0)