Lv.2
xxlla
更多个人资料
90
成长值
0
关注
1
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
90
0
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
Elasticsearch实例cpu使用率高及查找频繁执行的任务问题排查思路
一. 问题背景与现象1.某局点Elasticsearch集群,单个ES数据实例cpu使用率持续很高,导致客户入库业务持续阻塞如下图,单实例cpu使用率达到了5106%二.原因分析1.看是哪类任务导致实例cpu使用率高(写入还是查询)curl -XGET --tlsv1.2 --negotiate -k -u : "https://127.0.0.1:24100/_cat/tasks?"|gr...
Elasticsearch
xxlla
2023-09-04 20:14:48
3396
0
0
2023-09-04 20:14:48
999+
0
0
HDFS文件错误导致上传到HDFS失败
适用版本6.5.x。问题背景与现象用hadoop dfs -put把本地文件拷贝到HDFS上,有报错。上传部分文件后,报错失败,从NameNode原生页面看,临时文件大小不再变化。原因分析查看NameNode日志“/var/log/Bigdata/hdfs/nn/hadoop-omm-namenode-主机名.log”,发现该文件一直在被尝试写,直到最终失败。2015-07-13 10:05...
Hadoop
xxlla
2022-04-23 16:40:53
2191
0
0
2022-04-23 16:40:53
999+
0
0
HDFS客户端写文件close失败
适用版本6.5.x。问题背景与现象客户端写文件close失败,客户端提示数据块没有足够副本数。日志如下:2015-05-27 19:00:52.811 [pool-2-thread-3] ERROR: /tsp/nedata/collect/UGW/ugwufdr/20150527/10/6_20150527105000_20150527105500_SR5S14_1432723806338...
Hadoop
xxlla
2022-04-23 16:39:00
2558
0
0
2022-04-23 16:39:00
999+
0
0
HDFS 文件最大打开句柄数设置太小导致读写文件异常
适用版本6.5.x。问题背景与现象文件最大打开句柄数设置太小,导致文件句柄不足。写文件到HDFS很慢,或者写文件失败。原因分析DataNode日志“/var/log/Bigdata/hdfs/dn/hadoop-omm-datanode-XXX.log”,存在异常提示java.io.IOException: Too many open files。2016-05-19 17:18:59,12...
Hadoop
xxlla
2022-04-23 16:36:48
2510
0
0
2022-04-23 16:36:48
999+
0
0
HDFS DataNode的数据线程不足
适用版本6.5.x。问题背景与现象当用户在HDFS上执行写操作时,出现“Failed to place enough replicas:expected…”信息。原因分析DataNode的数据接受器不可用。此时DataNode会有如下日志:2016-03-17 18:51:44,721 | WARN | org.apache.hadoop.hdfs.server.datanode.DataX...
Hadoop
xxlla
2022-04-23 16:35:02
1649
0
0
2022-04-23 16:35:02
999+
0
0
HDFS备NameNode长期故障,如何客户端手动checkpoint
适用版本6.5.x。问题背景与现象在备NameNode长期异常的情况下,会积攒大量的editlog,此时如果重启HDFS或者主NameNode,主NameNode会读取大量的未合并的editlog,导致耗时启动较长,甚至启动失败。原因分析备NameNode会周期性做合并editlog,生成fsimage文件的过程叫做checkpoint。备NameNode在新生成fsimage后,会将fsi...
Hadoop
xxlla
2022-04-23 16:33:33
2102
0
0
2022-04-23 16:33:33
999+
0
0
HDFS异常下电后,DataNode实例状态异常(文件损坏)
适用版本6.5.x。问题背景与现象DataNode 实例状态异常,查看日志发现无法访问磁盘上某些文件。使用“ll 文件名”命令查看文件的属性为“??”。其他非HDFS文件读取失败,文件属性为“??”也可以参考此案例执行。可能原因对应DataNode节点的磁盘有坏道。原因分析进入服务实例,确认故障的节点使用PuTTY登录该节点,执行如下命令(这里/export/data1目录是DataNode...
Hadoop
xxlla
2022-04-23 16:31:08
1612
0
0
2022-04-23 16:31:08
999+
0
0
网卡或光模块出现问题,导致单主机ES实例频繁退出集群
1.1 问题背景与现象集群频繁上报“Elasticsearch实例存在down状态的主分片”告警,在后台查询ES集群健康状态:curl -XGET --tlsv1.2 --negotiate -k -u : "https://ip:port/_cluster/health?pretty"当前集群共131个ES实例,多次查询ES健康状态,number_of_nodes数量在127-131之间...
Elasticsearch
xxlla
2021-04-15 15:06:27
3143
0
0
2021-04-15 15:06:27
999+
0
0
ES查询内核流程
1 概述 ES查询分为GET和SEARCH两类,GET查询指定_index,_type,_id,从正排索引中获取指定Doc。SEARCH查询不指定_id,根据关键字从倒排索引中获取内容。以下主要分析SEARCH过程:(1) SEARCH过程分为两个阶段:Query和Fetch。(2) SEARCH过程涉及两类节点:协调节点和数据节点。Query阶段客户端将请求发送给协调...
Elasticsearch
xxlla
2020-11-07 14:49:54
3639
0
0
2020-11-07 14:49:54
999+
0
0
ES写入内核流程
1 概述 在ES中,写入单个文档的请求称为Index请求,批量写入的请求称为Bulk请求。它们都使用相同的处理逻辑,被统一封装为BulkRequest。以下从源码角度分析ES的bulk请求写入流程。2 源码分析 2.1 Rest层请求转化为Transport层请求2.1.1 RestController.java1.ES会提前将处理各种http请求(...
Elasticsearch
NAT
xxlla
2020-11-07 14:41:25
3663
0
0
2020-11-07 14:41:25
999+
0
0
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注