win10 elasticsearch安装IK中文分词器

举报
lxw1844912514 发表于 2022/03/27 00:53:45 2022/03/27
【摘要】 IK压缩包下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v6.7.0, 需要下载对应的版本 我的es:6.2.1 , 所以 分词器版本 使用IK分词器可以实现对中文分词的效果。 下载IK分词器:(Github地址:https://g...

IK压缩包下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v6.7.0

需要下载对应的版本

我的es:6.2.1 , 所以 分词器版本

使用IK分词器可以实现对中文分词的效果。
下载IK分词器:(Github地址:https://github.com/medcl/elasticsearch-analysis-ik
下载zip:解压,并将解压的文件拷贝到ES安装目录的plugins下的ik目录下

 https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v6.2.1 

ctrl+C 退出es,再次重新执行 elasticsearch.bat ,可以看到已加载插件

 

补充:

下载完成之后,上传到服务器,然后解压到elasticsearch的plugins文件夹下,然后重命名为analysis-ik

也可以先在别处解压之后,然后重命名,以下代码,每个人可能不一样,根据自己实际的来

mv elasticsearch-analysis-ik-6.6.2 elasticsearch-6.6.0/plugins/analysis-ik
 

在这里要注意层级,以下这个IKAnalyzer.cfg.xml文件和plugins文件夹的层级是这样的

/plugins/analysis-ik/config/IKAnalyzer.cfg.xml
 

然后关闭elasticsearch


  
  1. [root@localhost config]# ps -ef|grep elast
  2. elas+ 49202 1 1 18:10 pts/1 00:00:23 /usr/web/java/jdk1.8/bin/java -Xms256m -Xmx256m -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly -Des.networkaddress.cache.ttl=60 -Des.networkaddress.cache.negative.ttl=10 -XX:+AlwaysPreTouch -Xss1m -Djava.awt.headless=true -Dfile.encoding=UTF-8 -Djna.nosys=true -XX:-OmitStackTraceInFastThrow -Dio.netty.noUnsafe=true -Dio.netty.noKeySetOptimization=true -Dio.netty.recycler.maxCapacityPerThread=0 -Dlog4j.shutdownHookEnabled=false -Dlog4j2.disable.jmx=true -Djava.io.tmpdir=/tmp/elasticsearch-628240789535257481 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=data -XX:ErrorFile=logs/hs_err_pid%p.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -Xloggc:logs/gc.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=32 -XX:GCLogFileSize=64m -Des.path.home=/usr/web/elasticsearch/elasticsearch-6.6.0 -Des.path.conf=/usr/web/elasticsearch/elasticsearch-6.6.0/config -Des.distribution.flavor=default -Des.distribution.type=tar -cp /usr/web/elasticsearch/elasticsearch-6.6.0/lib/* org.elasticsearch.bootstrap.Elasticsearch -d
  3. hoi+ 49216 49202 0 18:10 pts/1 00:00:00 /usr/web/elasticsearch/elasticsearch-6.6.0/modules/x-pack-ml/platform/linux-x86_64/bin/controller
  4. root 49738 3679 0 18:37 pts/0 00:00:00 grep --color=auto elast

然后杀掉进程

kill 49202
 

然后切换到普通账号(使用root账号启动会失败)重新启动,进入elasticsearch文件目录的bin文件夹下

./elasticsearch
 

 或者后台启动

nohup ./elasticsearch &
 

如果出现以下报错

org.elasticsearch.bootstrap.StartupException: java.lang.IllegalArgumentException: Plugin [analysis-ik] was built for Elasticsearch version 6.5.0 but version 6.6.0 is running
 

问题原因

elasticsearch版本和 ik分词器版本不一致。
由于我用的elasticsearch时最新版本 6.6.0,而ik分词器master编译出来的是6.5.0

解决办法

进入插件目录的分词文件夹下 analysis-ik/ ,修改 plugin-descriptor.properties 文件中的

   改为你的elasticsearch版本号,我的是6.6.0

然后保存退出  使用非root用户重启

IK提供了两个分词算法ik_smart和ik_max_word,其中ik_smart为最少切分,ik_max_word为最细粒度划分

参考:https://www.cnblogs.com/pxblog/p/12633189.html

文章来源: blog.csdn.net,作者:lxw1844912514,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/lxw1844912514/article/details/119739906

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。