内容纲要
概要描述
TDH 6.0.2 集群中 search 默认安装了 ik、mmseg 和 geo 分词器(可以通过在任意 search server 节点上执行 curl -s "localhost:9200/_cat/plugins?v"
命令查看),如下图所示:
有些情况下,这些分词器无法满足业务需求,此时我们需要一些额外的分词器。
本案例介绍一种为 TDH 集群 的 search 安装分词器的方法;
详细说明
本文以安装hanlp中文分词器为例,大致分为一下 4 步:
- 获取分词器,并改名
- 将分词器移动至 serach 的 plugins 目录
- 修改配置并将该配置文件同步至集群其他 search server 节点
- 重启 search 验证分词器生效
1、获取分词器,并改名
下载分词器插件包,上传到集群后台,解压分词器,并修改分词器名,然后给该目录赋权;
$ unzip elasticsearch-analysis-hanlp-5.2.2.zip
# 解压后是目录名为 elasticsearch,可以将其修改为更具辨识性的名字
$ mv elasticsearch analysis-hanlp
$ chmod 755 analysis-hanlp
2、将分词器插件移动到 search 的 plugins 下
涉及到的 plugins 路径:/etc/search1/instancegroup1/conf/plugins/
$ mv analysis-hanlp /etc/search1/instancegroup1/conf/plugins/
3、修改配置并将该配置文件同步至集群其他 search server 节点
修改新的分词器的配置文件,涉及到的配置文件:plugin-descriptor.properties
,路径为新的分词器目录;
将 elasticsearch.version 改为5.4.1,修改后如下:
$ cd /etc/search1/instancegroup1/conf/plugins/analysis-hanlp/
$ vi plugin-descriptor.properties
最后将修改后的文件复制到集群内的其他 search server 节点上
$ scp -r /etc/search1/instancegroup1/conf/plugins/analysis-hanlp root@172.22.23.2:/etc/search1/instancegroup1/conf/plugins/
4、重启 search 以使分词器生效
重启 search,待重启完毕后,在任意 search server 节点上执行 curl -s "localhost:9200/_cat/plugins?v"
, 可以看到 hanlp 分词器插件已经安装成功;