为 search 添加新的分词器

  使用配置
内容纲要

概要描述


TDH 6.0.2 集群中 search 默认安装了 ik、mmseg 和 geo 分词器(可以通过在任意 search server 节点上执行 curl -s "localhost:9200/_cat/plugins?v" 命令查看),如下图所示:

有些情况下,这些分词器无法满足业务需求,此时我们需要一些额外的分词器。
本案例介绍一种为 TDH 集群 的 search 安装分词器的方法;

详细说明


本文以安装hanlp中文分词器为例,大致分为一下 4 步:

  1. 获取分词器,并改名
  2. 将分词器移动至 serach 的 plugins 目录
  3. 修改配置并将该配置文件同步至集群其他 search server 节点
  4. 重启 search 验证分词器生效

1、获取分词器,并改名

下载分词器插件包,上传到集群后台,解压分词器,并修改分词器名,然后给该目录赋权;

$ unzip elasticsearch-analysis-hanlp-5.2.2.zip
# 解压后是目录名为 elasticsearch,可以将其修改为更具辨识性的名字
$ mv elasticsearch analysis-hanlp
$ chmod 755 analysis-hanlp

2、将分词器插件移动到 search 的 plugins 下

涉及到的 plugins 路径:/etc/search1/instancegroup1/conf/plugins/

$ mv analysis-hanlp /etc/search1/instancegroup1/conf/plugins/

3、修改配置并将该配置文件同步至集群其他 search server 节点

修改新的分词器的配置文件,涉及到的配置文件:plugin-descriptor.properties,路径为新的分词器目录;
将 elasticsearch.version 改为5.4.1,修改后如下:

$ cd /etc/search1/instancegroup1/conf/plugins/analysis-hanlp/
$ vi plugin-descriptor.properties

file

最后将修改后的文件复制到集群内的其他 search server 节点上

$ scp -r /etc/search1/instancegroup1/conf/plugins/analysis-hanlp root@172.22.23.2:/etc/search1/instancegroup1/conf/plugins/

4、重启 search 以使分词器生效

重启 search,待重启完毕后,在任意 search server 节点上执行 curl -s "localhost:9200/_cat/plugins?v", 可以看到 hanlp 分词器插件已经安装成功;

这篇文章对您有帮助吗?

平均评分 5 / 5. 次数: 1

尚无评价,您可以第一个评哦!

非常抱歉,这篇文章对您没有帮助.

烦请您告诉我们您的建议与意见,以便我们改进,谢谢您。