search中如何自定义配置词库

  使用配置
内容纲要

概要描述


本文档适用于TDH6.0.0及以上版本,支持用户自定义配置词库,允许随时更新是TDH6.0.0版本新增的功能。

有时候一个词并不在ik插件的词库中,如很多网络用语。比如我们搜索“小米手机”时,希望只出现“小米的手机”,而不会出现“华为手机”、“苹果手机”等,但“小米手机”并不在ik词库中,此时可以将“小米手机”添加到ik插件的自定义词库中。

curl -XPOST -uadmin:123456 localhost:9200/_analyze?pretty -d '{"analyzer":"ik","text":"小米手机"}'
可以看到默认的ik词库中,没有 “小米手机” 这个词,本文档介绍如何将该自定义词添加到ik词库中。
file

详细说明


  1. 该操作涉及到重做镜像,可以参考该文档:https://nj.transwarp.cn:8180/?p=459

  2. 进入search server的镜像

    #查找镜像
    [root@mll01 ~]# docker images | grep search
    transwarp/search                             transwarp-6.2.1-final     721f7e0fb6b6        20 hours ago        2.69GB
    mll01:5000/transwarp/search                  transwarp-6.2.1-final     721f7e0fb6b6        20 hours ago        2.69GB
    #进入容器
    [root@mll01 ~]# docker run -it 721f7e0fb6b6 bash
    [root@3de138179673 ~]# 
  3. 进入ik插件安装目录,创建自定义词库文件
    涉及路径:/usr/lib/elasticsearch/elasticsearch-5.4.1-transwarp/plugins/analysis-ik/config

    [root@3de138179673 ~]# cd  /usr/lib/elasticsearch/elasticsearch-5.4.1-transwarp/plugins/analysis-ik/config
    [root@3de138179673 config]# cat mll.dic 
    小米手机
    华为手机
  4. 配置自己的扩展词典
    涉及文件:/usr/lib/elasticsearch/elasticsearch-5.4.1-transwarp/plugins/analysis-ik/config/IKAnalyzer.cfg.xml
    将上一步骤中创建的文件 mll.dic 加到配置文件中。
    file

  5. 重做镜像

  6. 重启search服务

  7. 再次查看关于 “小米手机” 的分词结果,已包含 “小米手机”
    file

这篇文章对您有帮助吗?

平均评分 0 / 5. 次数: 0

尚无评价,您可以第一个评哦!

非常抱歉,这篇文章对您没有帮助.

烦请您告诉我们您的建议与意见,以便我们改进,谢谢您。