Elasticsearch spring boot 指定拼音分词器

Stella981
• 阅读 831

1下载ik中文/拼音分词器

ik分词器:https://github.com/medcl/elasticsearch-analysis-ik

拼音分词器:https://github.com/medcl/elasticsearch-analysis-pinyin

注意:elasticsearch版本要求严格必须相同

2 安装

1)通过releases找到和es对应版本的zip文件,或者source文件

2)进入elasticsearch安装目录plugins,新建pinyin文件夹

3)将拼音分词器zip文件解压到pinyin目录

4)重启es

3 kibana中配置

1)配置setting

PUT  my_index
 {
        "number_of_shards" : "5",//主分片
        "number_of_replicas" : "1",//副本
        "analysis" : {
          "analyzer" : {
            "default" : {
              "tokenizer" : "ik_max_word"//默认多词分词
            },
            "pinyin_analyzer" : {
              "tokenizer" : "my_pinyin"//拼音分词
            }
          },
          "tokenizer" : {
            //设置拼音分词
            "my_pinyin" : {
              "keep_separate_first_letter" : "false",
              "lowercase" : "true",
              "type" : "pinyin",
              "limit_first_letter_length" : "16",
              "keep_original" : "false",
              "keep_full_pinyin" : "true"
            }
          }
        }
      }

2)配置mapping

PUT my_index/index/_mapping
{    
        "properties" : {
            "name" : {
                "type" : "keyword",
                "analyzer" : "ik_max_word",
                "include_in_all" : true,
                "fields" : {
                    "pinyin" : {
                        "type" : "text",
                        "analyzer" : "pinyin_analyzer"
                      }
                 }
            }
      }
}

4 测试

通过_analyze测试下分词器是否能正常运行:

GET my_index/_analyze
{
"text":"刘德华",
"analyzer":"pinyin_analyzer"
}

5 spring boot 中自动创建setting mapping

1)在resources路径下创建usersearch_mapping.json和usersearch_setting.json文件

usersearch_mapping.json{
  "index" : {
    "analysis" : {
      "analyzer" : {
        "pinyin_analyzer" : {
          "tokenizer" : "my_pinyin"
        }
      },
      "tokenizer" : {
        "my_pinyin" : {
          "type" : "pinyin",
          "keep_separate_first_letter" : false,
          "keep_full_pinyin" : true,
          "keep_original" : true,
          "limit_first_letter_length" : 16,
          "lowercase" : true,
          "remove_duplicated_term" : true
        }
      }
    }
  }
}

usersearch_setting.json

{
  "user": {
    "properties": {
      "title": {
        "type": "keyword",
        "fields": {
          "pinyin": {
            "type": "text",
            "store": "no",
            "term_vector": "with_offsets",
            "analyzer": "pinyin_analyzer"
          }
        }
      }
    }
  }
}

2)新建测试demo 使用@Mapping和@Setting注解

@Mapping(mappingPath = "usersearch_setting.json")
@Setting(settingPath = "usersearch_mapping.json")
@Document(indexName = "user",type = "user",shards = 5,replicas = 1)
public class UserIndex  {
    @Id
    private  String user;
//get set省略
}

3)使用save方法添加数据

使用ElasticsearchTemplate 中的putMapping将setting 和mapping文件执行

public class UserContrller {
    @Autowired
    private UserRepository userRepository;
    @Autowired
    private ElasticsearchTemplate elasticsearchTemplate;
    @RequestMapping("/add")
    public void add(){
        //添加配置
        elasticsearchTemplate.putMapping(User.class);
        User user =new User();
        userIndex.setUser("陈奕迅");
        userRepository.save(user);
    }
}
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Wesley13 Wesley13
3年前
PPDB:今晚老齐直播
【今晚老齐直播】今晚(本周三晚)20:0021:00小白开始“用”飞桨(https://www.oschina.net/action/visit/ad?id1185)由PPDE(飞桨(https://www.oschina.net/action/visit/ad?id1185)开发者专家计划)成员老齐,为深度学习小白指点迷津。
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这