Elasticsearch学习(六):Elasticsearch创建

Stella981
• 阅读 896

一、创建索引index

创建名为newindex的索引(索引名必须为小写): 提交请求newindex PUT,创建成功出现下面结果:

{
    "acknowledged": true
}

查看新建的索引:newindex GET,结果如下:

{
    "newindex": {
        "aliases": { },
        "mappings": { },
        "settings": {
            "index": {
                "creation_date": "1491980889980",
                "uuid": "DvFfvO0JQ46Bbb0u64rgsw",
                "number_of_replicas": "1",
                "number_of_shards": "5",
                "version": {
                    "created": "2040499"
                }
            }
        },
        "warmers": { }
    }
}    

索引的两个重要配置: number_of_replicas 副本数量(默认1) number_of_shards 分片数量(默认5) 创建索引时自定义副本和分片数量:

newindex1 PUT

{
  "settings": {
    "index": {
      "number_of_replicas": "3",
      "number_of_shards": "3"
    }
  }
}

二、创建类型type

在索引newindex中创建名为newtype的类型:

newindex/newtype/_mapping PUT

{
  "newtype": {}
}

再查看索引newindex,结果如下:

{
    "newindex": {
        "aliases": { },
        "mappings": {
            "newtype": { }
        },
        "settings": {
            "index": {
                "creation_date": "1491980889980",
                "uuid": "DvFfvO0JQ46Bbb0u64rgsw",
                "number_of_replicas": "1",
                "number_of_shards": "5",
                "version": {
                "created": "2040499"
                }
            }
        },
        "warmers": { }
    }
}

发现"mappings"(映射)中多了newtype。

每个类型(type)拥有自己的映射(mapping)或者模式定义(schema definition),一个映射定义了字段,每个字段的数据类型,以及字段被Elasticsearch处理的方式。

新增一个定义映射的类型newtype1:

newindex/newtype1/_mapping PUT

{
  "newtype1": {
    "properties": {
      "id": {
        "type": "long"
      },
      "name": {
        "type": "string",
        "index": "not_analyzed"
      },
      "birth": {
        "type": "date"
      }
    }
  }
}

查看新创建的newtype1的映射:

newindex/_mapping/newtype1 GET

{
    "newindex": {
        "mappings": {
            "newtype1": {
                "properties": {
                    "birth": {
                        "type": "date",
                        "format": "strict_date_optional_time||epoch_millis"
                    },
                    "id": {
                        "type": "long"
                    },
                    "name": {
                        "type": "string",
                        "index": "not_analyzed"
                    }
                }
            }
        }
    }
}

三、索引文档

向es中添加一个文档:

newindex/newtype1/1 PUT

{
    "id": 1,
    "name": "张三",
    "birth": "2017-01-02"
}

返回结果如下,添加成功:

{
    "_index": "newindex",
    "_type": "newtype1",
    "_id": "1",
    "_version": 1,
    "_shards": {
        "total": 2,
        "successful": 2,
        "failed": 0
    },
    "created": true
}

查看文档:

newindex/newtype1/1 GET

{
    "_index": "newindex",
    "_type": "newtype1",
    "_id": "1",
    "_version": 1,
    "found": true,
    "_source": {
        "id": 1,
        "name": "张三",
        "birth": "2017-01-02"
    }
}

创建索引、类型,添加文档可以通过一条指令完成:

myindex/mytype/1 PUT
{
"id": 1,
"name": "张三",
"birth": "2017-01-02"
}

Elasticsearch检测索引、类型不存在时会自动创建,自动创建索引由配置项action.auto_create_index控制,默认开启为true

四、动态映射

如果上面执行操作前,ES中没有myindex这个索引,那么默认会直接创建这个索引;并且type字段也会自动创建。也就是说,ES并不需要像传统的数据库事先定义表的结构。每个索引中的类型都有一个mapping映射,这个映射是动态生成的,因此当增加新的字段时,会自动增加mapping的设置。

通过在配置文件中设置action.auto_create_indexfalse,可以关闭自动创建index这个功能。 自动创建索引功能,也可以设置黑名单或者白名单,比如: 设置action.auto_create_index+aaa*,-bbb*,'+'号意味着允许创建aaa开头的索引,'-'号意味着不允许创建bbb开头的索引。

通过设置dynamic控制动态映射,可选值:

  • true:自动添加字段(默认)
  • false:忽略字段
  • strict:当遇到未知字段时抛出异常

向索引myindex中添加类型strict_type:

myindex/strict_type/_mapping PUT

{
  "strict_type": {
    "dynamic": "strict",
    "properties": {
      "title": {
        "type": "string"
      },
      "stash": {
        "type": "object",
        "dynamic": true
      }
    }
  }
}

将 strict_type 的动态映射设置为了strict,意味着如果向 myindex/strict_type 中添加文档时,如果文档中含有除 title 和 stash 的其他字段时,会抛出异常。测试一下:

myindex/strict_type/1 PUT

{
  "title": "加一个新字段content",
  "content": "未知字段会抛出异常"
}

结果如下:

{
    "error": {
    "root_cause": [
        {
            "type": "strict_dynamic_mapping_exception",
            "reason": "mapping set to strict, dynamic introduction of [content] within [strict_type] is not allowed"
        }
    ],
    "type": "strict_dynamic_mapping_exception",
    "reason": "mapping set to strict, dynamic introduction of [content] within [strict_type] is not allowed"
    },
    "status": 400
}

但是我们在字段 stash 中将dynamic设置为了true,意味着在 stash 对象内可以新增字段,测试一下:

myindex/strict_type/2 PUT

{
  "title": "在stash中加一个新字段content",
  "stash": {
    "content": "这下可以加进来了"
  }
}

结果添加成功:

{
    "_index": "myindex",
    "_type": "strict_type",
    "_id": "2",
    "_version": 1,
    "_shards": {
        "total": 2,
        "successful": 2,
        "failed": 0
    },
    "created": true
}

五、自定义动态映射

使用dynamic_templates,可以完全控制新字段的映射,可以通过设置字段名或数据类型等应用一个完全不同的映射。

向索引 myindex 中添加一个自定义动态映射的类型 my_dynamic_type :

myindex/my_dynamic_type/_mapping PUT

{
  "my_dynamic_type": {
    "dynamic_templates": [
      {
        "ord": {
          "match": "*_ord",
          "match_mapping_type": "string",
          "mapping": {
            "type": "string",
            "index": "not_analyzed"
          }
        }
      },
      {
        "date": {
          "match": "date_*",
          "match_mapping_type": "string",
          "mapping": {
            "type": "date",
            "ignore_malformed": true
          }
        }
      }
    ]
  }
}

my_dynamic_type 的映射使用了动态模板,在动态模板dynamic_templates中:

  • 定义了一个名为ord的模板,这个模板匹配所有以 _ord 结尾("match": "*_ord")字符串类型("match_mapping_type": "string")的字段,将此类字段类型映射为字符串并索引的时候不做解析("mapping": {"type": "string","index": "not_analyzed"}

  • 定义了一个名为date的模板,这个模板匹配所有以 date_ 开头("match": "date_*")字符串类型("match_mapping_type": "string")的字段,将此类字段类型映射为日期类型,并且忽略不能格式化为日期的值("mapping": {"type": "date","ignore_malformed": true}

看下效果:

myindex/my_dynamic_type/1 PUT

{
  "id": 1,
  "name": "张三",
  "date_birth": "20170923",
  "name_ord": "张三"
}

插入文档后查看 my_dynamic_type 的映射:

myindex/_mappping/my_dynamic_type GET

{
    "myindex": {
        "mappings": {
            "my_dynamic_type": {
                "dynamic_templates": [ { "ord": { "mapping": { "type": "string","index": "not_analyzed"},"match": "*_ord","match_mapping_type": "string"}},{ "date": { "mapping": { "type": "date","ignore_malformed": true},"match": "date_*","match_mapping_type": "string"}}],
                "properties": {
                    "date_birth": {
                        "type": "date",
                        "ignore_malformed": true,
                        "format": "strict_date_optional_time||epoch_millis"
                    },
                    "id": {
                        "type": "long"
                    },
                    "name": {
                        "type": "string"
                    },
                    "name_ord": {
                        "type": "string",
                        "index": "not_analyzed"
                    }
                }
            }
        }
    }
}

可以看到properties中已经将name_ord字段映射为字符串类型,并不做解析;date_birth也映射为了日期类型,再插入一个文档:

myindex/my_dynamic_type/2 PUT

{
  "id": 2,
  "name": "李四",
  "date_birth": "未知",
  "name_ord": "李四"
}

插入成功,date_birth字段也可以接受不能被格式化为日期的值。

关于动态映射更多配置语法请参考官方文档:

https://www.elastic.co/guide/en/elasticsearch/reference/2.4/dynamic-templates.html

https://www.elastic.co/guide/en/elasticsearch/reference/2.4/mapping.html

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
5个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
11个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这