代码编织梦想

《深入剖析 Elasticsearch:强大的 Java 开源搜索引擎》

​ Elasticsearch 作为一款由 Java 开发的开源搜索引擎,以其卓越的特性在 Java 开发社区中备受青睐。它具备实时搜索、稳定可靠、快速安装和方便使用等突出优点,为开发者提供了强大的搜索解决方案。

一、索引操作

(一)创建索引
  1. 基本创建:通过 PUT /索引名(如 PUT /products)可以创建索引。需注意索引的健康状态分为红色(不可用)、黄色(可用但有风险)和绿色(健康)。默认情况下,Elasticsearch 在创建索引时会为其创建一个备份索引和一个主索引。

  2. 分片配置:可以使用以下方式进行索引分片配置。

    PUT /products
    {
      "settings": {
        "number_of_shards": 1,
        "number_of_replicas": 0
      }
    }
    

    同时,Elasticsearch 支持丰富的字段类型,如字符串类型(keyword、text)、数字类型(integer、long、float、double)、布尔类型、日期类型等。创建索引时可以定义映射,指定字段类型。

    例:

    PUT /products
    { 
      "settings": {
        "number_of_shards": 1,
        "number_of_replicas": 0
      }, 
      "mappings": {
        "properties": {
          "title":{
            "type": "keyword"
          },
          "price":{
            "type": "double"
          },
          "created_at":{
            "type": "date"
          },
          "description":{
            "type": "text"
          }
        }
      }
    }
    
    (二)查询索引

    使用 GET /_cat/indices?v 可以查询所有索引信息。通过 GET /索引名/_mapping(如 GET /products/_mapping)可以查看特定索引的映射。

    (三)删除索引

    可以使用 DELETE /索引名(如 DELETE /products)删除指定索引,也可以使用 DELETE /*(其中 * 代表通配符,可删除所有索引)。

    二、文档操作

    (一)添加文档

    可以通过指定文档 ID(如 POST /products/_doc/1)或者让系统自动生成文档 ID(如 POST /products/_doc/)来添加文档。添加文档后会返回包含索引信息、文档 ID、版本号等内容的响应。

    (二)查询文档

    使用 GET /products/_doc/文档 ID 可以查询特定文档,响应中包含文档的详细信息。

    (三)删除文档

    通过 DELETE /products/_doc/文档 ID 可以删除指定文档,返回删除操作的结果信息。

    (四)更新文档

    有两种更新方式:

    1. 先删除原始文档再插入更新后的文档,如 PUT /products/_doc/文档 ID
    2. 保留原始内容并在此基础上更新,可使用 POST /products/_doc/文档 ID/_update
    (五)批量操作

    可以使用批量操作同时处理多个文档的添加、更新和删除。例如:

    1. 批量索引两条文档:
    POST /products/_doc/_bulk
    {"index":{"_id":"1"}}
    {"title":"iphone14","price":8999.99,"created_at":"2021-09-15","description":"iPhone 13屏幕采用6.8英寸OLED屏幕"}
    {"index":{"_id":"2"}}
    {"title":"iphone15","price":8999.99,"created_at":"2021-09-15","description":"iPhone 15屏幕采用10.8英寸OLED屏幕"}
    

    2.更新文档同时删除文档:

    POST /products/_doc/_bulk
    {"update":{"_id":"1"}}
    {"doc":{"title":"iphone17"}}
    {"delete":{"_id":2}}
    {"index":{}}
    {"title":"iphone19","price":8999.99,"created_at":"2021-09-15","description":"iPhone 19屏幕采用61.8英寸OLED屏幕"}
    

    批量操作具有不会因一个失败而导致全部失败的优点,会继续执行后续操作并按执行状态返回结果。

    三、高级查询

    Elasticsearch 提供了强大的 Query DSL(查询特定领域语言),通过 Rest API 传递 JSON 格式的请求体数据与 ES 进行交互。这种方式具有丰富的查询语法,使 ES 检索更强大、更简洁。

    1. 创建索引并映射:

      PUT /products/
      {
        "mappings": {
          "properties": {
            "title":{
              "type": "keyword"
            },
            "price":{
              "type": "double"
            },
            "created_at":{
              "type":"date"
            },
            "description":{
              "type":"text"
            }
          }
        }
      }
      

      例:

      PUT /products/_doc/_bulk
      {"index":{}}
      {"title":"iphone12 pro","price":8999,"created_at":"2020-10-23","description":"iPhone 12 Pro采用超瓷晶面板和亚光质感玻璃背板,搭配不锈钢边框,有银色、石墨色、金色、海蓝色四种颜色。宽度:71.5毫米,高度:146.7毫米,厚度:7.4毫米,重量:187克"}
      {"index":{}}
      {"title":"iphone12","price":4999,"created_at":"2020-10-23","description":"iPhone 12 高度:146.7毫米;宽度:71.5毫米;厚度:7.4毫米;重量:162克(5.73盎司) [5]  。iPhone 12设计采用了离子玻璃,以及7000系列铝金属外壳。"}
      {"index":{}}
      {"title":"iphone13","price":6000,"created_at":"2021-09-15","description":"iPhone 13屏幕采用6.1英寸OLED屏幕;高度约146.7毫米,宽度约71.5毫米,厚度约7.65毫米,重量约173克。"}
      {"index":{}}
      {"title":"iphone13 pro","price":8999,"created_at":"2021-09-15","description":"iPhone 13Pro搭载A15 Bionic芯片,拥有四种配色,支持5G。有128G、256G、512G、1T可选,售价为999美元起。"}
      

      四、常见检索方式

      (一)查询所有 [match_all]

      使用 match_all 关键字可以返回索引中的全部文档。例如:

      GET /products/_search
      {
        "query": {
          "match_all": {}
        }
      }
      
      (二)关键词查询 (term)

      term 关键字用于关键词查询。例如查询价格为 4999 的文档:

      GET /products/_search
      {
       "query": {
         "term": {
           "price": {
             "value": 4999
           }
         }
       }
      }
      

      通过 term 查询可知,ES 中默认使用标准分词器,对英文单词分词,对中文单字分词。同时,在 ES 的 Mapping Type 中,keyworddateintegerlongdoublebooleanip 这些类型不分词,只有 text 类型分词。

      (三)范围查询 [range]

      range 关键字用于指定查询指定范围内的文档。例如:

      GET /products/_search
      {
        "query": {
          "range": {
            "price": {
              "gte": 1400,
              "lte": 9999
            }
          }
        }
      }
      
      (四)前缀查询 [prefix]

      prefix 关键字用于检索含有指定前缀的关键词的相关文档。例如:

      GET /products/_search
      {
        "query": {
          "prefix": {
            "title": {
              "value": "ipho"
            }
          }
        }
      }
      
      (五)通配符查询 [wildcard]

      wildcard 关键字用于通配符查询,? 匹配一个任意字符,* 匹配多个任意字符。例如:

      GET /products/_search
      {
        "query": {
          "wildcard": {
            "description": {
              "value": "iphon*"
            }
          }
        }
      }
      
      (六)多 id 查询 [ids]

      ids 关键字值为数组类型,用于根据一组 id 获取多个对应的文档。例如:

      GET /products/_search
      {
        "query": {
          "ids": {
            "values": ["verUq3wBOTjuBizqAegi","vurUq3wBOTjuBizqAegk"]
          }
        }
      }
      
      (七)模糊查询 [fuzzy]

      fuzzy 关键字用于模糊查询含有指定关键字的文档。模糊查询有一定限制:搜索关键词长度为 2 不允许存在模糊;长度为 3 - 5 允许一次模糊;长度大于 5 允许最大 2 模糊。例如:

      GET /products/_search
      {
        "query": {
          "fuzzy": {
            "description": "iphooone"
          }
        }
      }
      
      (八)布尔查询 [bool]

      bool 关键字用于组合多个条件实现复杂查询。must 相当于 “&&”(同时成立);should 相当于 “||”(成立一个就行);must_not 相当于 “!”(不能满足任何一个)。例如:

      GET /products/_search
      {
        "query": {
          "bool": {
            "must": [
              {"term": {
                "price": {
                  "value": 4999
                }
              }}
            ]
          }
        }
      }
      
      (九)多字段查询 [multi_match]

      使用 multi_match 可以在多个字段中进行查询。需注意,如果字段类型分词,将查询条件分词后查询该字段;如果不分词,则将查询条件作为整体进行查询。例如:

      GET /products/_search
      {
        "query": {
          "multi_match": {
            "query": "iphone13 毫",
            "fields": ["title","description"]
          }
        }
      }
      
      (十)默认字段分词查询 [query_string]

      query_string 关键字用于默认字段分词查询。如果查询字段分词,就将查询条件分词查询;如果不分词,将查询条件不分词查询。例如:

      GET /products/_search
      {
        "query": {
          "query_string": {
            "default_field": "description",
            "query": "屏幕真的非常不错"
          }
        }
      }
      
      (十一)高亮查询 [highlight]

      使用 highlight 关键字可以让符合条件的文档中的关键词高亮。例如:

      GET /products/_search
      {
        "query": {
          "term": {
            "description": {
              "value": "iphone"
            }
          }
        },
        "highlight": {
          "fields": {
            "*":{}
          }
        }
      }
      

      自定义高亮标签:可以在 highlight 中使用 pre_tagspost_tags。例如:

      GET /products/_search
      {
        "query": {
          "term": {
            "description": {
              "value": "iphone"
            }
          }
        },
        "highlight": {
          "post_tags": ["</span>"], 
          "pre_tags": ["<span style='color:red'>"],
          "fields": {
            "*":{}
          }
        }
      }
      

      多字段高亮:使用 require_field_match 开启多个字段高亮。例如:

      GET /products/_search
      {
        "query": {
          "term": {
            "description": {
              "value": "iphone"
            }
          }
        },
        "highlight": {
          "require_field_match": "false",
          "post_tags": ["</span>"], 
          "pre_tags": ["<span style='color:red'>"],
          "fields": {
            "*":{}
          }
        }
      }
      
      (十二)返回指定条数 [size]

      使用 size 关键字可以指定查询结果中返回的条数,默认返回值为 10 条。例如:

      GET /products/_search
      {
        "query": {
          "match_all": {}
        },
        "size": 5
      }
      
      (十三)分页查询 [from]

      from 关键字用于指定起始返回位置,与 size 关键字连用可实现分页效果。例如:

      GET /products/_search
      {
        "query": {
          "match_all": {}
        },
        "size": 5,
        "from": 0
      }
      
      (十四)指定字段排序 [sort]

      使用 sort 关键字可以对查询结果进行排序。例如:

      GET /products/_search
      {
        "query": {
          "match_all": {}
        },
        "sort": [
          {
            "price": {
              "order": "desc"
            }
          }
        ]
      }
      
      (十五)返回指定字段 [_source]

      _source 关键字是一个数组,用于指定展示哪些字段。例如:

      GET /products/_search
      {
        "query": {
          "match_all": {}
        },
        "_source": ["title","description"]
      }
      

      总结

      Elasticsearch 作为一款功能强大的开源搜索引擎,为 Java 开发者带来了诸多便利和可能性。无论是处理小型项目还是应对大规模企业级应用,它都能凭借其出色的特性和丰富的功能,成为开发者手中的有力工具。在不断发展的技术领域中,掌握 Elasticsearch 的使用将为开发者打开更广阔的创新之门,助力他们构建出更加高效、智能的应用系统,为用户提供更优质的服务体验。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_67028830/article/details/141869512

Elasticsearch剖析-爱代码爱编程

本文是自己搜索整理的 Elasticsearch 相关的东西分享。 Elasticsearch剖析 1、什么是Elasticsearch2、Elasticsearch的特性3、Elasticsearch的主要概念4、Lucene与ES的关系5、ES主要解决的问题6、ES的工作原理7、Elasticsearch的优点8、Elasticsearch的缺点

Java程序员:java游戏开发引擎-爱代码爱编程

正文 在写这个文章之前,我花了点时间,自己臆想了一个电商系统,基本上算是麻雀虽小五脏俱全,我今天就用它开刀,一步步剖析,我会讲一下我们可能会接触的技术栈可能不全,但是够用,最后给个学习路线。 Tip:请多欣赏一会,每个点看一下,看看什么地方是你接触过的,什么技术栈是你不太熟悉的,我觉得还算是比较全的,有什么建议也可以留言给我。 不知道大家都看了一

Elasticsearch(一):概述-爱代码爱编程

​1、Elasticsearch是什么 elasticsearch是一款开源的分布式搜索、存储、分析引擎;它目前的时效为近实时性的。Solar也是顶级的开源搜索引擎,也是基于lucene;elasticsearch与Solar相比安装更加简单,对于一些复杂的搜索支持更好,在大数据量下,elasticsearch的性能更好,现在被很多公司大量的使用。 我

【elasticsearch核心原理与索引分析】_elasticsearch 索引拆分-爱代码爱编程

Elasticsearch核心原理与索引分析 Elasticsearch存储原理深入剖析 什么是ES? Elasticsearch:基于Lucene的搜索服务器,分布式全文搜索引擎 ES核心概念:Index

【es专题】elasticsearch集群架构剖析_es集群-爱代码爱编程

目录 前言阅读对象阅读导航要点笔记正文一、ES集群架构1.1 为什么要使用ES集群架构1.2 ES集群核心概念1.2.1 节点1.2.1.1 Master Node主节点的功能1.2.1.2 Data Node

elasticsearch 7.13.4基础_elasticsearch:7.13.4-爱代码爱编程

文章目录 一、Elasticsearch的功能、适用场景以及特点介绍1、ElasticSearch的功能2、Elasticsearch的适用场景3、Elasticsearch的特点 二、手工画图剖析Ela

【es专题】elasticsearch集群架构剖析_es集群_elasticsearch架构图-爱代码爱编程

+ 请求量提升/数据的不断增长(将数据分布到所有节点上) 上面所说的正是集群架构的优势所在。对ES集群架构来说,则体现在: 提高系统的可用性,部分节点停止服务,整个集群的服务不受影响存储的水平扩容 1.2 ES集

elasticsearch分页查询性能及封装实现-爱代码爱编程

Es的分页方式 from+size 最基本的分页方式,类似于SQL中的Limit语法: //查询年龄在12到32之间的前15条数据 { "query":{ "bool":{ "must":{ "range":{ "user_age":{

pre-爱代码爱编程

这个文件是 pre-commit 的配置文件,通常命名为 .pre-commit-config.yaml。pre-commit 是一个用于管理和维护多种预提交钩子的框架,旨在在代码提交(git commit)之前自动执行一系

elasticsearch 中变更索引的方法-爱代码爱编程

Elasticsearch 提供了几种方法来变更索引。以下是一些常用的方法: 1. 更新索引设置 可以使用 Update Index Settings API 来修改部分索引设置。例如: PUT /my-index/_

cloudflare为网站添加ai审计 可检查ai爬虫何时抓取和抓取频次以及直接屏蔽爬虫_cloudflare ai audit-爱代码爱编程

网络服务提供商 Cloudflare 宣布即日起为所有网站 (包括免费托管的网站) 带来 AI 审计功能,该功能目前处于测试阶段,可以分析 AI 公司的爬虫和抓爬数据。新的 AI 审计工具 (Cloudflare AI Au

搜索引擎简介-爱代码爱编程

搜索引擎架构 整个搜索引擎分为三个系统 爬虫系统 索引系统 线上搜素服务 爬虫系统 爬虫分为两个阶段: 第一阶段:根据目标网站的列表页,爬对应的文档 URL 第二阶段:根据文档 URL,下载文档内容 触发器: 定时任务触发 消息触发 管理后台手动触发某一个爬虫任务 文件服务器: 存储图片和视频文件

【elasticsearch专栏 16】深入探索:elasticsearch的master选举机制及其影响因素分析_elasticsearch master节点选举-爱代码爱编程

Elasticsearch,作为当今最流行的开源搜索和分析引擎,以其分布式、可扩展和高可用的特性赢得了广大开发者的青睐。在Elasticsearch的分布式架构中,集群的稳健性和高可用性很大程度上依赖于其Master节点的选

【电商搜索】现代工业级电商搜索技术-爱代码爱编程

【电商搜索】现代工业级电商搜索技术-Ha3搜索引擎平台简介 — 初稿V1.0 Ha3搜索引擎平台详细介绍 在当今的互联网时代,搜索引擎扮演着至关重要的角色,尤其是在电子商务领域。Ha3搜索引擎平台是由阿里巴巴搜索团队开