首页 > 其他分享 >Elasticsearch探秘:原理剖析、高级运用与实战经验【文末送书-37】

Elasticsearch探秘:原理剖析、高级运用与实战经验【文末送书-37】

时间:2024-03-12 22:01:09浏览次数:43  
标签:index blocks 送书 read 37 索引 only Elasticsearch 文末

文章目录

Elasticsearch探秘:原理剖析、高级运用与实战经验

Elasticsearch作为一个开源、分布式、实时搜索和分析引擎,被广泛应用于各行各业,为大数据处理和搜索提供了强大的支持。本文将深入探讨Elasticsearch的原理、进阶使用方法以及工程实践,帮助读者更全面地理解和应用这一强大的搜索引擎。
在这里插入图片描述

在深入学习Elasticsearch之前,我们首先要了解其基础原理。文章将介绍Elasticsearch的核心概念,如倒排索引、分片、节点等,以及其在分布式系统中的工作原理。读者将通过这一部分的学习,建立对Elasticsearch基础架构的清晰认识。

进阶使用方法

深入了解Elasticsearch的核心原理后,我们将探讨一些进阶的使用方法。这包括高级搜索技巧、复杂查询DSL语句的编写、性能调优等内容。读者将学习如何更灵活、高效地使用Elasticsearch来满足各种搜索和分析需求。

数据建模与映射

Elasticsearch不仅仅是一个搜索引擎,还是一个分布式文档存储系统。本节将介绍如何合理地进行数据建模和映射,以满足不同场景下的数据存储需求。我们将探讨文档设计、字段映射、索引设置等方面的最佳实践,确保数据在Elasticsearch中的存储和检索效率。

实战工程案例

为了更好地帮助读者将理论知识应用到实践中,我们将提供一系列实战工程案例。这些案例将涵盖不同行业和场景下的应用,包括日志分析、全文搜索、实时监控等。通过实际项目的案例分析,读者将深入了解如何在真实环境中应用和优化Elasticsearch。

我们将探讨Elasticsearch的故障排查和性能优化。这部分内容将涵盖常见的问题和挑战,以及针对这些问题的解决方案。读者将学会如何监控集群健康、识别性能瓶颈,并采取相应的措施进行优化。

Elasticsearch 是一种强大的搜索和分析引擎,被广泛用于各种应用中,以其强大的全文搜索能力而著称。

不过,在日常管理 Elasticsearch 时,我们经常需要对索引进行保护,以防止数据被意外修改或删除,特别是在进行系统维护或者需要优化资源使用时。

Elasticsearch提供了一种名为“索引阻塞(Index blocks)”的功能,让我们能够限制对某个索引的操作类型。

Elasticsearch的索引阻塞功能在早期版本中就已存在,用于管理对索引的访问和操作。随着 Elasticsearch 版本的更新,该功能也在不断得到改进和扩展。

索引阻塞的种类

Elasticsearch中的索引阻塞可以根据需要,限制对索引的读取、写入或元数据操作。

所谓的元数据,可以理解为索引的基本信息和设置,比如索引包含哪些字段,这些字段是什么类型的等等。

这些阻塞可以通过动态索引设置添加或移除,也可以通过专门的API来添加,这样做的好处是能确保在添加写入阻塞后,所有索引的分片都正确地应用了阻塞,比如确保在添加写入阻塞后,所有正在进行的写入操作都已完成。

以下是一些动态索引设置,用于确定索引上存在的阻塞类型:

index.blocks.read_only:设置为 true 使索引及索引元数据只读,设置为false则允许写入和元数据更改。
index.blocks.read_only_allow_delete:类似于index.blocks.read_only,但也允许删除索引以释放更多资源。
index.blocks.read:设置为 true 以禁用对索引的读取操作。
index.blocks.write:设置为 true 以禁用对索引的数据写入操作。与read_only不同,这个设置不影响元数据。例如,你可以调整带有写入阻塞的索引的设置,但不能调整带有read_only阻塞的索引的设置。
index.blocks.metadata:设置为true以禁用索引元数据的读写操作。

解释一下:index.blocks.read_only 和 index.blocks.write 区别?

如下设置了禁止写入,但是可以修改索引的设置,比如:副本数的调整,这个是允许的。

PUT test-001/_settings
{
  "blocks.write": true
}

PUT test-001/_settings
{
  "number_of_replicas": 2
}

但是换成这样:

PUT test-002
PUT test-002/_settings
{
  "blocks.read_only": true
}

PUT test-002/_settings
{
  "number_of_replicas": 2
}

如上的 read_only 设置后,如果再进行修改索引设置的设置就会报错。

{  "error": {
    "root_cause": [
      {
        "type": "cluster_block_exception",
        "reason": "index [test-002] blocked by: [FORBIDDEN/5/index read-only (api)];"
      }
    ],
    "type": "cluster_block_exception",
    "reason": "index [test-002] blocked by: [FORBIDDEN/5/index read-only (api)];"
  },
  "status": 403
}

简而言之,index.blocks.write 允许你保护索引内容的稳定性,同时仍然可以调整索引的配置来应对不同的需求或进行优化。而 index.blocks.read_only 则是一种更为严格的保护,确保索引在某段时间内完全不被更改。

什么时候使用阻塞?

场景1:进行系统维护场景。
比如,当你需要升级系统或者做一些关键的维护工作时,可能不希望在这期间有任何索引结构的变化。

通过阻止别人修改索引的元数据,确保索引的设置保持不变,维护索引设置的稳定性。

场景2:保护数据不被随意更改场景。
举例:如果咱们的业务数据是非常关键的,比如已经归档的日志或者历史记录,这些数据通常是不允许被更改的。

防止关键数据被随意更改或删除,确保数据的完整性和准确性。

场景3:优化资源使用的场景。
举例:有时候某个索引可能占用了太多资源,你可能暂时不想让它继续增长。

通过控制索引的读写操作,帮助管理系统资源,避免因为资源过度使用而导致系统变慢或崩溃。

场景4:遵守安全规则场景。
举例:对于一些敏感数据,可能要求严格的访问控制,不希望随便被读取或更改。

对于需要严格控制的敏感数据,通过设置阻塞来限制数据的访问和修改,保障数据安全。

一本书讲透Elasticsearch:原理、进阶与工程实践【文末送书-37】

购书链接:
JD:https://item.jd.com/14342998.html

这是一本关于Elasticsearch技术实战的教程,全面覆盖了Elastic Stack技术体系知识,旨在帮助读者深入了解Elasticsearch的核心技术和应用场景,同时掌握分布式搜索与分析引擎的设计思想和实现原理。
在这里插入图片描述
编辑推荐
适读人群 :数据分析、大数据、搜索引擎相关从业者,对Elasticsearch以及Elastic Stack感兴趣的人,以及参加专家认证考试的人
(1)作者专业实力强劲:铭毅天下有10多年开发工作经验,7年深耕Elastic Stack,博客累计阅读量超1000万,主导过PB级数据存储与检索系统项目,累计项目经费超千万。
(1)众多Elastic大咖力荐:Elastic创始人Shay Banon、Elastic中文社区创始人Medcl、Wood大叔、张超、魏子珺等15位专家领衔推荐
(2)覆盖认证考试考点:作者拥有多年Elasticsearch培训及咨询经验,并成功指导近200人通过认证考试,并将专家认证考试全部考点融入本书,有效提高应试能力。
(3)内容体系完善:围绕Elasticsearch展开,覆盖基础知识、关联技术、核心能力及最佳实践,实战知识库检索系统、大数据可视化系统、日志系统等业务场景,并添加大量图解内容,使核心知识点更易被理解和吸收。
(4)实战性强:融入作者多年Elastic Stack实战开发、咨询经验,以及4年间与来自全球数百家企业的近2000名Elastic爱好者的实战经验,深呈现高质量实战内容。

在这里插入图片描述

作者简介
杨昌玉(铭毅天下)
10多年工作经验的高级工程师,擅长大数据存储和检索。
曾任职于上市公司、科研院所等,主导过PB级数据存储与检索系统项目,拥有多年Elasticsearch培训及咨询经验。Elastic认证专家、Elasticsearch中国合作培训讲师、Elasticsearch 中文社区2018年、2023年杰出贡献奖(排名Top5)获得者、阿里云MVP(大数据领域最有价值专家)、CSDN博客专家(排名Top150)、CSDN 2020年度优秀创作者。博客累计阅读量超1000万,并被阿里云、腾讯云、华为云、360doc、51CTO等知名媒体平台全量转载,在CSDN 2013年及2016年的博客征文大赛中获特等奖。“死磕Elasticsearch”知识星球发起人,拥有近2000名付费用户。“铭毅天下Elasticsearch”公众号及博客总计拥有近5万名关注者。成功指导近200人通过Elastic认证专家考试。

标签:index,blocks,送书,read,37,索引,only,Elasticsearch,文末
From: https://blog.csdn.net/weixin_52908342/article/details/136656350

相关文章

  • 代码随想录算法训练营第四十四天|完全背包 ● 518. 零钱兑换 II ● 377. 组合总和 Ⅳ
    完全背包题目链接:52.携带研究材料(第七期模拟笔试)(kamacoder.com)思路:完全·背包问题和01背包的区别在于同一个物品可以被重复放入,在代码里的区别就是内部遍历背包的for循环由倒序变成了正序。而且如果我们压缩了一维的话,如我的做法,两个for循环的顺序也是无所谓的。#include<i......
  • 37. 敌人意图 AI 逻辑
    本节目标在玩家回合,需要显示敌人的意图,然后在敌人回合执行意图代码实现拼UI在HealthBar上面添加意图的图片和文字然后在HealthBarController上面添加意图图片和意图文字添加敌人意图敌人意图ScriptableObject敌人意图实例Effect把意图添加到Enemy类......
  • vs2019单独重新安装python37_64失败解决办法(bilibili上我最早写的是https://www.bilib
    上个周末的时候,我发现用vs2019编写python的时候。代码高亮出现了奇怪的问题,进入解决方案的时候,print还是蓝色的,但是过了几秒钟后就变为黑色了,因此在最开始的时候我试图通过换一个皮肤和在管理扩展里面找扩展来解决,但是还是有相关问题。于是到vs2019对应的python文件夹找问题,目录是......
  • lgB3717 计算组合数
    给出T次询问,每次给出n和m,求C(n,m)对998244353取模的结果。为了避免输出太多内容,只需要输出所有查询结果的异或和。1<=T<=5E6;0<=m<=n<=5E6先O(n)预处理出所有数的阶乘及其对应的乘法逆元,然后O(1)处理每次询问。#include<bits/stdc++.h>usingnamespacestd;#defineintlon......
  • 376. 摆动序列c
    动态规划yyds!虽然写不出来TTintmax(inti,intj){if(i>j)returni;returnj;}intwiggleMaxLength(int*nums,intnumsSize){intdp[1000][2]={0};//dp[i][j]表示到0-i为止的最大子序列,1表示最后是上升,0表示最后是下降if(numsSize==1)return1;......
  • P10237 [yLCPC2024] E. Latent Kindom 题解
    分析一眼了非最优解。考虑二分答案。对于二分出来的中位数\(x\),到\(a_i\)和\(a_j\)里边又去二分。得到两个序列中不超过\(x\)的数的数量。若这个数量\(cnt\ge\lceil\frac{len_{i}+len_{j}}{2}\rceil\),则\(x\)可能成为中位数,然后继续二分即可。把序列离散化,复杂度......
  • P7372
    又是模拟赛题,感觉挺牛的。kkio场了/bx首先发现每一次大操作等同于进行一次置换,会形成若干个置换环。根据经典结论得,设这些环长为\(cyc_i\),则有\(k=\operatorname{lcm}cyc_i\)。于是考虑在原图中构造若干置换环。然后通过手玩发现,可以在\(4\)步以内交换任意两个相邻的数。于......
  • P1379 八数码难题
    原题链接题解1:朴素广搜注意细节code1#include<bits/stdc++.h>usingnamespacestd;intpoi[4]={-3,1,-1,3};intmain(){strings;cin>>s;queue<string>q;map<string,int>rec;q.push(s);rec[s]=1;while(q.size())......
  • 若依集成CIM(即时推送系统)实现将服务端修改为SpringBoot+Vue前后端分离版(文末见代码
    ​ 场景若依前后端分离版本地搭建开发环境并运行项目的教程:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/108465662 CIMGitee地址:https://gitee.com/farsunset/cimCIM项目是基于mina或者netty框架下的推送系统,我们平常使用第三方的推送SDK,如极光推送,百度......
  • Vue学习笔记37--内置关系
    示例一:<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>一个重要的内置关系</title>......