首页 > 其他分享 >Elasticsearch 基础-1

Elasticsearch 基础-1

时间:2024-03-16 09:44:07浏览次数:18  
标签:index 基础 Elasticsearch 分片 集群 type es 分布式

Elasticsearch是一个基于 Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引孳,基于 RESTful web接口。

功能:
分布式的搜索引擎和数据分析引擎
全文检索(like),结构化检索(a=1),数据分析(count/group by)
对海量数据进行近实时的处理(秒级)

特点:
可拓展性:大型分布式集群(数百台服务器)技术
技术整合:将全文检索、数据分析、分布式相关技术整合在一起
部署简单:开箱即用,很多默认配置不需关心,解压完成直接运行即可,拓展时,只需多部署几个实例即可,负载均衡、分片迁移集群内部自己实施。
接口简单:使用restful api经行交互,跨语言
功能强大:如全文检索,同义词处理,相关度排名

核心概念:
NRT( Near Realtime):近实时
1)写入数据时,过1秒才会被搜索到,因为内部在分词、录入索引
2)es搜索时:搜索和分析数据需要秒级出结果。

Cluster:集群
包含一个或多个启动着es实例的机器群。通常一台机器起一个es实例。同一网络下,集名一样的多个es实例自动组成集群,自动均衡分片等行为。默认集群名为"elasticsearch"。

Node:节点
每个es实例称为一个节点。节点名自动分配,也可以手动配置。

Document:文档
es中的最小数据单元。一个document就像数据库中的一条记录。通常以json格式显示。多个document存储于一个索引(Index)中。

Index:索引
包含一堆有相似结构的文档数据。
索引创建规则:
仅限小写字母;
不能包含\、/、*、?、"、<、>、、#以及空格符等特殊符号;
从7.0版本开始不再包含冒号
不能以-、或+开头
不能超过255个字节(注意它是字节,因此多字节字符将计入255个限制)

Field:字段
就像数据库中的列(Columns),定义每个document应该有的字段

Type:类型
每个索引里都可以有一个或多个type,type是index中的一个逻辑数据分类,一个type下的document,都有相同的field。
注意:6.0之前的版本有type(类型)概念,type相当于关系数据库的表,ES官方将在ES9.0版本中彻底删除type。

shard:分片
减轻单node的压力、充分利用机器性能、方便集群拓展
index数据过大时,将index里面的数据,分为多个shard,分布式的存储在各个服务器上面。可以支持海量数据和高并发,提升性能和吞吐量,充分利用多台机器的cpu。

replica:副本
为了容错
优点:高可用、只查询时可提高吞吐量
在分布式环境下,任何一台机器都会随时岩机,如果宕机,index的一个分片没有导致此index不能搜索。所以,为了保证数据的安全,我们会将每个index的分片进行备份,存储在另外的机器上。保证少数机器宕机es集群仍可以搜索。能正常提供查询和插入的分片叫做主分片(primaryshard),其余的叫做备份的分片(replicashard)。
es6默认新建索引时,5分片,1副本,也就是一主一备,共10个分片。所以,es集群最小规模为两台。es7 1分片,1副本,一共2分片。

数据库核心概念 vs Elasticsearch核心概念

标签:index,基础,Elasticsearch,分片,集群,type,es,分布式
From: https://www.cnblogs.com/l-zl/p/18075960

相关文章

  • 人工智能入门之旅:从基础知识到实战应用(一)
    一、引言人工智能(ArtificialIntelligence,AI)是指利用计算机科学和技术模拟、延伸和扩展人类智能的理论、方法、技术和应用系统的学科。它的目标是使计算机系统具有类似于人类的智能,能够感知环境、学习、推理、规划、解决问题和交流。在当今社会中,人工智能具有极其重要的地......
  • 1分钟带你学会Python面向对象基础语法
    1.类和对象python中的面向对象主要学习类和对象类:是多个具有特殊功能的个体的集合,例如:人类/猫类/犬类对象:在一个类中,一个具有特殊功能的个体,能够帮忙解决某件特定的事情,也被称为实例两者之间的关系:类是用于描述某一类对象的共同特征,而对象是类的具体的存在在程序中......
  • C语言新手经典基础题——冒泡排序
    冒泡排序:用户输入一组数,编写程序将该组数据进行从小到大的顺序进行排列。举个例子:用户输入;1413918766这一组数据,现在要将这组数据进行从小到大的程序进行排列。我们编写程序的思路如下:现将第一个数和第二个数进行比较,即14和13,13比14小,那么就将13和14进行位置的调换,13......
  • 大规模C++程序设计 -- 基础知识
    基础知识我们先回顾C++程序语言和面向对象分析的一些重要的方面,这些知识对于大型系统设计来说是基本的。我们仔细分析多文件程序、声明与定义,以及在头文件和实现文件上下文中的内部链接和外部链接,然后研究typedef和assert的使用。多文件C++程序对于所有的(除了最小的)程序来说,将......
  • Java学习第二天——基础语法
    Java基础语法数据类型强类型语言要求变量的使用要严格符合规定,所有变量都必须先定义后才能使用!!!Java的数据类型分类基本类型(primitivetype)1.数值类型整数类型浮点类型字符类型(只占有两个字节)2.boolean类型:占一位,其值为true或者false引用类型(referencetype)类、接......
  • Java基础知识篇02——Java基本语法
    一、数据类型定义:就是用了保存数据的一个类型,一种数据类型,只能保存该类型数据值作用:只有了解数据类型,才能选择合适的类型存放数据,才能更好的利用计算机硬件资源(内存和硬盘等)。不同的数据类型存放数据大小是不同的。数据类型的使用方式就是用来声明一个变量,装数据的。......
  • 多线程面试-基础篇(多线程系列连更,后续可查看合集)
    问:线程和进程的区别?答:根本区别:进程是系统划分资源的最小单位,线程是cpu执行和调度的最基本单位。进程包含线程,进程内可包含多个线程。问:为什么要使用多线程?答:提高cpu利用率,并且线程切换和调度成本远小于进程。问:什么是线程死锁?如何避免线程死锁?线程死锁是指,在多线程情况下,A......
  • Elastic Stack基础
    ElasticStack组件介绍ElasticsearchElasticsearch是使用java开发,基于Lucene、分布式、通过Restful方式进行交互的近实时搜索平台框架。它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等LogstashLogstash基于java开发,是一个数......
  • Elasticsearch - Docker安装Elasticsearch8.12.2
    前言最近在学习ES,所以需要在服务器上装一个单节点的ES服务器环境:centos7.9安装下载镜像目前最新版本是8.12.2dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.12.2创建配置新增配置文件elasticsearch.ymlhttp.host:0.0.0.0http.cors.enabled:true......
  • 卡码java基础课 | 13.链表的基础操作I
    学习内容:链表基础重点归纳:见例题例题:解:点击查看代码importjava.util.Scanner;//定义链表classLinkedList{//定义链表中的链表节点publicstaticclassNode{intdata;//数据Nodenext;//指针publicNode(intdata){/......