首页 > 其他分享 >Elasticsearch简介

Elasticsearch简介

时间:2024-11-12 16:45:15浏览次数:3  
标签:index 简介 Lucene 索引 文档 doc Elasticsearch

前言

什么是搜索引擎

  • 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。
  • 分类:
    • 全文索引搜索引擎
      • 采集ip段内的网页数据,扫描网页内容的每一个词,对其创建索引,指明词频、位置,存入数据库,当用户以关键词查找信息时,搜索引擎会在数据库中,根据关键词的匹配程度、出现的位置、频次等算法,匹配结果一般按照关联度降序返回
      • 比如百度、必应、谷歌、搜狗等
    • 目录索引搜索引擎
      • 对网站进行人工分类,所以目录索引也被称为分类检索;
      • 在爬取数据时,将网页根据一定的目录进行分门别类,类似图书馆一样分为:汽车、机械、植物、历史等
      • 用户检索时,可以先依据分类缩小检索范围,比如你在新浪网首页,选择了房产->二手房
    • 垂直搜索
      • 垂直搜索引擎适用于有明确搜索意图情况下进行检索。
      • 也可以理解为单个(少量)行业专用搜索
      • 例如各大电商(商品)、携程(机票、车票、住宿)等

什么是Elasticsearch

Elasticsearch is a distributed search and analytics engine, scalable data store, and vector database built on Apache Lucene. It’s optimized for speed and relevance on production-scale workloads. Use Elasticsearch to search, index, store, and analyze data of all shapes and sizes in near real time.

Elasticsearch 是一个基于 Apache Lucene 构建的分布式搜索和分析引擎、可扩展的数据存储和矢量数据库。 它针对生产规模工作负载的速度和相关性进行了优化。 使用 Elasticsearch 近乎实时地搜索、索引、存储和分析各种形状和大小的数据。

  • 应用场景
    • 海量数据搜索场景。
    • 日志处理和分析,例如:通过ELK搭建日志处理和分析方案。
    • 地理空间数据搜索,例如:查询5km以内店铺、统计一个月内某个用户去过哪些地方(点)。

什么是Lucene

  • Lucene是一个开放源代码的全文检索引擎工具包
  • 它提供了一个简单但强大的应用编程接口(API),通过API可以对各种信息资源(如:文本文件、电子邮件、数据库等)实现快速的全文检索功能。
  • Lucene由JAVA语言开发,索引可以很容易地,嵌入到使用Java开发的应用程序中。
  • 但是为什么不直接使用Lucene进行开发呢,因为整个体系太难了

    标签:index,简介,Lucene,索引,文档,doc,Elasticsearch
    From: https://blog.csdn.net/qq_36075491/article/details/143713161

相关文章

  • ElasticSearch 7.14 向已启用XPACK认证的集群增加新的节点
    一、环境现状描述:     目前的ElasticSearch集群仅有一个单一节点,且这个集群中已建立有索引,索引已包含业务文档数据(超过200G),该集群已经启用XPACK认证,现希望扩展这个集群,增加复制节点,且复制节点启动后,自动从主节点同步数据到新节点。     目前的ElasticSearch集群节点......
  • jQuery 选择器简介及其代码样例
    一、jQuery选择器简介jQuery选择器是一种强大的工具,用于在HTML文档中快速、便捷地选取一个或多个DOM元素,以便对这些元素进行后续的操作,比如修改样式、添加事件处理函数、获取或修改元素内容等。它提供了多种类型的选择器,每种类型都有其特定的用途和语法,使得开发者可以根据......
  • 集成学习(Ensemble Learning)简介
    1集成学习作用俗话说:“三个臭皮匠赛过诸葛亮”。当使用某一种分类器不能使我们达到很好的效果的时候,我们不妨设想将这些分类效果不好的分类器组合一下,再去看看效果是否有提升,这就是集成学习(EnsembleLearning)的思想。集成学习是机器学习中的一种思想,它通过多个模型的组合......
  • SpringBoot项目引入Elasticsearch时启动失败
    1、前情提要:https://www.elastic.co/guide/en/elasticsearch/client/java-api-client/current/installation.html以上是Elasticsearch对接Java的官方文档(pom依赖部分)我本地Windows安装的Elasticsearch也是8.15.3版本 2、启动报错***************************APPLICATION......
  • (12-1)使用YOLOv8识别检测交通标志:背景介绍+项目简介+准备环境
    12.1 背景介绍随着自动驾驶技术的不断发展和智能交通系统(ITS)逐步普及,交通标志的自动识别成为了交通安全和管理中的一个重要研究领域。交通标志不仅为驾驶员提供必要的指示信息,同时也是自动驾驶系统中重要的感知模块。准确、高效地识别和理解交通标志对自动驾驶系统的安全性......
  • # Playwright爬虫(.net)介绍:1 简介
    Playwright是一个由Microsoft开发的开源工具,用于自动化Web浏览器的测试和操作。它提供了一种跨浏览器、跨平台的自动化解决方案,可以在Chromium、FireFox、微软Edge等多种浏览器上进行测试和操作。如果你曾经使用过Selenium,那么我可以告诉你,Playwright的用途与Selenium非常类似,可......
  • USB、CAN、CAN FD、SPI、IIC、UART常见的通信协议简介
    USB、CAN、CANFD、SPI、IIC、UART都是常见的通信协议,它们在许多领域都有广泛的应用。以下是对这些通信协议的详细介绍:USB(通用串行总线)定义:USB(UniversalSerialBus)是一种计算机与外围设备进行数据交互的通信协议。版本与速度:常用的版本有USB2.0(480Mbps)和USB3.0(速率更高)。......
  • QRust(一) 简介
    QRust是一个开源组件,是Qt和Rust两种语言的混合编程中间件,是Qt调用Rust函数的支持技术。QRust来源于工具软件OnTheSSH,OnTheSSH软件由Qt和Rust两种语言共同构建,Rust实现了SSH通讯底层协议,Qt搭建程序界面,Qt调用Rust的技术需求催生出了QRust。一个使用QRust的例子:Rust端:fninvo......
  • Elasticsearch上创建的index是yellow健康状态的解决方案
    在Elasticsearch中,索引的健康状态(healthstatus)反映了索引的分片分配情况和集群的整体健康状况。这些状态可以帮助您快速了解索引和集群的运行情况。以下是Elasticsearch中索引的三种健康状态及其意义:1.green(绿色)含义:所有主分片(primaryshards)和副本分片(replicashards)都已成功......
  • macOS 下使用 Docker 安装 ElasticSearch(学习环境用)
    当前环境操作系统:macOS15.0.1Docker版本:DockerDesktop:Version4.34.3(170107)DockerEngine:27.2.0安装步骤提示:此部署只为学习使用,没有挂载本地文件1、安装ElasticSearch#安装命令#1.1创建网络somenetwork用于docker间通讯dockernetworkcreateso......