首页 > 其他分享 >Solr使用性能优化设想

Solr使用性能优化设想

时间:2023-06-25 10:59:06浏览次数:49  
标签:抽取 solr 可以 设想 查询 使用性能 即可 全量 Solr

如果全量数据和增量数据有指定时间,默认近一个月 1. 是否可以通过集合名称中指定当前月份和上月集合,作为一个客户端,如果不行,可以考虑建立别名,该别名中只有近两个月的集合。   2. 其他关系表,更新数据时尽量少从solr中查询,,最后时间以当前的即可(应为bcp文件处理时是有顺序的))、参数(直接即可),最早时间考虑是否可以去掉(展示的时候,可以从全量表中查询即可,且该字段热门值可以缓存),hitcount考虑是否可以去掉(同理展示的时候从solr中查询) 但当前关系表似乎没有构成瓶颈,可以和产品经理确认下。如果不查询已有关系数据,直接插入一台机器写入似乎可以胜任。   3.数据处理程序增量的和全量分开,各使用一台机器处理。 至于一些域名和脚本关联的对象数量,只需要存储哪些关联其他对象数量超过1000个以上的即可。(对时效性要不不算太高,聚类关系抽取的时候先从该表过滤异常点,然后抽取,再判断抽取的关系中是否有异常点,然后存入表中,应该没有需要具体次数的场景,如果阈值变化,删除小于阈值的即可)   4.查询页面只真实前10000条数据。   5.导出可以全量,使用scroll进行深度分页优化。不过最好还是要限制,让用户加上时间限制或其他条件进行过滤。   6.段合并,适量加大mergeFactor参数,来降低合并频率,频繁的段合并会消耗大量系统资源

标签:抽取,solr,可以,设想,查询,使用性能,即可,全量,Solr
From: https://www.cnblogs.com/seufelix/p/17502365.html

相关文章

  • SolrCloud实践过程中问题思考以及处理方法
    一:数据量大后,单个集合存储量过大。问题:一方面写入过慢,另一方面:查询读取速度也过慢。解决步骤:1.按时间维度拆分集合,保证单个集合中在每个节点的shard,数据量在3000-5000万条之间。这样写入在最近时间归属的集合中操作。2.写入的时候,按数量进行批次写。(数百至千条之间,经验值)3.......
  • SAP Commerce Cloud SolrIndexNotFoundException 异常 - 做 full indexing 的详细位置
    Console看到消息:NoActiveindexfound,FULLindexeroperationmustbeperformedbeforeanyotheroperationCausedby:de.hybris.platform.solrfacetsearch.solr.exceptions.SolrIndexNotFoundException:de.hybris.platform.servicelayer.exceptions.UnknownIdentifie......
  • solr 模拟数据库like查询(不使用分词)
    IK分词个别拆分的不够完美,另外个别业务逻辑是需要替代数据库的like查询。所以本篇文章是介绍如何在solr中使用类似数据库的like查询。本片文章是介绍如何在solr中使用类似数据库的like操作。首先我们抛弃text_ik。IK分词,因为使用的是like操作,所以这块不能在使用分词了。我们需......
  • 制造储存放射性元素容器的设想
    制造储存放射性元素容器的设想制造储存放射性元素容器的设想自然界中的抗放射性背景压力的高低是与宇宙运动(膨胀或收缩)的不同时期、不同区域密切相关的.宇宙爆炸的初期,抗裂变背景压力极高,只有极大的核才具有放射性.随着宇宙的进一步膨胀,宇宙中的物质的平均密度与......
  • Apache Solr 教程_编程入门自学教程_菜鸟教程-免费教程分享
    教程简介ApacheSolr是一个开源搜索服务器。Solr是用Java语言开发的,主要基于HTTP和ApacheLucene实现。存储在ApacheSolr中的资源存储为Document对象。ApacheSolr入门教程-从基本概念开始,简单易学地了解ApacheSolr,其中包括概述,搜索引擎基础知识,Windows环境,Had......
  • 基于AIGC的京东购物助手的技术方案设想
    灵感来源随着AIGC的爆火,ChatGPT,GPT-4的发布,我作为一个算法工作者,深感AI发展的迅猛。最近,OpenAI的插件和联网功能陆续向用户公开,我也在第一时间试用了这些最新的功能。在OpenAI的插件市场上,我被一个可以帮助分析食谱,并生成购物清单的功能所吸引。我开始思考,如果我能够基于京东商城......
  • Solr的入门实例
    当涉及到Solr的入门实例时,以下是一个详细的示例,展示了如何设置Solr服务器并执行索引和查询操作。准备工作:安装Solr:请按照Solr官方文档中的说明安装并启动Solr服务器。创建集合:在Solr控制台上创建一个名为"my_collection"的集合。添加文档:创建一个名为"solr-demo"的Cor......
  • elasticsearch在启动后出现[transport.netty][solr001] exception caught on transpor
    elasticsearch在启动后出现如下错误:[2019-04-18T09:29:57,850][WARN][o.e.t.n.Netty4Transport ][xHaZmSP]exceptioncaughtontransportlayer[[id:0xe6246f88,L:/127.0.0.1:9300-R:/127.0.0.1:9493]],closingconnectionjava.io.IOException:杩滅▼涓绘満寮鸿揩鍏......
  • C# 读取网络上下行(不要使用性能计数器的方式)
    C#读取网络上下行有多种方式,其中有一种是使用System.Net.NetworkInformation命名空间中的NetworkInterface类和PerformanceCounter类,该方式其实读的是windows系统的性能计数器中的NetworkInterface类别的数据。方式如下:NetworkInterfacenetworkInterface=NetworkInterface......
  • Solr搜索引擎的简介
     Solr是一个基于Lucene的搜索引擎,它能够快速、可靠、强大地处理大量数据。Solr提供了一个HTTP接口,可以通过Java、Python、PHP等多种编程语言进行访问。Solr是一个开源的项目,由Apache软件基金会维护。Solr的主要特点包括:快速:Solr使用Lucene的索引技术,能够快速地处理大量的数据......