首页 > 其他分享 >solr

solr

时间:2022-11-01 23:00:51浏览次数:64  
标签:xml solr 分词 7.6 Solr solrQuery

目标:

solr的概念

solr服务器的搭建和使用

solr中导入数据库数据

项目中怎么使用solr实现商品搜索功能

一.solr相关概念

1.1 什么是Solr?

solr是一个独立的企业级搜索应用服务器,它是对外提供类似于web-service的api接口,用户可以通过http请求,发送一定格式的xml数据到solr,生成索引,也可以发送http get请求,请求solr服务器查询数据,将查询出的数据也是以xml格式返回.

1.2.为什么要用solr?

1.数据库的模糊查询没有分词的功能,solr有,可以更有效的查询到我们需要的数据

2.从solr 服务器中查询数据会比从数据库查询速度要快.

1.3.solr的工作方式

文档通过Http利用XML 加到一个搜索集合中。Solr查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

1.4. solr特点

1.高级全文搜索能力:由Lucene 提供支持,Solr可实现强大的匹配功能,包括短语,通配符,联接,分组以及任何数据类型 .

2.拥有基于标准的开放式接口- XML、JSON 和 HTTP

3.综合的管理界面

4.高度的可扩展性和容错性

5.能够实时索引

6.可扩展的插件架构,Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。

1.5.solr版本和jdk需求关系

​ 版本 发布时间 说明

​ 1.1 2007-01-18 -

​ ....

​ 4.0.0 2013-01-16 Java 1.6 以上,ZooKeeper 3.3.6;引入solrcloud

​ ....

​ 4.7.1 2014-04-01 Java 1.6 以上,最后一个采用旧版配置方法版本

​ 4.8.0 2014-04-27 Java 1.7 以上,ZooKeeper 3.4.6

​ ....

​ 6.0.0 2016-04-07 Java 1.8 以上,Jetty 9.3.8

​ .....

1.6. Solr 相关链接

​ Solr 各版本下载地址:http://archive.apache.org/dist/lucene/solr/

​ Solr 官方网站:http://lucene.apache.org/solr/resources.html

​ 详细的solr中文手册链接:https://www.w3cschool.cn/solr_doc/

二.solr的安装

2.1 下载jar 7.6.0

2.2 解压

​ 解压出来的文件目录


2.3 启动服务器

2.4访问

输入: http://localhost:8983

三 创建core

在solr中,每一个core代表一个索引库,里面保存索引数据以及配置信息

solr中可以有多个core,也就相当于mysql服务器下可以多个数据库

3.1 方法1: 用命令创建

  1. solr create -c core名称
  2. core的存放路径

3.2 方法2:界面创建

​ 1.在solr-7.6.0/server/solr 文件夹下创建一个core文件夹 ,取名为students(商城项目里取名为goods)

  1. 将C:\solr-7.6.0\server\solr\configsets\_default下的conf文件复制一份到students(或goods)文件夹下

    3.在solr界面Add Core,(之前取名goods的 这里名字就为goods)

四. 添加中文分词

​ 选择刚才创建的core,点击Analysis进入分词分析页面,输入要分词的句子,选择分词库,点击分析按钮,即可看到分词结果

​ solr默认不支持中文分词

4.1测试自带的中文分词(商城项目配置 跳过这一步 直接用后面的ik分词器)

4.1.1 添加中文分词插件

​ solr 7.6中自带中文分词插件,将solr-7.6.0\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.6.0.jar 复制到 solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib 目录中

4.1.2配置中文分词

修改 solr-7.6.0\server\solr\articles【创建的core的名称】\conf\managed-schema文件

添加我们的中文配置【在eclipse/idea等工具里打开,记事本打开容易出现编码问题】

 <!-- Chinese -->
<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">

   <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
   </analyzer>
   
   <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
   </analyzer>
   
</fieldType>

4.1.3重启solr,测试中文分词

​ solr restart -p 8983

4.2 测试中文分词起ik-analyzer

4.2.1 下载ik-analyzer-7.6.0.jar包

​ 并添加到solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib 目录中

4.2.2 在创建的core里的配置文件managed-schema.xml中添加

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
     <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
     <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
     <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
     <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

4.2.3 重启服务器, 测试

solr restart -p 8983

五.导入数据库中数据

  1. 将数据库jar包(在发你们的solr资料文件里)

1562846037862

​ 和solr-7.6.0\dist下的dataimporthandler-7.6.0架包 (注意是mysql驱动和dataimport两个jar包)复制到 C:\solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib

1562846069945

  1. 创建data-config.xml文件

​ goods/conf文件夹下创建mysql-db文件夹,然后在mysql-db文件夹中创建data-config.xml文件,文件中添加如下内容

<?xml version="1.0" encoding="utf-8" ?>
<dataConfig>
    <dataSource type="JdbcDataSource"
     driver="com.mysql.jdbc.Driver"
     url="jdbc:mysql://localhost:3306/sc"
     user="root"
     password="root"
    />

    <document>
        <entity name="goods" query="select goods_id,goods_name,sales_price,goods_img,cid from goods">
               <field column="goods_id" name="id" />
               <field column="goods_name" name="goodsName" />
               <field column="sales_price" name="salesPrice" />
               <field column="goods_img" name="goodsImg" /> 
               <field column="cid" name="cid" />
        </entity>

    </document>
</dataConfig>
  1. 添加document中的字段

    在managed-schema.xml文件中添加


注意: id,version,root 不能删除

  ​         _text_ 不需要 可以删除

  ```
  <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
  <!-- docValues are enabled by default for long type so we don't need to index the version field  -->
  <field name="_version_" type="plong" indexed="false" stored="false"/>
  <field name="_root_" type="string" indexed="true" stored="false" docValues="false" />
  <field name="goodsName" type="text_ik" indexed="true" stored="true"  multiValued="false" />
  <field name="salesPrice" type="plong" indexed="true" stored="true"  multiValued="false" />
  <field name="goodsImg" type="string" indexed="true" stored="true"  multiValued="false" />
  <field name="cid" type="string" indexed="true" stored="true"  multiValued="false" />
  ```
  1. 导入data-config.xml文件

    在solrconfig.xml文件中添加

    <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
      <lst name="defaults">
        <str name="config">mysql-db/data-config.xml</str>
      </lst>
    </requestHandler>
    
    1. 重启solr

    2. 导入数据

      1562846587097

  2. 测试查询

    1562846639312

六. ssm中使用solr

  1. 添加jar包

     <!-- solr jar包 -->
    <dependency>
      <groupId>org.apache.solr</groupId>
      <artifactId>solr-solrj</artifactId>
      <version>7.6.0</version>
    </dependency>
    
  2. 在spring.xml中配置

    <!-- 配置solr客户端对象 -->
    <bean id="httpSolrClient" class="org.apache.solr.client.solrj.impl.HttpSolrClient">
         <constructor-arg name="builder" value="http://localhost:8983/solr/goods" />
    </bean>
    
  3. 修改pojo中goods类

    1562849526556

  4. 控制层写solr查询操作

    @RequestMapping("showGoodsByWhere2")
        public String search2(@RequestParam(name = "pageIndex",defaultValue = "1") int pageIndex, int cid,@RequestParam(name = "keyword",defaultValue = "西") String keyword) throws IOException, SolrServerException {
            //创建一个query对象
            SolrQuery solrQuery=new SolrQuery();
            //设置默认的查询范围
            solrQuery.set("df", "goodsName");
            //设置查询条件
            solrQuery.setQuery(keyword+"*");
            //设置过滤条件
            solrQuery.setFilterQueries("cid:"+cid);
            //设置排序条件
            solrQuery.setSort("goodsPrice",ORDER.desc);
            
            solrQuery.addField("id");
            solrQuery.addField("goodsName");
            solrQuery.addField("salesPrice");
            solrQuery.addField("goodsImg");
            //solrQuery.addField("cid");
            solrQuery.setStart(0);
            //每页显示多少行
            solrQuery.setRows(2);
            //设置高亮(开启)
            solrQuery.setHighlight(true);
            //设置高亮域
            solrQuery.addHighlightField("goodsName");
            //设置高亮前缀
            solrQuery.setHighlightSimplePre("<em>");
            //设置高亮后缀
            solrQuery.setHighlightSimplePost("</em>");
    
            // 创建组合条件串
           // StringBuilder params = new StringBuilder("cid:" + cid);
           // params.append(" and goodsName:"+keyword);
           // solrQuery.setQuery(params.toString());
    
            //将查询对象传递到服务器端
            QueryResponse queryResponse= httpSolrClient.query(solrQuery);
    
            httpSolrClient.commit();
    
            List<Goods> list=  queryResponse.getBeans(Goods.class);
    
            System.out.println(list.toString());
           // ModelAndView modelAndView=new ModelAndView();
            //modelAndView.addObject("goodsList",list);
           // modelAndView.setViewName("searchList");
    
            //return modelAndView;
            return "success";
        }
    

标签:xml,solr,分词,7.6,Solr,solrQuery
From: https://www.cnblogs.com/daimenglaoshi/p/16849485.html

相关文章

  • solr服务器
    目标:solr的概念solr服务器的搭建和使用solr中导入数据库数据项目中怎么使用solr实现商品搜索功能一.solr相关概念1.1什么是Solr?solr是一个独立的企业级搜索应用服务器,它......
  • Solr 8.11入门教程(4)中文分词
    中文分词默认对中文分词的效果并不好,我们添加IK分词。下载重新下载:先下载solr8版本对应的ik分词器,分词器GitHub源码地址:https://github.com/magese/ik-analyzer-solr添......
  • Solr 8.11入门教程(2)创建core
    新建core添加core命令添加使用命令比较简单~$bin/solrcreate-cmytest[core名称]这样就添加完了。CoreAdmin就可以看到了。手动添加手动添加相对复杂一些,需要提......
  • Solr 8.11入门教程(2)创建core
    新建core添加core命令添加使用命令比较简单~$bin/solrcreate-cmytest[core名称]这样就添加完了。CoreAdmin就可以看到了。手动添加手动添加相对复杂一些,需要提前创建目......
  • Solr 8.11入门教程(2)新建core
    Solr8.11入门教程(2)新建core添加core命令添加使用命令比较简单~$bin/solrcreate-cmytest[core名称]这样就添加完了。CoreAdmin就可以看到了。手动添加手动......
  • docker安装solr
    目录一、简介二、docker安装三、创建solr核心命令四、配置solr登录密码五、接口操作六、参考一、简介solr是一个基于Lucene的Java搜索引擎服务器。同时对其进行了扩展,提......
  • solr - 环境变量 SOLR_HOME 的真正根目录位置
    echo"exportSOLR_HOME="${setup}${plugNme}/server/solr>>/etc/profile给环境变量配置的solr根目录位置应该是solr安装根目录里的  /server/solr  千万不要设......
  • 全文搜索引擎Solr原理和实战教程
    Solr简介1.Solr是什么?Solr它是一种开放源码的、基于LuceneJava的搜索服务器,易于加入到Web应用程序中。Solr提供了层面搜索(就是统计)、命中醒目显示并且支持多......
  • Elasticsearch和Solr的区别
    1、基于Lucene开发他们底层都是基于Lucene开发,使用了Lucene的倒排索引实现的2、解决IO阻塞性能solr在实时建立索引的时候产生的IO阻塞查询性能会比ES差一些3、是否......