博客
关于我
solr--windows环境下安装与配置
阅读量:128 次
发布时间:2019-02-26

本文共 1200 字,大约阅读时间需要 4 分钟。

Solr搜索引擎安装与配置指南

Solr是一个高性能的开源全文搜索引擎,基于Lucene框架,支持多种文本格式索引和高效查询。以下将详细介绍Solr的安装配置步骤,以及如何实现中文分词功能。


Solr概述

Solr是一个基于Lucene的全文检索引擎,提供高效的搜索、灵活的缓存功能和垂直搜索能力。它支持通过HTTP接收文档(如XML、JSON),并以结构化响应形式返回结果。Solr的主要特点包括:

  • 高效搜索:支持实时搜索和垂直搜索。
  • 灵活配置:提供强大Data Schema,允许定义字段、设置分词器和文本分析。
  • 跨平台支持:通过REST API接口,支持多种编程语言。
  • 可扩展性:支持集群部署和索引复制。

Solr优点

  • 成熟稳定:拥有庞大用户社区和丰富的开发资源。
  • 多格式支持:支持HTML、PDF、JSON、XML等多种文本格式。
  • 快速搜索:不需预先建立索引,能够实时搜索。
  • 跨平台支持:通过REST API方便集成任何编程语言。
  • 强大功能:提供高亮显示、缓存机制和Web管理界面。

  • Solr缺点

  • 索引建立后搜索效率较低,尤其是在实时搜索场景下。

  • 安装配置步骤

    1. 获取安装包

    下载Solr的最新版本,并解压后获取dist目录下的war包。将该包拷贝至Tomcat的webapp目录,并更改包名以便于访问。

    2. 启动Tomcat

    按照默认步骤启动Tomcat服务器,确保可以访问Solr的管理界面。

    3. 扩展功能

    ext目录下的jar包复制至WEB-INF/lib,添加自定义扩展功能。

    4. 配置Solr存储位置

    solr目录从example目录复制到更高级别目录,并重命名为solrhome。确保目录结构完整。

    5. 配置Solrhome路径

    WEB-INF/web.xml中注释掉默认配置,添加自定义存储路径。

    6. 启动并测试

    保存配置后重启Tomcat,访问Solr管理界面,完成数据库选择和索引配置。


    IK Analyzer配置

    1. 添加中文分词支持

    Solr默认不支持中文分词,需手动配置IK Analyzer。将IKAnalyzer相关jar包添加至WEB-INF/lib

    2. 创建自定义词典

    如果需要自定义分词词典,创建mydict.dic文件,并将其添加至solrhome/conf目录。

    3. 配置Solrhome schema.xml

    solrhome/schema.xml中添加自定义字段类型,指定使用IK Analyzer进行分词。

    4. 启用自定义分词

    在Solr管理界面中选择自定义字段类型,确保分词功能正常运行。


    动态域配置

    1. 定义动态域

    schema.xml中添加动态域配置,如:

    2. 复制字段

    通过copyField指令将源字段数据复制至目标域。


    通过以上步骤,您可以成功安装并配置Solr搜索引擎,并实现中文分词功能。

    转载地址:http://rraz.baihongyu.com/

    你可能感兴趣的文章
    Nginx配置实例-负载均衡实例:平均访问多台服务器
    查看>>
    NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
    查看>>
    NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
    查看>>
    Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
    查看>>
    NIFI大数据进阶_离线同步MySql数据到HDFS_02_实际操作_splitjson处理器_puthdfs处理器_querydatabasetable处理器---大数据之Nifi工作笔记0030
    查看>>
    NIFI大数据进阶_连接与关系_设置数据流负载均衡_设置背压_设置展现弯曲_介绍以及实际操作---大数据之Nifi工作笔记0027
    查看>>
    NIFI数据库同步_多表_特定表同时同步_实际操作_MySqlToMysql_可推广到其他数据库_Postgresql_Hbase_SqlServer等----大数据之Nifi工作笔记0053
    查看>>
    NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南001---大数据之Nifi工作笔记0068
    查看>>
    NIFI集群_内存溢出_CPU占用100%修复_GC overhead limit exceeded_NIFI: out of memory error ---大数据之Nifi工作笔记0017
    查看>>
    NIFI集群_队列Queue中数据无法清空_清除队列数据报错_无法删除queue_解决_集群中机器交替重启删除---大数据之Nifi工作笔记0061
    查看>>
    NIH发布包含10600张CT图像数据库 为AI算法测试铺路
    查看>>
    Nim教程【十二】
    查看>>
    Nim游戏
    查看>>
    NIO ByteBuffer实现原理
    查看>>
    Nio ByteBuffer组件读写指针切换原理与常用方法
    查看>>
    NIO Selector实现原理
    查看>>
    nio 中channel和buffer的基本使用
    查看>>
    NIO基于UDP协议的网络编程
    查看>>