Apache Solr(阿帕奇·索尔)教程:什么是Apache Solr及架构和安装

什么是Apache Solr 阿帕奇 · 索尔?

Apache Solr是一个开源搜索服务器平台,由 Apache 软件基金会以 Java 语言编写。它具有高度可扩展性,可以部署搜索引擎来处理大量以文本为中心的数据。使用 Apache Solr 的目的是索引和搜索大量 Web 内容,并基于搜索查询提供相关内容。G3b码友部落

Apache Solr 是一个基于 REST API 的 HTTP 包装器,围绕名为 Apache Lucene 的全文搜索引擎。倒置索引是单词列表,其中每个单词输入链接到存储它的文档。这样,只需简单的"get"操作,获取搜索查询"guru99"的所有文档。G3b码友部落

在这个Apache Solr 阿帕奇索尔初学者教程中,您将学习G3b码友部落

  • 什么是阿帕奇 · 索尔?
  • 阿帕奇·索尔的历史
  • 阿帕奇·索尔的特点
  • 阿帕奇索尔使用的关键术语
  • 阿帕奇索尔架构
  • 阿帕奇索尔应用程序
  • 如何安装阿帕奇索尔
  • 弹性搜索 Vs. 阿帕奇索尔
  • 阿帕奇·索尔的优势
  • 阿帕奇 · 索尔的不优势

Apache Solr 阿帕奇·索尔的历史

  • 1999: 道格切割出版卢塞内
  • 2004年:由Ynik Seeley在CNET开发,作为公司内部项目的一部分
  • 2006 年:CNET 通过将源代码捐赠给 Apache 软件基金会来发布源代码
  • 2008: Solr 1.3 发布,具有增强的搜索功能和性能增强
  • 2010: 卢塞内和索尔的合并
  • 2012: Solr 版本 4.0 发布,具有新的 Solr 云功能
  • 2016: Solr 6.0 发布,支持并行 SQL 查询的执行

Apache Solr 阿帕奇·索尔的特点

以下是Apache Solr 阿帕奇·索尔的重要功能:G3b码友部落

  • 自动负载平衡
  • 基于标准的开放接口 – XML、JSON 和 HTTP
  • 支持建议和拼写建议
  • 支持自动完成和地理空间搜索
  • 身份验证和授权的内置安全性
  • 允许您执行多语言关键字搜索
  • 自动完成/提前键入预测
  • 批处理和流处理
  • 构建机器学习模型非常简单
  • 专为大容量 Web 流量进行了优化
  • 全面的 HTML 赞叹界面
  • 支持架构和无架构配置
  • 分面搜索和筛选
  • 整个群集的中央配置

Apache Solr 阿帕奇索尔使用的关键术语

现在,在这个索尔搜索引擎教程中,我们将了解阿帕奇索尔使用的关键术语:G3b码友部落

关键术语 描述
索尔核心 Solr Core 可以定义为从所有文档派生的文本和字段的索引。一个 Solr 实例可能有单个或多个 Solr 内核。
核心 = 卢塞内索引的实例 = Solr 配置
索尔实例 Solr 实例是一个在 Java 虚拟机 (JVM) 中运行的 Solr 实例。在独立模式下,它只提供一个实例,而在云模式下,您可以拥有一个或多个实例。
索引 索引是将文档内容添加到 Solr 索引的方法。阿帕奇索尔使用阿帕奇卢塞内倒置索引技术。
文档 它是一组字段及其值。文档是存储在 Apache Core 中的基本数据单位。一个 Apache 内核可能包含一个或多个文档。
领域 该字段是一个键值对,用于在文档中存储实际数据。键指定字段名称和值包含该字段数据。文档可能有一个或多个字段。Apache Solr 使用它为文档内容编制索引。
宁静的 Apis 要与 Solr 通信,不必使用 Java 编程。相反,Apache Solr 提供宁静的服务来与其通信。您可以以各种文件格式(如 JSON、XML 和 CSV)发送文档并接收结果。
全文搜索 Solr 提供用于全文搜索的功能,如令牌、短语、拼写检查、自动完成、通配符等。
管理界面 Solr 提供易于使用、用户友好、功能强大的用户界面。使用该界面,您可以执行管理日志、添加、删除、更新和搜索文档等任务。
以文本为中心,按相关性排序 Apache Solr 用于搜索文本文档,结果根据用户的查询传递。
节点 在 Solr 云中,每个实例都称为节点。
集群 群集是节点的集合。
收集 群集具有逻辑索引,也称为集合。
碎片 它是集合的一个小区域,提供索引的单个或多个副本。
副本 副本是在节点中运行的分片的副本。
领袖 它是分片的副本,它发送 Solr 云的请求,用于其他副本。

Apache Solr 阿帕奇索尔架构

现在,在此 Solr 搜索教程中,让我们了解 Apache Solr 体系结构:G3b码友部落

Apache Solr Architecture

阿帕奇索尔架构G3b码友部落

Apache Solr 危及以下组件:

查询:

查询解析器分析需要传递给 Solr 的查询。它会验证查询以检查语法错误。分析查询后,它将转换为 Lucene 已知的格式。G3b码友部落

请求处理程序:

发送到 Apache Solr 的请求由请求处理程序处理。请求可以是查询请求或索引更新请求。您需要根据要求选择请求处理程序。若要将请求传递给 Solr,需要将处理程序映射到特定的 URL 端点。G3b码友部落

响应编写器

响应编写器将为输入查询生成格式化的输出。它支持各种格式,如XML,JSON,CSV等。对于不同类型的请求,您可能有不同的响应编写器。G3b码友部落

更新处理程序:

当您向 Apache Solr 发送更新请求时,它将通过一组插件、签名、日志记录、索引运行。此过程称为更新请求处理器。更新处理程序还负责修改,如添加或删除归档等。G3b码友部落

Apache Solr 阿帕奇索尔应用程序

应用 使用
内联网门户
  • 轻松访问搜索
  • 应用程序启动
  • 新闻和事件通知
  • 单点登录身份验证
联合客户端
  • 简化演示文稿
  • 搜索所有内容
  • 仅授权访问
  • 文档查看
仪器数据集
  • 为科学家优化
  • 数据相关菜单
  • 专用网格过滤器
监管文件
  • 专为研究人员设计
  • 丰富的元数据访问
  • 电子表格导出
  • 查看文档加速器
嵌入 PLM 应用程序中
  • 提供比 RDBMS 更好的搜索体验
  • 后期绑定安全模型
  • 记录工具栏上公开的操作

如何安装Apache Solr 阿帕奇索尔

第 1 步)转到此链接,G3b码友部落

单击"继续订阅"。G3b码友部落

G3b码友部落

步骤 2)下一页,G3b码友部落

点击接受条款。G3b码友部落

G3b码友部落

步骤 3)等一段时间 然后,G3b码友部落

一段时间后接受请求。G3b码友部落

G3b码友部落

步骤 4)刷新页面,G3b码友部落

单击"继续配置"G3b码友部落

G3b码友部落

步骤 5)保持设置为默认值,G3b码友部落

单击"继续启动"。G3b码友部落

G3b码友部落

Step 6) On the next page,G3b码友部落

将设置保持为默认G3b码友部落

  • 确保您拥有密钥的 pem 文件
  • 单击"启动"

G3b码友部落

您将看到此成功消息G3b码友部落

G3b码友部落

步骤 7)在 EC2 控制台中,G3b码友部落

注意实例的公共 DNSG3b码友部落

G3b码友部落

步骤 8)要访问索尔,G3b码友部落

只需使用 URLG3b码友部落

http://publicdns:8983

在我们的情况下, 它成为G3b码友部落

http://ec2-18-221-175-53.us-east-2.compute.amazonaws.com:8983

G3b码友部落

注意:如果您在访问实例时遇到问题,请更改实例中的入站和出站规则,以允许所有流量,如下下面的 Solr 查询示例所示:G3b码友部落

G3b码友部落

弹性搜索 Vs. 阿帕奇索尔Apache Solr

参数 阿帕奇 · 索尔 Apache Solr 弹性搜索
自然 这是一个开源项目。 不是开源项目。
静态状态 静在谢马.xml 弹性搜索中的静态. yml
格式 XML、 CSV 、 JSON 只有杰森
指数 可以在运行时通过收集/核心重新加载重新加载 在使用 REST 调用创建索引/类型期间定义
文档 这是有据可查的。 这是糟糕的记录。
拆分分片 可能 不可能

Apache Solr 阿帕奇·索尔的优势

  • 帮助您减少查找信息所用的时间
  • 它是快速,简单,强大和灵活的搜索引擎
  • 帮助您使产品和服务更易于访问
  • 增加客户在 Web 应用程序上支出
  • 帮助您改善 Web 应用程序的用户体验,以增加收入和利润
  • 全面的基于 HTML 管理界面
  • 灵活且可适应 XML 配置
  • 可扩展插件体系结构
  • 高度可扩展、强大、容错的搜索引擎
  • 支持分布式、着色、复制、聚类和多节点架构

Apache Solr 阿帕奇 · 索尔的不优势

  • 它不是符合酸的数据存储
  • 它作为主数据存储没有用处。仅用作辅助数据存储
  • 不为事务和分布式事务提供支持
  • 不支持联接和复杂查询
  • 对于规范化数据来说,不是最佳选择

总结G3b码友部落

  • Apache Solr 是基于开源REST API 的搜索服务器
  • Apache Solr 由 Yonik Seeley 在 CNET 开发,作为公司内部项目的一部分
  • Apache Solr 提供自动完成和地理空间搜索等功能
  • Solr Core、 Solr 实例、 索引、 文档、 宁静 API 、 全文搜索、 管理界面等是 Apache Solr 中使用的一些关键术语
  • 查询、请求处理程序、请求编写者和更新处理程序是 Apache Solr 的一些重要组件
  • 内联网门户、联合客户端、仪器数据集、规范文档、嵌入 PLM 应用程序中是有用的 Apache Solr 应用程序
  • Apache Solr 与弹性搜索相比有据可查, 弹性搜索记录不良
  • Apache Solr 的最大优点是它可以帮助您减少查找信息所用的时间
  • 此应用程序的主要缺点它不是符合 ACID 的数据存储.

 G3b码友部落