作者:天边的云YEAH_988 | 来源:互联网 | 2023-06-24 09:00
云、分析和认知搜索时代的开源搜索引擎Solr与Elasticsearch在我们的客户项目和企业搜索社区中经常讨论。由于其灵活性、可伸缩性和成本效益,Solr被大型和小型企业广泛使用
云、分析和认知搜索时代的开源搜索引擎 Solr和Elasticsearch在我们的顾客项目和企业搜索社区经常被讨论。 但是,随着传统的企业搜索发展到了Gartner所说的“洞察引擎”,我们将重新审视这个主题,提供云、分析、认知搜索能力相结合的最新观察结果,有助于对Solr和Elasticsearch的评价。
Solr是什么? Solr是Apache软件基金会Lucene项目的主要开源搜索引擎。 由于其灵活性、可扩展性和成本效益,Solr在大企业和中小企业中得到广泛应用。
与Elasticsearch是什么?一样,基于Lucene的Elasticsearch是另一个支持强大企业APP的开放源代码搜索引擎。 Elastic是开发电子搜索和电子堆栈的公司,为搜索、日志分析和其他高级分析用例提供企业级解决方案。
选择您的开源搜索引擎通常,我们帮助客户对在自己的企业解决方案中使用开源搜索引擎进行评估时,“Solr和Elasticsearch哪个更好? ”。 有人可能会先入为主,认为一个人天生比另一个人优秀,但是“哪个对我好呢? ”时。 这样表述的话,这个问题更相关。
虽然可以使用各种搜索引擎技术,但最流行的开源变体是依赖于Apache Lucene底层核心功能的技术,本质上是使搜索引擎发挥作用的部分。 Solr和Elasticsearch是搜索库上方的组件,为完整的搜索产品提供了独特的实现和特性。 虽然Lucene的核心功能为Solr和Elasticsearch的基本搜索功能提供了相同的体验,但围绕Lucene的实现方式产生了不同之处。
搜索引擎的作用不仅在于有效地搜索信息,还在与内容分析、预测建模、自然语言处理(NLP )、机器学习)、相关得分等认知/智能搜索功能的集成中起着重要的作用。 我们已经在客户的工作中探索并实现了这些智能功能——。 这里详情请看这里。
Solr和Elasticsearch:哪个对我的组织更好?这取决于情况。
不是以一种技术,而是以另一种技术为中心的采用有很多用例。 但是,在被问到这个问题时,我通常从操作管理的观点来看模拟:“Solr就像Linux一样。 Elasticsearch就像窗户一样。 虽然Solr可以根据客户的需求进行多种定制和定制,但是与Elasticsearch相比,它的管理和部署更为复杂,并且也更消耗资源。 使用X-Pack,Elasticsearch非常容易部署、管理和监视,并具有设计的用户界面(Kibana ),可以实现数据发现和分析的可视化,但对其功能的定制有限
Elasticsearch可以为你,如果你想:迅速运行,以较少的成本获得搜索引擎,尽快开始搜索你的数据; 将分析和可视化作为用例的核心组件。 Solr可能适合你,如果你:需要对大量数据进行索引和重新处理; 拥有投资管理用于Solr和对话的工具的资源; 具有与Solr一起工作的现有企业框架。 其他Apache产品(如Hadoop )和企业框架(如在Hadoop中构建的Cloudera、Hortonworks和HDInsights )。 这并不是说Hadoop平台不能使用电子搜索。 但是,一些平台、Cloudera,特别是Hortonworks,是提供其他工具、方法和管理中的Solr索引数据的生态系统。 这是Cloudera发布的CDH 6支持Solr 7的特殊示例。
Solr与Elasticsearch:特性比较根据经验,评估将为客户战略定义和路线图的实施提供巨大的价值。 评估流程运行搜索引擎比较矩阵,根据特定客户的需求和用例评估搜索引擎的适用性,并使用基于特定特性的优先级评估机制。 基于这一分析,综合推荐搜索引擎时,一些共同的特性和用例是感兴趣的点。
下图显示了Solr和Elasticsearch的观察结果:
rt">
选择Solr和Elasticsearch?考虑这些
决定哪个搜索引擎最适合您的特定用例和需求,不应该是基于“非此即彼”的假设做出的决定。Solr中某个特定功能的总体重要性可能超过Elasticsearch的操作优势,例如:
在一个客户端案例中,与Solr部署相关的开销和不得不使用过时的SolrNET客户端(当时)被Solr的可插拔特性所抵消。需要定制加密更新和请求处理程序来使用旋转数据加密键对索引内容应用加密,因此必须使用Solr而不是Elasticsearch。索引加密过程所需要的功能并不能在Elasticsearch中有效地实现。
相反,在不考虑大数据或分析的情况下,为通用搜索用例评估搜索引擎选项时,Elasticsearch成为了一个更受欢迎的选择,因为它减少了维护和部署开销,以及完全托管和管理环境的选项。
在一些基于什么对客户最重要的情况下,它不是立即清楚哪个搜索引擎(包括商业引擎)将最好地满足客户的需求,尽管应用了评分规则。在这种情况下,可以使用示例数据集执行“烘烤”,面向客户评估每个引擎对于特定用例集的执行情况。
归根结底,Solr和Elasticsearch都是功能强大、灵活、可扩展且极其强大的开源搜索引擎。总体用例和业务需求,以及您所需的特性、操作考虑,以及与新的认知搜索和分析功能的集成,将最终驱动您决定是选择Solr还是Elasticsearch。
首席点评:
虽然ES很轻大,但是对于大型企业首先需要考虑的是风险,比如License变更,开源变闭源,高级功能只有企业版本才有,还有最近闹得沸沸扬扬的商业软件禁止某些企业使用,开源反而没事。
在同时满足业务的前提下我建议优先使用Apache,MIT,BSD License 的属于开源基金会所有的开源软件,可以降级安全,供应链,财务等风险。
(此处已添加圈子卡片,请到今日头条客户端查看)