热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Elastic:常量分数查询constand_scorequery应用场景

0.引言最近正好有同学问到constandscore查询与其他查询的区别,趁此机会,我们来详细了解下constantscore查询1.定义首先我们
0. 引言

最近正好有同学问到constand score查询与其他查询的区别,趁此机会,我们来详细了解下constant score查询

1. 定义

首先我们先来看官方文档中对constand score查询的介绍
在这里插入图片描述
可以看到官方解释是:constant score是用来包装filter查询的,其相关性得分等于boost参数值

这个解释听起来有些生硬,我们来翻译一下:

  • constant score是组合filter来使用的,也就是说constant score中是不能使用query查询的,我们知道filter是不会计算相关性得分的,filter会缓存查询结果来提高查询效率
  • 相关性得分是个常量,等于boost参数值,默认是1

关于这两点我们用一个例子来向大家展示

测试数据:

PUT movies2/_bulk
{"index":{"_id":1}}
{"title": "you and me","tags":["romantic comedy","Action"]}
{"index":{"_id":2}}
{"title": "you and me","tags":["romantic comedy","romantic comedy"]}
{"index":{"_id":3}}
{"title": "you and me","tags":["romantic comedy romantic comedy","Action"]}

执行constant score查询

GET movies2/_search
{"query": {"bool": {"should": [{"constant_score": {"filter": {"match_phrase":{"tags": "romantic comedy"}},"boost": 2}}]}}
}

查询结果:从查询结果可以看出,其相关性得分是个固定值,也就是我们设置的boost。同时因为filter没有考虑相关性得分,tags字段中出现romantic comedy更多的,更加符合查询题意的id=2数据并没有被排在前面
在这里插入图片描述

2. 案例分析

下面我们基于上述的索引数据来通过一个案例,这个题也是ECE考试中的真题,来带大家体会constant score查询。

案例:

  • 查询movies2索引中tittle字段包含my或者me的数据
  • 如果数据中包含romantic comedy则将其相关性得分提高

我们尝试用constant score来解这道题

GET movies2/_search
{"query": {"bool": {"must": [{"match": {"title": "me my"}}],"should": [{"constant_score": {"filter": {"match_phrase":{"tags": "romantic comedy"}},"boost": 2}}]}}
}

执行结果:

  • 会看到排在最前面的是id=1,id=2的数据,他们虽然有小数位的得分,但实际上是must查询的得分+constant score的2分
  • 包含romantic comedy的数据确实被排到最前面,但是这样的结果是我们想要的吗?题目是要求包含romantic comedy的得分提高,同时因为tags字段是个数组,那么我们是不是可以理解为,数组越多元素包含romantic comedy越好。
  • 但实际上,tags中有两个元素包含romantic comedy的id=2数据得分并没有更多
    在这里插入图片描述

我们使用普通的match_phrase来解题

GET movies2/_search
{"query": {"bool": {"must": [{"match": {"title": "me my"}}],"should": [{"match_phrase": {"tags": {"query": "romantic comedy","boost": 2}}}]}}
}

执行结果:

  • 可以看到包含romantic comedy更多的id=2,id=3的数据的得分都更高,更加符合我们的题意
  • 所以此题是不适合用constant score来解的
    在这里插入图片描述

3. constant score应用场景

基于上述定义,constant score更加适合

  • bool查询中只包含filter查询的场景
  • 不关心词频的查询场景
  • 追求查询速度同时不在乎得分的场景

好了本期的讲解也就到此结束了,如果你觉得对你的学习有帮助的话,不妨点个赞吧

关注公众号:Elasticsearch之家,了解更多新鲜内容

在这里插入图片描述


推荐阅读
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • Android自定义控件绘图篇之Paint函数大汇总
    本文介绍了Android自定义控件绘图篇中的Paint函数大汇总,包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数,可以更好地掌握Paint的用法。 ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • Excel数据处理中的七个查询匹配函数详解
    本文介绍了Excel数据处理中的七个查询匹配函数,以vlookup函数为例进行了详细讲解。通过示例和语法解释,说明了vlookup函数的用法和参数的含义,帮助读者更好地理解和运用查询匹配函数进行数据处理。 ... [详细]
  • 本文介绍了Perl的测试框架Test::Base,它是一个数据驱动的测试框架,可以自动进行单元测试,省去手工编写测试程序的麻烦。与Test::More完全兼容,使用方法简单。以plural函数为例,展示了Test::Base的使用方法。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 开发笔记:计网局域网:NAT 是如何工作的?
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了计网-局域网:NAT是如何工作的?相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • node.jsurlsearchparamsAPI哎哎哎 ... [详细]
  • 广度优先遍历(BFS)算法的概述、代码实现和应用
    本文介绍了广度优先遍历(BFS)算法的概述、邻接矩阵和邻接表的代码实现,并讨论了BFS在求解最短路径或最短步数问题上的应用。以LeetCode中的934.最短的桥为例,详细阐述了BFS的具体思路和代码实现。最后,推荐了一些相关的BFS算法题目供大家练习。 ... [详细]
  • 一、Struts2是一个基于MVC设计模式的Web应用框架在MVC设计模式中,Struts2作为控制器(Controller)来建立模型与视图的数据交互。Struts2优点1、实现 ... [详细]
author-avatar
你是我的小二郎
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有