Elasticsearch:从点击中学习(搜索结果排名)

 手机用户2502854133 发布于 2022-12-13 17:21

我已经阅读了《编程集体智慧》一书中的“从点击中学习”一章,并喜欢这样的想法:那里的搜索引擎了解用户点击了哪些结果,并使用此信息来提高结果的排名。

我认为,如果我可以从用户点击中学习的话,它将大大提高我的Java / Elasticsearch应用程序中搜索排名的质量。

在这本书中,他们建立了一个多人感知器(MLP)网络,甚至可以将学习到的信息用于新的搜索短语。他们使用带有SQL数据库的Python来计算搜索排名。

有没有人已经用Elasticsearch实现了这样的事情,或者知道一个示例项目?如果我可以直接在Elasticsearch中管理点击信息而不需要额外的SQL数据库,那就太好了。

1 个回答
  • 在信息检索领域(搜索和推荐的一般学术领域),这通常被称为学习排名。无论是单击,转换还是其他形式的搜索结果,无论是关键词搜索的“好”还是“坏”,学习排名都可以使用分类器或回归过程来了解查询和文档的哪些特征与相关性相关。

    点击次数?

    特别是对于点击,有理由怀疑优化点击是否理想。我正在尝试从Microsoft Research的一篇论文中进行挖掘,该论文声称在他们的案例中,点击与相关性的关联度仅为45%。点击+停顿通常是更有用的相关性通用指标。

    正如我在此博客文章中所谈到的那样,搜索中也存在自我强化偏见的风险。如果您已经在显示用户平庸的结果,并且他们不断点击这些平庸的结果,那么您最终将加强搜索以继续显示用户平庸的结果。

    除了点击之外,通常还应考虑特定领域的考虑因素。例如,在电子商务中,转换至关重要。促成此类购买的搜索结果点击可能更有价值。Netflix出名地试图避免您看电影5分钟并返回菜单(30分钟然后退出)意味着什么。某些搜索用例仅供参考:在您进行搜索和单击许多搜索结果时(与购买单个商品时),单击可能会有所不同。

    很抱歉,这不是万灵药。我听说过进行学习排名的许多成功和失败的尝试,并且主要归结为您在衡量用户认为相关的内容上的成功程度。这个问题的困难使很多人惊讶

    对于Elasticsearch ...

    特别是对于Elasticsearch,有这个插件(免责声明,我是作者)。这是记录在这里。一旦确定了如何为特定查询(无论是单击还是更多)对文档进行“评分”,就可以训练一个模型,然后可以通过此插件将其输入到Elasticsearch中进行排名。

    2022-12-13 17:22 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有