热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

lucene中搜索的结果为什么不能全部显示?求高手~

IndexingtodirectoryD:\yao\复件(10)新建文本文档.txtIndexingtodirectoryD:\yao\复件(11)新建文本文档.
Indexing to directory D:\yao\复件 (10) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (11) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (12) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (13) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (2) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (3) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (4) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (5) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (6) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (7) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (8) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 (9) 新建 文本文档.txt'... 
Indexing to directory D:\yao\复件 新建 文本文档.txt'... 
Indexing to directory D:\yao\新建 文本文档.txt'... 
搜索关键字 <姚明>在编号为 0 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 1 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 2 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 3 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 4 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 5 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 6 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 7 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 8 的Document中出现过 4 次 
搜索关键字 <姚明>在编号为 9 的Document中出现过 4 次 
============================================================== 
写了一个显示搜索结果和相关权值的简单程序,可是为什么每次只显示10个结果。由上面可以看到,一共对14个文档进行了检索,为了查处问题的所在,(注!14个文档的内容完全相同),可是搜索结果只显示了10个结果(0~9编号分别对应上面的10~7)下面的8,9,新建,新建复件都没有显示出来。请问难道hits里面只能存前十个?急~谢谢了!

5 个解决方案

#1


该回复于2015-05-26 10:49:52被管理员删除

#2


1首先确定这索引文件的分词和你搜索的分词一致
2确定索引文件中是否存在数据或建立相关分词.
3搜索的时候看看集合中存在的数据数量.

你的问题比较笼统,从索引到查询,错一点都将导致结果不同.

#3


谢谢楼上的。首先我建立索引的14个文档内容是完全一致的,前面的都可以被检索出来,所以说分词这里肯定没有问题;搜索的结果hits集合中的数量始终是10(增加被索引的文档的个数,结果数>10时),当结果小于10时,可以显示正确的结果。

#4


问题已解决,谢谢楼上·

#5


有没有分页的??

推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 部署solr建立nutch索引
    2019独角兽企业重金招聘Python工程师标准接着上篇nutch1.4的部署应用,我们来部署一下solr,solr是对lucene进行了封装的企 ... [详细]
  • camel_使用Camel在来自不同来源的Solr中索引数据
    camelApacheSolr是建立在Lucene之上的“流行的,快速的开源企业搜索平台”。为了进行搜索(并查找结果),通常需要从不同的源(例如内容管理 ... [详细]
  • 一:什么是solrSolr是apache下的一个开源项目,使用Java基于lucene开发的全文搜索服务器;Lucene是一个开放源代 ... [详细]
  • ES基本原理名词解释In-memorybuffer:ES内存缓冲区,新建的document写入的地方document:索引和搜索的 ... [详细]
  • mysql+全文检索设计,基于sphinx+mysql全文检索架构设计.doc
    基于sphinxmysql全文检索架构设计.doc还剩2页未读,继续阅读下载文档到电脑,马上远离加班熬夜!亲,喜欢就下载吧& ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了Nutch相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • d3dx9_26.dll极品飞车9修复工具下载及修复教程
    本文介绍了d3dx9_26.dll文件的修复工具下载和修复教程,解释了该dll文件的作用和安装方法,同时提供了其他dll文件下载安装的方法。文章涵盖了3d、windows、p2p、dll、visual studio等知识点,并由未来可期1212投稿。希望该技术和经验能帮到你解决dll文件相关技术问题。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • Ubuntu安装常用软件详细步骤
    目录1.GoogleChrome浏览器2.搜狗拼音输入法3.Pycharm4.Clion5.其他软件1.GoogleChrome浏览器通过直接下载安装GoogleChro ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • Yii framwork 应用小窍门
    Yiiframework应用小窍门1.YiiFramework]如何获取当前controller的名称?下面语句就可以获取当前控制器的名称了!Php代码 ... [详细]
author-avatar
mjh3804260
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有