热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

LuceneScoring评分机制(byquqi99)

Lucene评分机制(byquqi99)作者:张华发表于:2011-01-24版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处

                         Lucene评分机制( by quqi99 )


作者:张华 发表于:2011-01-24


版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明


 /**
     * 利用IndexReader获取下列信息,注意,建索引时需加Field.TermVector.YES:
     (1) 统计term在整个collection中的文档频度(document frequency, DF);
     (2) 统计term在整个collection中出现的词次(term frequency in whole collection);
     (3) 统计term在某个文档中出现的频度(term frequency, TF);
     (4) 列出term在某文档中出现的位置(position);
     (5) 整个collection中文档的个数;
     */
    public static void printIndex(IndexReader reader) throws Exception
    {
        // 显示有多少个document
        System.out.println(reader + "/tNumDocs = " + reader.numDocs());
        for (int i = 0; i         {
            System.out.println(reader.document(i));
        }

        // 枚举term,获得信息
        TermEnum termEnum = reader.terms();
        while (termEnum.next())
        {
            System.out.println(termEnum.term());
            System.out.println("/tDocFreq=" + termEnum.docFreq());

            TermPositions termPositiOns= reader.termPositions(termEnum.term());
            int i = 0;
            int j = 0;
            while (termPositions.next())
            {
                System.out.println((i++) + "->" + " DocNo:" + termPositions.doc() + ", Freq:" + termPositions.freq());
                for (j = 0; j                     System.out .println("[" + termPositions.nextPosition() + "]");
                System.out.println();
            }

            // 直接获取 的信息
            TermDocs termDocs = reader.termDocs(termEnum.term());
            while (termDocs.next())
            {
                System.out.println((i++) + "->" + " DocNo:" + termDocs.doc()  + ", Freq:" + termDocs.freq());
            }
        }

        //在reader是SegmentReader类型的情况下有效
        // FieldInfos fieldInfos = reader.fieldInfos;
        // FieldInfo pathFieldInfo = fieldInfos.FieldInfo("path");

        // 显示 term frequency vector
        for (int i = 0; i         {
            // 对contents的token之后的term存于了TermFreqVector
            TermFreqVector termFreqVector = reader.getTermFreqVector(i,"contents");
            if (termFreqVector == null)
            {
                System.out.println("termFreqVector is null.");
                continue;
            }
            String fieldName = termFreqVector.getField();
            String[] terms = termFreqVector.getTerms();
            int[] frequences = termFreqVector.getTermFrequencies();
            System.out.println("FieldName:" + fieldName);
            for (int j = 0; j             {
                System.out.println("[" + terms[j] + ":" + frequences[j] + "]");
            }
            System.out.println();
        }
        System.out.println();
    }


推荐阅读
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • Spring源码解密之默认标签的解析方式分析
    本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • JavaSE笔试题-接口、抽象类、多态等问题解答
    本文解答了JavaSE笔试题中关于接口、抽象类、多态等问题。包括Math类的取整数方法、接口是否可继承、抽象类是否可实现接口、抽象类是否可继承具体类、抽象类中是否可以有静态main方法等问题。同时介绍了面向对象的特征,以及Java中实现多态的机制。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 个人学习使用:谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 如何查询zone下的表的信息
    本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求,并提供了请求示例。 ... [详细]
  • 本文介绍了如何使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换。首先解释了JSON的概念和数据格式,然后详细介绍了相关API,包括JSONObject和Gson的使用方法。接着讲解了如何将json格式的字符串转换为kotlin对象或List,以及如何将kotlin对象转换为json字符串。最后提到了使用Map封装json对象的特殊情况。文章还对JSON和XML进行了比较,指出了JSON的优势和缺点。 ... [详细]
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
author-avatar
Li_pengwei
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有