热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

搜索引擎信息检索实践课后练习第一章

1.1思考并写出写出若干用于网络搜索引擎的查询,确保这些查询的长度不同(比如不要全都是一个词).尝试在某些查询中详细而准确地说明你要找什么信息.在两个商业网络搜索引擎中提交这些查询

1.1 思考并写出写出若干用于网络搜索引擎的查询,确保这些查询的长度不同(比如不要全都是一个词).

尝试在某些查询中详细而准确地说明你要找什么信息.

在两个商业网络搜索引擎中提交这些查询,并通过相关性判断前10个结果.

写一个报告,至少回答一下问题:结果的准确率如何?两个搜索引擎的结果的重叠状况如何?其中一个搜索引擎明显比另一个好吗?

如果是这样,好多少?短查询和长查询的效果相比如何?

第一步——查询:Jordan,世界上最大的社交网站有哪些,今日天气状况

第二步——描述信息:

Jordan-关键词:Jordan

世界上最大的社交网站是-关键词:世界最大,社交网站,

今日天气状况-关键词:今日,天气状况

Jordan在google和baidu搜索结果对比:

google的搜索结果:是10条搜索结果+不定数量广告

百度搜索结果:10条搜索结果,因为是非中文,所以第一条是翻译结果

google的结果全是乔丹鞋的各种销售渠道链接,百度的结果有Jordan的翻译,还Jordan鞋官网,还有乔丹鞋和约旦的百度百科.

相比起来,google可能知道我有买Jordan的篮球鞋,所以属于精准推荐,全部推荐的是鞋,而baidu则更加基于全面,把和Jordan相关的信息都展示出来.

google精准查询,但是有广告.百度大而全,此轮百度率胜一筹.

世界上最大的社交网站有哪些在google和baidu搜索结果对比:

因为搜索对象和商品无关,google这次没有推荐广告,只是推荐了10条信息,每条都有用;百度推荐了10条信息,但是只有6条满足需求.

这一轮google胜.

今日天气情况在google和百度搜索结果对比:

google的搜索结果:直接显示了ip地址所在区域的天气,无须进入链接,而且前三条根据ip地址显示的是新加坡天气,第4,5条显示的是北京天气,但不知道为什么第6条是杭州天气,剩下几条是中国天气的报告

baidu的搜索结果:罗列了国内的天气网和天气查询网站,没有根据IP地址的天气直接显示.

这一轮查询google胜.

总体来说,还是google更清楚用户需要什么,进阶到了信息检索的第三阶段:基于用户个性化需求.百度还在第二阶段,链接分析\内容相关.

 

1.2 站内搜索(site search) 是另一个搜索引擎的常见应用.此时,搜索引擎被限制在一个给定网站的页面里.请对站内搜索\网络搜索\垂直搜索和企业搜索进行对比分析.

站内搜索实在特定的站内去获取信息,信息通常是一类内容,相关性较高,查准率较高.

网络搜索属于通用搜索,以查全率为主.

垂直搜索基于一个行业的相关信息进行整合准确率和查全率基于站内搜索和网络搜索之间.

企业搜索由于数据量通常较小,所以精确度高,查询速度相对较快.

 

1.3 列出5个你使用的网络服务或网站,这些网站使用搜索但并不是网络搜索引擎.描述搜索在这些服务中扮演的角色.同时描述其中的搜索是否基于数据库或grep风格的匹配技术.是否使用了某种类型的排序算法.

天猫:提供商品购买链接,提供网上购物渠道,基于数据库,得存商品信息,店铺信息,用户购买评价\购买记录\购买行为等,又排序算法,又销量排序,相似度排序,好评排序等

当当:和天猫类似

12306:提供购买火车篇服务,需要数据库存储车票数量,出发站点和到达站点之间的信息.排序算法又基于出发时间排序和基于到达时间排序

微信:提供社交服务.需要数据库存储账户通讯录信息,朋友圈图片和文字信息.基本没有排序算法,只是置顶的好友比没置顶的好友排序靠前.

滴滴:提供打车服务.需要数据库存储地图信息,司机信息和打车的客户的信息.叫车有顺序,距离较近的优先呼叫.

 

1.4 在网上尽可能多地查找开源搜索引擎,信息检索系统和相关技术的例子.给出对每个搜索引擎的简短描述,并总结他们之间的异同.

https://blog.csdn.net/xum2008/article/details/8740063

 

 

 


推荐阅读
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 本文介绍了iOS开发中检测和解决内存泄漏的方法,包括静态分析、使用instruments检查内存泄漏以及代码测试等。同时还介绍了最能挣钱的行业,包括互联网行业、娱乐行业、教育行业、智能行业和老年服务行业,并提供了选行业的技巧。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • Python脚本编写创建输出数据库并添加模型和场数据的方法
    本文介绍了使用Python脚本编写创建输出数据库并添加模型数据和场数据的方法。首先导入相应模块,然后创建输出数据库并添加材料属性、截面、部件实例、分析步和帧、节点和单元等对象。接着向输出数据库中添加场数据和历程数据,本例中只添加了节点位移。最后保存数据库文件并关闭文件。文章还提供了部分代码和Abaqus操作步骤。另外,作者还建立了关于Abaqus的学习交流群,欢迎加入并提问。 ... [详细]
  • Skywalking系列博客1安装单机版 Skywalking的快速安装方法
    本文介绍了如何快速安装单机版的Skywalking,包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
  • 本文介绍了前端人员必须知道的三个问题,即前端都做哪些事、前端都需要哪些技术,以及前端的发展阶段。初级阶段包括HTML、CSS、JavaScript和jQuery的基础知识。进阶阶段涵盖了面向对象编程、响应式设计、Ajax、HTML5等新兴技术。高级阶段包括架构基础、模块化开发、预编译和前沿规范等内容。此外,还介绍了一些后端服务,如Node.js。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 手把手教你使用GraphPad Prism和Excel绘制回归分析结果的森林图
    本文介绍了使用GraphPad Prism和Excel绘制回归分析结果的森林图的方法。通过展示森林图,可以更加直观地将回归分析结果可视化。GraphPad Prism是一款专门为医学专业人士设计的绘图软件,同时也兼顾统计分析的功能,操作便捷,可以帮助科研人员轻松绘制出高质量的专业图形。文章以一篇发表在JACC杂志上的研究为例,利用其中的多因素回归分析结果来绘制森林图。通过本文的指导,读者可以学会如何使用GraphPad Prism和Excel绘制回归分析结果的森林图。 ... [详细]
  • iOS开启Google位置服务器和显示定位权限的方法
    本文介绍了在iOS开发中如何开启Google位置服务器和显示定位权限的方法,包括导入CoreLocation和MapKit库、在界面导入头文件和在info.plist文件中添加授权等步骤。同时还介绍了iOS11中NSLocationAlwaysAndWhenInUseUsageDescription的功能变化。阅读本文可以帮助开发者了解如何在iOS应用中使用Google位置服务器和处理定位权限相关的问题。 ... [详细]
  • 说到C语言的语句块,真是一堆血泪史。第一大坑就是优先级。刚工作那会儿,C的书没看几本,自信满满的认为C语言都会了,拿出搞ACM培养的豪情壮志,代码倒是写得爽,却到处留 ... [详细]
author-avatar
曾经的我们太矫情_377
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有