热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

关于“网页相似度”相关问题的全面讲解

站长在进行网站建设的时候,有时候会遇到一个问题,那就是网页相似度的问题。什么是网页相似度呢?所谓网页相似度,简单的说就是两个网页的相似程度。这两个网页可以是同一个网

 

  站长在进行网站建设的时候,有时候会遇到一个问题,那就是网页相似度的问题。什么是网页相似度呢?所谓网页相似度,简单的说就是两个网页的相似程度。这两个网页可以是同一个网站上的网页,也可以不是同一个网站上的网页,也既是其他网站上的网页。搜索引擎在收录网页的时候,通常会对两个网页进行比较,看看两个网页是否相似。所谓相似,就是说两个网页在页面内容的大部分都是相同的,这时候就可以认为两个网页是相似的。搜索引擎在比较两个网页的时候,是采用一定的算法来进行比较,搜索引擎通常会采用两种方法来进行比较:一种是根据网页摘要来比较,如果多个网页摘要的 md5 值一样,证明这些网页具有很高的相似度。另一种是根据网页出现的关键词,按照词频排序,可以取N个词频高的,如果其 md5 值一样,则可以认为这些网页有很高的相似度。谷歌搜索引擎给网页相似度设定的比例是60%,也就是说如果两个网页的相似度超过60%,那么被比较的网页不再被收录,如果相似度接近60%,那么被比较的网页可能也会被收录,但是搜索引擎给予的权重则比较低。这就是搜索引擎对待网页相似度的态度。由此可见,网页相似度对我们的网站的影响主要在于被比较的网页是否能够被收录,对其他方面则基本没什么影响。

  造成网页相似度问题产生的原因主要有两点:①在同一个网站内部,拿旧的网页复制做新的网页,造成网页里面的标题、关键词、描述信息、内容等改动的比较少,结果被搜索引擎判定为相似度高。②在不同网站之间,将原来已经被收录的网页的内容拿来,并进行稍微改动或者伪原创,结果造成里面的内容改动较少,或者仅仅进行段落调整,里面的内容没怎么变动,这与照抄差不多,被搜索引擎判定为相似度高。搜索引擎在判断网页的相似度的时候,是挺智能的,并不是我们想象的简单的从头到尾进行比较一下,而是进行智能的分析和比较,我们对此不要抱着侥幸心理,以为把别人网页的内容照抄过来,简单的修改了一下就可以蒙混过关。

  有了问题,我们就需要进行改正,下次避免再犯同样的错误。对于网页相似度的问题,我们知道了造成的原因,就可以对症下药。解决网页相似度的最有效的方法是对你的网页做到真正的原创,如果你的网页内容是原创出来的,只要内容质量高,就肯定不会因为网页相似度的问题而不收录,一般的都能被收录的。如果作为站长的你没有过多的时间去写原创文章,或者限于水平问题写不出来高质量的原创文章,那么你也可以进行伪原创,但是我们建议你为了避免缠身该网页相似度问题,你需要对原来的文章进行大幅度的修改,修改的幅度起码也要在50%以上,这样才可能被搜索引擎收录。另外我们建议各位站长,在做网页的时候,为了节省时间,如果需要复制原来的网页,那么我们也建议您对网页标题、关键词、描述信息以及内容也同样进行大幅度的修改,否则你的网页很难被收录的。在修改的时候可以用一些不同的代码替换掉原来的代码,比如使用iFrame框架取代以前的部分内容等等。笔者从事网站建设领域做了很长时间了,遇见到的因为网页相似度问题不被收录的情况不在少数,在谷歌站长管理平台上也有个html文档工具,如果两个网页的标题和描述信息差不多,站长工具会提示你哪两个网页的相似度高了,这时候我们就可以对之进行修改。建议站长们多多进入搜索引擎的管理平台里,使用里面提供的功能,有时候会对网站建设很有好处的。

 


推荐阅读
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文介绍了Paxos的世界中关于复制日志与状态机的概念和重要性。通过存储日志来实现数据的持久化,并通过日志流来记录数据的变化,而不是直接持久化数据本身。这样做的好处是简化了持久化存储的操作,并且方便多机之间的数据同步。 ... [详细]
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • Monkey《大话移动——Android与iOS应用测试指南》的预购信息发布啦!
    Monkey《大话移动——Android与iOS应用测试指南》的预购信息已经发布,可以在京东和当当网进行预购。感谢几位大牛给出的书评,并呼吁大家的支持。明天京东的链接也将发布。 ... [详细]
  • 本文介绍了使用CentOS7.0 U盘刻录工具进行安装的详细步骤,包括使用USBWriter工具刻录ISO文件到USB驱动器、格式化USB磁盘、设置启动顺序等。通过本文的指导,用户可以轻松地使用U盘安装CentOS7.0操作系统。 ... [详细]
  • Lodop中特殊符号打印设计和预览样式不同的问题解析
    本文主要解析了在Lodop中使用特殊符号打印设计和预览样式不同的问题。由于调用的本机ie引擎版本可能不同,导致在不同浏览器下样式解析不同。同时,未指定文字字体和样式设置也会导致打印设计和预览的差异。文章提出了通过指定具体字体和样式来解决问题的方法,并强调了以打印预览和虚拟打印机测试为准。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • Final关键字的含义及用法详解
    本文详细介绍了Java中final关键字的含义和用法。final关键字可以修饰非抽象类、非抽象类成员方法和变量。final类不能被继承,final类中的方法默认是final的。final方法不能被子类的方法覆盖,但可以被继承。final成员变量表示常量,只能被赋值一次,赋值后值不再改变。文章还讨论了final类和final方法的应用场景,以及使用final方法的两个原因:锁定方法防止修改和提高执行效率。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 本文介绍了求解gcdexgcd斐蜀定理的迭代法和递归法,并解释了exgcd的概念和应用。exgcd是指对于不完全为0的非负整数a和b,gcd(a,b)表示a和b的最大公约数,必然存在整数对x和y,使得gcd(a,b)=ax+by。此外,本文还给出了相应的代码示例。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
author-avatar
mobiledu2502909447
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有