页面相似度是指网页内容之间的相似程度,当两个页面的相似度在一定程度(一般为80%)以上时,就有可能被搜索引擎判断为抄袭页面或复制页面,从而不被收录,或者收录后再删除,如果相似页面过多,还可能会稀释网站质量,包括权重、PR等。从而影响到网站整体在搜索引擎上的表现。比如我们经常在百度中site一个网站,发现底部会出现“为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果.,就是由于页面相似度高造成的.

我们无法知道搜索引擎对相似页面进行惩罚的标准是多少,而且每个搜索引擎对相似页面惩罚的标准也是不一样的,所以,我们只能尽可能的保持网站较低的页面相似度。如何降低降低页面相似度呢?

   1.增加网站正文主题内容,防止正文内容过少,这是最好防止产生相似页面的技巧之一;
    2.让搜索引擎的蜘蛛优先抓到正文;如正文在左侧,一些不通用的内容放在右侧或者下方
    3.减少网页中不必要的内容结构。
    4. 将相似页面公共的部分脚本化。如将一些通用信息对SEO没用处的内容写入JS中,或者Iframe中。使SE抓取不了