注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

张栋伟的博客

 
 
 

日志

 
 
关于我

北京风网信息技术有限公司互联网事业部总监,资深IT营销人士,曾历任江民科技副总经理、卓越网市场总监和中华英才网市场总监。

网易考拉推荐

网络营销教程—SEO 第二章 搜索引擎(第四…  

2008-11-25 14:28:00|  分类: 网络营销教程-SEO |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |


张栋伟

 

第四节 网页等级技术pagerank

1、 什么是页面等级pagerank?


PageRank计算页面的重要性,对每个链入(inbound)赋以不同的权值,链接提供页面的越重要则此链接入越高。当前页的重要性,是由其它页面的重要性决定的。
页面等级是Google用来评价一个网站重要程度的方法。当考虑完其他的因素,如标题和关键词,Google就利用页面等级技术来判断一个网站的重要程度以决定这个网站在用户搜索结果中应处于什么位置。


下面是Google搜索引擎工作的基本步骤:

1) 找出符合搜索关键词的所有网页。
2) 根据网页内容如关键词对搜索结果排序。
3) 根据页面等级分数调整查询结果的排序。


当然实际操作还要复杂的多,在后面对此还要做更深入的讨论。但是就目前来说,上面的描述已经足够了。因为页面等级是一个乘数而不是简单与其他分数相加,所以如果你的页面等级分数是零,那么你的页面总分数也就为0,在搜索结果中你的网页就会排在最后的位置。

 

2、 如何决定页面等级?
在Google的页面等级算法中,如果网页A提供网页B的链接则假设网页A认为网页B是重要的。一个网页的等级分数会考虑到对这个网页提供链接的其他网页的重要性,如果很多重要的网页提供对这个网页的链接,那么这个网页就被认为是重要的,这个网页的等级分数也会大大提高。同时这个网页所链接的其他网页也随之变得重要。而网页中的实际内容则与页面等级没什么联系。

 

3、 如何知道一个网页的等级?
如果想知道一个网页的页面等级,你可以从http://toolbar.google.com下载一个能够嵌入在Internet浏览器里的页面等级查看工具。安装好后,在浏览器的上方会有一个图案条,它可以显示你正在浏览网页的页面等级。把鼠标移到图案条上时,图案条上会显示一个从一到十的数字。这就是你所浏览网页的页面等级。如果你不能看到所浏览网页的页面等级,你可能安装了一个旧版本的页面等级查看工具。这时你需要先卸载所安装的页面等级查看工具,重新启动计算机。然后安装最新版本的页面等级查看工具。做完这一切后,你就可以从工具中看到你正在浏览的网页的页面等级。


在显示所浏览网页的实际页面等级的时候,Google的页面等级查看工具并不是很准确的。但是到现在为止也只能从它来得到对页面等级的一些人士。只要你知道这个工具的局限性,至少可以知道你在看什么。

 

Google的页面等级查看工具的两个主要局限:


1. 页面等级查看工具的结果具有猜测性:如果你打开一个网页,这个网页并没有存在于它的网页列表中。但是网页列表中存在一个与你打开的相似的网页,它就会据此来猜测你打开网页的等级。这种猜测的结果对于我们是没有价值的,因为任何页面等级算法都不会这样做。想要知道所显示的页面等级是不是猜测的只有一个方法,把你所查看网页的URL输入Google的搜索框。如果在搜索结果中没有你所查看的网页,那么这个页面等级就是猜测的。


2. 网页查看工具的结果只是实际页面等级的一种线性表示:网页查看工具的结果是线性的,而页面等级在Google里实际上是用非线性图来描述的。这样,在网页查看工具里,从等级2到等级3所提高的网页分数实际上要小于从等级3提高到等级4所提高的网页分数。我们可以从下面的对比表格里看到这种现象,Google里实际使用的标准还是保密的。


If the actual
PageRank is                The Toolbar Shows
between

0.00000001 and 5                      1
6 and 25                              2
25 and 125                            3
126 and 625                           4
626 and 3125                          5
3126 and 15625                        6
15626 and 78125                       7
78126 and 390625                      8
390626 and 1953125                      9
1953126 and infinity                       10


在Google目录(http://directory.google.com) 里显示的页面等级也同样有这样的问题。Google目录里显示的页面等级使用了不同的标准,我们可以得到这两个标准之间的一个关系。可是由于它们是非线性的,所以你并不能从这个关系中知道更多的东西。


值得注意的是,一个程序员曾开发出一个脱离Internet浏览器的页面等级查看工具。这个工具得到的结果与Google工具的结果是符合的。为了保护本身数据,Google改变了本身的工具,所以现在这两种工具所得到的结果已经不一样。但这给了我们一个提示:


你在工具条上看到的页面等级可能与网页的实际等级更本就没有关系,Google在工具条上可以给一个网页任何等级。


5、 页面等级的意义


在搜索引擎算法中,任何因素存在的意义取决于这个因素所提供的信息的质量。一个因素的重要性可以作为它的加权值。如果想知道加权值是怎样得到的,我们先离开页面等级的讨论一会,来看看Meta标签。首先,如果是一个新的Meta标签关键词,你可以在你的文档中写入下面的文字:
<meta name=”keywords” content=”pagerank, pagerank uncovered, algorithm,
algorithms”>


理论上来说,Meta标签的关键词是对网页内容最好的概括。然而,正如我们所知道的,Meta标签中的关键词对加权值毫无用处。这主要是因为下面两个原因:


1. 网站管理员可以轻易的操作Meta标签中的关键词。
2. 网站管理员对它的操作级别过高。
Meta标签的关键词与页面等级是两个不同的因素,可是就人的本性来说,越容易改变的东西也就越容易被改变。这些原因共同决定了加权值的大小-即我们可以对一个因素所提供信息的信任程度。

 

6、 控制页面等级


毫无疑问,页面等级是网站管理员最难操纵的因素之一。然而,如果利用链接域和留言板则可以比较容易的让其他网站提供对你网站的链接从而认为影响页面等级的评定。Google一直对此方法的滥用非常头痛,现在很多网站用这种方法来提升他们的页面等级。不得不说,这种方法的滥用现在非常普遍并且对页面等级产生了很大影响。所以,虽然不太容易,页面等级也是可以被操纵的。


现在页面等级被操纵的程度已经发生了改变。大部分人不再相信Google先前的页面等级不能被人为改变的说法,也对基于页面等级所产生的搜索结果产生了怀疑。然而,更多迹象表明页面等级技术仍然在被使用,虽然有更多的页面等级操纵技巧被熟知。


虽然页面等级是有用的,你还是应该小心不要过高估计它的用处和能力。你最后的网页排序由许多因素共同决定,页面等级只是其中的一个。稍后,我们将更加详细的讨论页面等级与其他因素的不同以及页面等级何时会被使用。更具讽刺性的是,页面等级的加权值正逐渐减小。因为本书的第一版给出了页面等级的详细信息,使得页面等级技术被被更多人所了解,也就使得人为改变页面等级的可能性增加了,这可能是导致页面等级加权值减小的一个原因。


 

  评论这张
 
阅读(90)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017