HITS—基于页面属性的链接算法

看过这篇文章后，你或许可以明白以下两件事儿：

1、一个单页面网站，为啥页面上都是出链，被指向的链接也很少，但是却有很好的排名；

2、网站页面上是不是没有出链（指向外部的）才是最好的？

看完上述，有兴趣没？好吧，不管你有木有兴趣，哥要继续了。

在一些电视剧上，或许大家会经常看到这样的场景，男猪脚A为了了解或者认识某个人，某件事儿，往往会去当地的旅馆饭店向店小二打听、或者直接找到当地的地头蛇去了解情况。

无它，只是因为他们就像是一个当地各种事情各种人的活向导、活地图，他们可能对这些事情的始末了解的不够详尽，但是必然知道和这件事儿有牵连的人或者物。

所谓调查事情的始末，一张关系+事件网而已。

这种事情放到搜索引擎算法上，理所应当的同样成立，只不过角色道具全部发生了转换：男猪脚A变成了广大的搜索引擎用户，关系与事件网变成了链接组成的各种关系，而店小二与地头蛇变成了我们今天看到的各种让人倍感疑惑的站点。

将这些联系起来的，就是HITS算法。

先来看看百度百科的解释。

HITS算法：一个网页重要性的分析的算法，根据一个网页的入度（指向此网页的超链接）和出度（从此网页指向别的网页）来衡量网页的重要性。其最直观的意义是如果一个网页的重要性很高，则他所指向的网页的重要性也高。一个重要的网页被另一个网页所指，则表明指向它的网页重要性也会高。指向别的网页定义为Hub值,被指向定义为Authority值。

如果你木有看懂，木得关系，哥来继续给你说一下。对于任何一个页面来说，其本身必然有两种属性：目录属性（还有人喜欢叫做枢纽）+权威属性，大小而已。目录属性即他本身会有出链，也会更像一个导航，告诉读者想看到关于某件事儿更详细的信息可以点链接出去查看；权威属性即每个页面都是基于某个主题所阐述的，这个页面也必然会有基于该主题的权威值，大小而已。