クイズPageRank Googleのリンク評価を再確認【回答と次の設問】

最近、Yahoo!が採用しているかもしれない「ハブ・オーソリティ」アルゴリズムの、独特のリンク評価が荒唐無稽のように思えるかもしれない。

ところが、Googleのリンク評価、いわゆるPageRankについても、本当に分かっているのかどうか?

クイズPageRank

では、下図のようなリンク構造の場合、A・B・C・DのPageRankはいったいどうなっているのだろうか?

4ページのリンク構造とPageRank

表にまとめると、AはBだけにリンクを張り「1」を渡す。BはAとCにリンクを張りそれぞれ「0.5」を渡す。以下云々。

  1 2 2 1
  A B C D
3 A   0.5 0.5 1
1 B 1      
1 C   0.5    
1 D     0.5  

分かった方は、コメントに書いてみて欲しい。

例1
A > B > C = D
例2
A:B:C:D=4:2:1:1
例3
A=0.5 B=0.25 C=0.125 D=0.125

どの書式でも結構である。(上記例のすべては間違っている…)

例3の場合は、スタートというか、全体を1とした場合である。よくある「0.85」でなくてよい。

最初に言っては身も蓋もないのだが、かなり驚く結果になる。
というか私でさえ、自分の常識が打ち砕かれて、ショックを受けているのである。

解答の発表は、3月10日午後に、このページに追記する。

また、正解者には景品はないのであしからず。

いきなり、PageRank計算のサイトやツールを探して、「ゆとり」行動にならないように。まず最低限、リンク構造を見て、自分で大小関係くらいは考えてみよう。

PageRank計算の正解

それでは、お約束どおりの解答編。

AはBから1/2(0.5)とCから1/2(0.5)とDから1を受け取る。BはAから1を受け取る。CはBから1/2(0.5)を受け取る。DはCから1/2(0.5)を受け取る。

1回目の計算結果に対して、上記の計算方法で2回目の結果を出す。3回目、4回目、5回目と…

それが下表である。

  1回目 2回目 3回目 4回目 5回目 58回目
A 0 0.5 0.25 0.5 0.25   0.363636
B 1 0 0.5 0.25 0.5   0.363636
C 0 0.5 0 0.25 0.125   0.181818
D 0 0 0.25 0 0.125   0.090909

こうして、58回目に計算結果が収束して、それ以降は同じ数値しか出なくなる。

正解は、

A = B > C > D
A:B:C:D=4:4:2:1
A=0.363636 B=0.363636 C=0.181818 D=0.090909
A=B=2*C=4*D

である。

最初にコメントした方が大正解だった!

クイズPageRank おまけ

それでは、最初の問題のリンク構造図をもう一度見ていただく。

リンク図1
4ページのリンク構造とPageRank リンク図1

C→Aのリンクを外す、D→Bとリンクを張る。

リンク図2
4ページのリンク構造とPageRank リンク図2

AのPageRankは下がると想像がつくだろう。では、BやCはどうだろうか? はたまたDの運命は?

意外や意外、BもCもPageRankは変わらない。

  リンク図1 リンク図2
A 0.363636 0.272727
B 0.363636 0.363636
C 0.181818 0.181818
D 0.090909 0.181818

Aの減った分がDに回るだけである!

たわむれを続けて、図1のB→Aのリンクを外してみる。

リンク図3
4ページのリンク構造とPageRank リンク図3

なんと、BのPageRankも下がるのである。ということは、図3から図1へと、BがAにリンクを張れば、BのPageRankが上がる! Yahoo!と同じだ!!

  リンク図1 リンク図2 リンク図3
A 0.363636 0.272727 0.285714
B 0.363636 0.363636 0.285714
C 0.181818 0.181818 0.285714
D 0.090909 0.181818 0.142857

有力なリンク元に、リンクを返すというのは、自ページのPageRankアップに有益ってこと?

PageRankでさえ、計算してみないと分からないのである。

今さらPageRankなんて、と思うかもしれないが、100や200のアルゴリズムの1つであるPageRankさえまともに計算できなければ、それより複雑で多様なSEOスコアなどは理解がおよばなくなる。

あらためて、検索エンジンは数学や統計学で作られていることを思い知る今日この頃…

たとえば、ページ評価装置、ページ評価方法、およびページ評価プログラム – 特開2009-252082(P2009-252082A) 【出願人】ヤフー株式会社 を読んで、検索エンジン側が何を考えやろうとしているか、頭が痛くなる体験もありでは?


関連記事:

  1. Googleの特別構文syntaxをYahoo!検索で siteコマンドから
  2. PDFファイルのインデックスとバックリンク linkとfiletypeコマンドで
  3. 「seo診断」キーワード検索の不自然?な現象 siteコマンドで順位が変わる
  4. Yahoo!の「アンカーテキストマッチ」を視認&アウトバウンドリンクの品質ガイドライン
  5. Yahoo!検索に見るGoogle.com Google.co.jpとは微妙に違う順位
«
»
 

コメント(4)

コメントを書き込む