Google の検索ロボットは何を見てインデックスしているのか?

Posted by
ぴろり
Posted at
2008/09/27 15:41
Trackbacks
関連記事 (0)
Comments
コメント (2)
Post Comment
コメントできます
Category
電算室 カテゴリ

 を書いて出力されたページを確認したところ,ページ内に設置した に記事内容と関係する広告が早速表示されていました。そこでもしやと思い,すぐさま で先ほど書いたばかりのページをしたところ,すでにその記事がインデックスされていたのです。 に適切な広告が表示されていることから,記事内容がクロールされた結果だとは思うのですが, によってクロールされた内容はにも反映されるのでしょうか? この疑問をサーバのアクセスログの内容と併せて調べてみました。

この記事をはてなブックマークに追加する この記事のはてなブックマーク数 | この記事をlivedoorクリップに追加する この記事のlivedoorクリップ数 | この記事をYahooブックマークに追加する この記事のYahoo!ブックマーク数 | この記事をdel.icio.usに追加する

 以下が記事を作成してから, のクローラが訪問してくるあたりの サーバのアクセスログになります(一部抜粋)。

まとめ

 今回,アクセスログからクローラの訪問履歴を併せて見てみると,結果に書いたばかりの記事がヒットするまでに, のクローラによって該当ページと が取得されていることがわかります。 のクローラである "Mediapartners-" について調べると,2004 年頃に書かれた古い記事では のクローラはインデックスには関係ないことが書かれていましたが,現在の仕様ではどうなっているのか,今回の検証ではそれを否定することは完全にはできませんでした。
 結果ページに表示されていた "4分前" という表示から,むしろ, の内容がインデックスされたと考えるのが可能性として濃厚な線と見てよいでしょう。もし の内容がインデックスに関係しているとすれば, は概要文のみの配信よりも全文配信の方が, の観点からすると有効かもしれません。


この記事を読んだ人はこんな記事も読んでいます 記事リコメンデーションについて

その他の関連する記事

この記事のアーカイブ

全ての記事 »
2008年
全てのカテゴリ »
電算室
全てのタグ »
, , , ,

関連記事/トラックバック

関連記事/トラックバックはまだありません

この記事にトラックバックを送るには?

寄せられたコメント (全 2 件中、最新 5 件まで表示しています)

Posted by
ぴろり ◆OLEEi.VOX.
at
2008/09/29 14:10
ID
rrqHfV8Q

ここ最近どこかで読んだ記事ではRSSの利用は4割くらいらしいですね。
人間が使うメリットよりもむしろ機械的に処理がし易いので>RSS
そっち方面の利用はだいぶ進んでいるような気がします。

Posted by
てらぽん♪
at
2008/09/28 21:43
ID
P/egRbsc

ここ半年ほどで、無料ブログの一部でRSSに挿入される広告が急に増えたような気がします。
裏返せばそれだけRSSの利用が一般化してきたと言うことでしょうか。

コメントを投稿する

 
 (匿名可/必須/公開)
 (匿名可/必須/非公開)
 (必須)
コメントスパム防止のため投稿前に ランダムな数字 CAPTCHAについて を入力してから投稿してください。お手数ですがご協力のほど宜しくお願いいたします。