あなたのサイトマップをたった1行で検索エンジン共通にする方法

Posted by
ぴろり
Posted at
2007/04/27 14:34
Trackbacks
関連記事 (0)
Post Comment
コメントできます
Category
電算室

 ,MSNの 検索サイト大手3社がサイトマップを標準仕様に採用すると発表して暫く経ちますが,そこへ先日, Ask.comが参加を表明 (英語原文) しました。 これでサイトマップをサポートするサイトは4社となり, 業界内における共通仕様としての重要性が更に増すことになります。
 今回のアナウンスでは Sitemaps Autodiscovery についても発表があったようで, この記事ではあなたのサイトマップを Sitemaps Autodiscovery 対応する方法を紹介しています。 ファイルにたった 1 行追記するだけですのでとてもお手軽です。

この記事をはてなブックマークに追加する この記事のはてなブックマーク数 | この記事をlivedoorクリップに追加する この記事のlivedoorクリップ数 | この記事をYahooブックマークに追加する この記事のYahoo!ブックマーク数 | この記事をdel.icio.usに追加する

方法

 おそらく殆どのサイトではエンジンのクローラ用に robots.txt が用意されていると思いますが,これにたった 1 行追記するだけです。

 ちなみにこのサイトのrobots.txtこんな感じになっています。

解説

 今回のを受けて久々に sitemaps.org を訪ねてみると,語ページが用意されていたりとリニューアルしていました。 ただ,一部語訳されていない部分が残っていたりしてまだ不完全なようです。 その中でプロトコルの説明に以下の項目が追加されていて, これが今回アナウンスされた Sitemaps Autodiscovery についての説明になります。

robots.txt ファイルにサイトマップの場所を明示する

robots.txt ファイルを使ってサイトマップの場所を明示することができます。 そのためには,単純に次の行を追加するだけです:

Sitemap: <サイトマップの場所>
<サイトマップの場所> は, http://www.example.com/sitemap.xml のようなサイトマップへの完全な URL でなければなりません。
この指定はユーザエージェントの指定とは無関係で, ファイルの中のどこに書いても問題はありません。 もしサイトマップのインデックスファイルを使用しているのであれば, そのインデックスファイルの場所だけを含めればよく, インデックスファイル中に記載されているそれぞれ個々のサイトマップを羅列する必要はありません。

効果のほどは?

 アクセスログを見ると,今までも のクローラロボットは 頻繁にサイトマップを参照してくれていた一方, や MSN のクローラボットは全く知らんぷりでした。 実際, と MSN についてはサイトマップを知らせていなかったので当然と言えば当然です。
 そこで今回,robots.txt でサイトマップの在り処を明示したところ, 早速 のクローラロボットがサイトマップにアクセスしていました。 作業として robots.txt にサイトマップの指定を追記しただけなので, Sitemaps Autodiscovery の仕様に従ってクロールしてくれていることが判ります。 MSN と Ask.(com|jp) からのアクセスは未だ確認できていません。

 これで後は MSN と Ask.* のクローラボットについても無事にサイトマップを取得してくれるようになれば, サイトマップとは別にわざわざ ROR (Resources of a Resource) を用意する手間も省けるわけですね。


この記事を読んだ人はこんな記事も読んでいます ?

その他の関連する記事

この記事のアーカイブ

全てのカテゴリ »
電算室
全てのタグ »
, , , ,
全ての記事 »
2007年

関連記事/トラックバック

関連記事/トラックバックはまだありません

この記事のトラックバック URL

コメントを投稿する

 (必須/公開)
 (必須/非公開)
 

コメントスパム防止のため投稿前に ランダムな数字 ? を入力してから投稿してください。 お手数ですがご協力のほど宜しくお願いいたします。(必須)