Entries

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

サイトマップ

サイトマップは訪問者に対する、案内役であり、また内容の要約でもありあるととても便利なものです。サイトマップはその内容性質から、大きく分けて2種類あります。

ひとつは一般のユーザーがサイトを訪れた際に使う、いわゆる目次的なサイトマップ。そしてもう一つは、検索エンジンがサイトをクロールする場合のガイド役となるサイトマップの2種類です。


一般ユーザー向けのサイトマップ

目次となるものなので見やすく分類とラベリングがされていることが大切です。あとは特に定まった形もないので自由です。

ただしGoogleのガイドの中に、一つのページからのリンクは100未満に押さえることという項目があるので、リンクは内部、外部あわせて100を越えないようにします。

リンク数に関しては、Googleのウェブマスター向けヘルプセンター内の、ウェブマスターのためのガイドラインに記述があります。


検索エンジン向けサイトマップ

なぜ検索エンジン向けにサイトマップを作るかというと、検索エンジンロボットはしょっちゅう巡回には来ているのですが、リンクをたどっているのでいつも全てのページを回っているわけではありません。

ですからいつも片寄ったページばかりがクロールされる可能性があり、全てのページがインデックスされるわけではないということです。でも検索されるためにはまずインデックスしてもらわないことには、検索結果に出てきません。

そこでこちらからこれだけページがありますよと教えることで、巡回経路に入れてもらいそしてインデックスされるということです。

検索エンジン向けには、一定の形式で作るサイトマップがあり適しています。以前は検索エンジンごとにサイトマップの作り方がばらばらでしたが、2006年にGoogle、Yahoo!、MSNやその他多くの企業がsitemap.org形式をサポートするようになったので、今後はこの形式が主流になると思われます。

FC2ブログではわざわざ作成しなくても自動でサイトマップが出来ているので、それをGoogleのウェブマスターツールに登録するだけです。Googleサイトマップ(以前の独自バージョン)に対応しています。サイトマップマニュアルを参照してください。

スポンサーサイト

sitemap.org

テキストエディタでも作れる簡単なファイルです。それにsitemap.xmlと名前をつけアップロードすればいいのです。 書式は次のようになります。<urlset>~</urlset>の間に<url>~</url>を繰り返して記述します。下記の先頭の2行はこのまま記述します。


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://sample.com/</loc>
<lastmod>2007-07-22</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://sample.com/index.html</loc>
<lastmod>2007-07-22</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>

・・・・・・・・・・・・以下同様に登録したいページを記述・・・・・・・・・・・・

<url>
<loc>http://sample.com/sample.htm</loc>
<lastmod>2007-07-12</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>


見慣れないタグがあると思うので少し解説します。

lastmod・・・・・・・URLの最終更新日、省略可。

changefreq・・・・URLの更新頻度です。ロボットがクロールに来る頻度の目安になります。 設定できるのはalways、hourly、daily、weekly、monthly、yearly、never。省略可。

priority・・・・・・・サイト内でのそのページの優先度です。0.0から1.0の間で設定します。 サイト内での相対的な優先度なので、クロールしてほしい順に大きな数字にします。 なんでもかんでも大きな数字にしても意味ないです。省略可。

出来上がったら、ルートフォルダ(トップページ、index.htmlのある階層)にアップロードすることが推奨されています。

次に検索エンジンへサイトマップの存在を知らせなければならないのですが、対応はrobots.txtで行います。以下の見本のように記述したテキストファイルです。


User-agent: *

Sitemap: http://sample.com/sitemap.xml

(最後に空行を1行入れる)


出来上がったらrobots.txtとファイル名をつけ、sitemap.xmlと同様にサイトのルートフォルダにアップロードします。以上で完了です。あとは検索エンジンロボットはまずこのファイルを読みますので、そのときにサイトマップを認識します。


robots.txt以外に、Googleなどの場合ウェブマスターツールに登録するという方法もあります。やり方はまずGoogleアカウントを取る。次にウェブマスターツールにログインして自分のサイトを登録する。

そしてウエブマスターツールにサイトマップの項目があるのでそこにsitemap.xmlのURLを登録する、以上でサイトマップが認識されます。後は自動で時々ダウンロードされてます。詳しい説明はGoogleのウェブマスターツールのページにあります。


さてサイトマップの効果ですが、私の別サイトの例で、サイトマップを使うまでのインデックスが30ページほどでしたが、使用後は全てのページ(200越)がインデックスされました。絶大な効果が期待できます。

本家を一度参照してみてください→sitemap.org


サイトマップ自動作成サイト

サイトマップは手打ちでこつこつ作ってもできる簡単なものですが、自動で作成してくれるツールやサイトもあるのでいくつか紹介します。

Xml-sitemaps.com(http://www.xml-sitemaps.com/)

ここはもう一目で見て分かるサイトで、自分のサイトのURLを入れ、それ以外にいくつか選択項目があるけれど、分からなければ放置でも良しです。活用したい方は当サイトのsitemap.orgの項目を見てください。

そしてstartボタンをクリックすれば作成されダウンロードできます。ただし作成されるのは500ページまでです。


SiteMap Builder 1.5

これはパソコンにインストールして使うソフトです。NET Framework1.1が必要ですがこれはWindows Updateでインストールできます。もっとも最初ダウンロードしてきたファイルを解凍するとsetupファイルがあるので、それをクリックするとNET Frameworkが必要と聞いてきます。

本家ではありませんが、ダウンロードはこちらから出来ます→Cowscorpion.com

★使い方

  1. urlボックスにアドレスを入れます。

  2. 「Extract Links」をクリックすると、サイト内のページ一覧が出ます。

  3. 「File」を押し、次に「Save Map as」で出力出来ます。



上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。