XML Sitemapsで正規化したサイトマップの作成方法
目次
サイトマップを送信しても正規化されていなければ逆効果
sitemap.xmlを送信することが必須のように記載されている情報も良く見かけますが、sitemap.xmlを自動生成するサイトマップを送信すると、送信すべきページを完全に送信しなかったり、送信すべきでは無いページを送信してしまったりして、SEOには逆効果になることも良くあります。sitemap.xmlを自動生成してくれる機能はとても便利なのですが、自動生成では、完全に正規化したサイトマップにはならず、一度設定して送信しただけでは、かなり不備があり、かえってGoogleからの評価を落としてしまうことがあるので注意が必要です。
出典:検索エンジン向けサイトマップはSEOに逆効果になる場合もある
Googleもサイトマップが必要かどうかの判断をするように促しています。サイトのサイズが小さく、サイト内が完全にリンクされているケースの場合は、サイトマップは必要ありませんと記載していますので、参考にして下さい。
逆に、動画が多くページ数の多いサイトはサイトマップの送信が有効だと記載されています。それでも不完全なサイトマップの送信にはメリットがありません。
サイトの規模が大規模で、毎日数百ページも掲載されるようなサイトの場合はサイトマップは有効ですが、サイトマップにはそれなりの管理が必要です。
サイトマップがSEOでは絶対に必要だと考えていらっしゃる方も多いかと思いますが、正規化されていないサイトマップを送信することは逆効果になることもあり、自動生成したサイトマップを送信すれば完了と言う程簡単ではありません。完全に正規化したサイトマップの作成がとても重要度が高いです。
本来は、xmlファイルにページを1つ1つ記述してルートディレクトリにアップロードして検索エンジンにサイトの内容を伝えるものですが、最近は、自動生成するサービスやプラグインなどで対応することがほとんどでしょう。ただ、自動生成するプラグインでは、設定を間違えると画像だけのページを送信したり、サーバー内に存在するページを無差別に送信してしまい、同じ内容のページを複数送信してしまい、大量の重複が検出されるなどの問題があります。
このページでは、Googleから適正な評価を受けるために正規化したサイトマップを作成して送信する方法を解説いたします。
sitemap.xmlを送信しなければリンクを辿るので、適正にサイトがクロールされる
sitemap.xmlを送信せず、Googlebotがリンクを辿って収集するページに任せておけば、エラーや警告は検出されません。また、大量の重複ページが検出されることもありません。サイトマップを送信していなければ、Search consoleのカバレッジは綺麗な状態を保つことが出来ます。サイトマップの使い方を間違えると、エラーや警告、「インデックス登録されましたが、サイトマップに送信していません」や大量の重複の発生など、様々な問題が発生します。
完全に正規化したサイトマップを送信するためには、時間と手間がかかりますので、メンテナンスに時間と労力を掛けることが出来ない場合は、サイトマップの送信を行わない方が、不完全なサイトマップを送信するよりも遥かに良い結果になります。
XML Sitemapを送信してみる
プラグインの新規追加でXML Sitemapを検索して、表示されたプラグインをインストールして、有効化します。XML Sitemapで検索すると多くの候補が表示されますが、他のプラグインは使ったことが無いので、それぞれどこまで詳細な設定が出来るのか分かりませんが、私は、このプラグインで設定して利用しています。ページの追加やサイトマップに含めないページの設定が可能なので、おすすめ出来ると思っています。
WordPressのプラグイン。XML Sitemapの設定画面です。クロールは「Google は複雑なアルゴリズムを使用してクロールのスケジュールを設定している」ので、クロールスケジュールを細かく設定せずにGoogleに任せるようにするためにどのページも毎週にしました。また、優先順位もページ毎に差を付けずにどれも1.0にしました。この設定が良いかどうかは分かりませんが、少なくとも、こちらで、優先するページやクロール頻度を詳細に指定してしまうと、Googleの複雑なアルゴリズムでスケジュールを設定しているのを妨げるだけなので、詳細な設定はしないことにしました。
自動生成されるsitemap.xmlを送信すると、どんなページが送信されるか分かりません。送信された結果がSearch consoleのカバレッジに表示されてから、正規化したsitemap.xmlにするために、送信漏れのページは「新しいページの追加」で送信して、送信すべきでは無いページが送信されている場合は「投稿(個別記事)を含めない」でsitemap.xmmlから削除します。
sitemap.xmlが完全に正規化されるまでには時間を要しますが、丁寧にメンテナンスを行って、正規化されたたsitemap.xmlを送信しなければ、サイトマップを送信するメリットがありません。不完全なサイトマップを送信して、送信漏れがあると、サイトマップに記載されたページばかりがクロールされて、送信漏れのページのクロールが進まず、サイトの評価が十分に行われない可能性があります。
また、データベースで生成された大量の重複ページを送信してしまうと、低品質なサイトと評価されるので、丁寧に削除しないといけません。
早速エラーやインデックス登録されましたが、サイトマップに送信していませんが表示される
サイトマップを送信していなかった時には表示されなかったエラーやsitemap.xmlで送信されたページと送信漏れが通知されます。エラーはsitemap.htmlにnoindexが付いていると言うものです。sitemap.htmlはnoindexで良いので、HTML形式でのサイトマップを含めるのチェックも外しました。sitemap.xmlの設定をして送信しただけでは、色んな問題が発生するのでメンテナンスを行う必要があります。
「送信して登録されました」と「インデックス登録されましたが、サイトマップに送信していません」が有効になっています。「送信して登録されました」はサイトマップに記載されていたページで「インデックス登録されましたが、サイトマップに送信していません」はサイトマップに記載されていなかったけれど、Googleがインデックスしたページです。サイトマップに記載されているページはGoogleにページの巡回を促すページなので、「送信して登録されました」の巡回は頻繁に行われますが、「インデックス登録されましたが、サイトマップに送信していません」のページへのクローラーの巡回はあまり行われないので、Googleのサイト全体の評価が正しく行われない可能性があります。このようなサイトマップを放置していると、本来の検索順位に表示されず、獲得したいユーザーを集客出来ず、マーケティングにも悪影響が及ぶ可能性さえあるので正規化された適切なサイトマップを送信することはとても重要なことなのです。
「インデックス登録されましたが、サイトマップに送信していません」はサイトマップへの記載漏れなので、新しいページの追加に「インデックス登録されましたが、サイトマップに送信していません」に記載されているページを1つ1つ選択し、追加して更新しました。
「インデックス登録されましたが、サイトマップに送信していません」のページを追加しても少しずつページは減りますが、新たな「インデックス登録されましたが、サイトマップに送信していません」のページも検出されるので、検出されるページを確認して随時ページの追加が必要です。
除外に重複が急増
重複ページのIDを取得して、含めないページに記載します。IDは、投稿一覧の該当するページの編集にマウスを持って行くと、下にpost=の後に表示されます。
重複ページをサイトマップから除外するために、「以下の投稿または固定ページを含めないに記載して更新しました。カンマ区切りのID一覧」と記載されているので、カテゴリーIDと投稿IDを/で区切ってページ毎を:で区切って更新したところ、最初のカテゴリーIDだけが残って、他のIDは消えてしまいました。
また、sitemap.xmlを送信すると、送信前には無かった、検出-インデックス未登録が発生します。これしsitemap.xmlを送信しなければ、Googlebotのペースでインデックスして行きますが、sitemap.xmlを送信することで、インデックスして欲しいページの一覧が送信されるので、直ぐにはインデックス出来ないページが、ページが有ることは認識したけれど、インデックスはしていない検出-インデックス未登録になるものと思います。これは時間の経過と共にインデックスされるか、クロール済み-インデックス未登録に分類されると思います。クロール済み-インデックス未登録に分類された場合は、コンテンツが低品質と判断された可能性があるので、リライトして良質なコンテンツになるようにしましょう。
サブカテゴリーを含めないに設定する
サブカテゴリーのページが重複に表示されていたので、サブカテゴリーを含めないカテゴリーに追加しました。
「検出-インデックス未登録」も発生していますが、もう少し様子を見てから対応を考えたいと思います。
今回の重複は、サブカテゴリーを指定したページがカテゴリーと重複していただけなので、大きな問題はありませんでしたが、パラメータで大量に生成されたページが重複で送信されると、サイトマップから除外するのも大変ですし、ランキングにも大きな影響が出るので、注意が必要です。
重複は大幅に減少
サブカテゴリーをサイトマップに含めないようにしたことで、重複ページは大幅に減少しました。
代替ページ(適切なcanonicalタグあり)は以前設定していたampページが大量に表示されているので、しばらく待てはば消えると思います。
設定を変更後、sitemap.xmlを再度送信
設定を変更して、Search consoleでsitemap.xmlを送信しました。送信内容がいつ反映されるのかも見て見ます。上記の手順を繰り返すことで、正規化されたサイトマップになって行くと思います。sitemap.xmlを送信する場合は、常にSearch consoleのカバレッジを確認して、継続的に管理する必要があります。
エラーが0に
HTML形式のサイトマップを含めるのチェックを外したので、エラーが無くなりました。「インデックス登録されましたが、サイトマップに送信していません」も50ページあったのが14ページに減りました。まだ記載されているページをさらに「新しいページを追加」に記載しました。自動的に生成されるサイトマップではこのような記載漏れが発生するので、「インデックス登録されましたが、サイトマップに送信していません」のページを1つ1つ入力して「インデックス登録されましたが、サイトマップに送信していません」の数を減らすようにする必要があります。
サイトマップを送信するメリット
正規化されていないsitemap.xmlを送信することはリスクもありますので、送信するページを設定出来ない自動生成のツールは使用しない方が良いでしょう。一方、新規ドメインでSearch consoleに登録しただけだと、ページのインデックスがなかなか進まなことがあります。
公開して、40日ほど経過して54ページ作成してありましたが、Googleには15ページしかインデックスされないサイトがあり、sitemap.xmlを送信しました。
11月25日にsitemap.xmlを送信して、24日に45ページが「検出-インデックス未登録」に表示されました。sitemap.xmlを送信していない時には、ページが検出されることもありませんでしたが、Googleはページがあることを認識しましたので、今後、インデックスが進むと思います。
まとめ
sitemap.xmlを送信することがSEOでは必須と考えている人も多いと思いますが、このページで説明した通り、sitemap.xmlを送信しなければ、Search consoleのカバレッジには何も問題無くインデックスされるのに、自動生成されるsitemap.xmlを送信することによって、エラーや送信漏れ、重複ページなど、様々な問題が発生します。これを放置していると、sitemap.xmlを送信することでかえってGoogleからの評価を落とすことになるので、カバレッジの内容を確認しながらsitemap.xmlを修正しないといけません。
また、WordPress5.5から標準搭載されたサイトマップやAll in One SEO Packのsitemap.xmlはXML Sitemapのような細かな設定が出来ないので、正規化したサイトマップを送信することは不可能なので、使用する場合は十分に検討しましょう。
それぞれ使用するsitemap.xmlがどのような挙動をするのか理解した上で、インデックスするページを確実に送信し、送信すべきでは無いページは極力送信しないsitemap.xmlを選んで送信しましょう。質の悪いサイトマップで自動生成すると、サイトマップ本来の役割を果たさないどころか、サイトの内容を適切にGoogleに知らせることに役立ちません。
WordPress5.5から標準搭載されたsitemap.xmlを無効化したい時は、WPDisable Sitemapをインストルーして有効化すれば、標準搭載のサイトマップは無効化されます。また、XML Sitemapを有効化すれば、標準搭載のサイトマップからは送信されません。
このページで紹介したように、サイトマップはただ送信すれば良いものでは無く、正規化するためにメンテナンスが必要です。サイトマップを十分に活用するためのメンテナンスが無理な場合は、サイトマップの送信自体を行わないことがGoogleにサイトの構造を自然に伝えることになります。よほど大規模なサイトで無い限り、サイトマップが無くてもGoogleは非常に高度なクロールスケジュールでサイトの全体像を把握してくれます。
完全に正規化されたサイトマップはSEOにも有効でWEBマーケティングにも有効に働きますが、正規化していない自動生成されたsitemap.xmlの送信が必ずしもSEOに有効に働かないことを認識しましょう。サイトマップを送信する際は、正規化のメンテナンスが出来るプラグインを選ぶことと、送信したまま放置せずに、Search consoleのカバレッジの中を確認して、送信すべきページや送信してはいけないページを的確に把握して、項目の修正を行いましょう。
清水 康次
最新記事 by 清水 康次 (全て見る)
- 富山でホームページを活用した効果的な集客方法 - 2024年10月14日
- 「検索しても出てこない」と感じたときの対処法とその理由を徹底解説 - 2024年10月9日
- SEO対策の外注は高すぎる?費用の内訳とコストを抑えるポイント - 2024年10月4日