「クロール済み-インデックス未登録」とは?原因と対処法を解説
SEOを行う上で、多くの人はGoogleが提供している無料サービスであるGoogle Search Console(グーグルサーチコンソール)を使用し、ツールやレポートを使ってWebサイトのモニタリングを行っています。
検索エンジンからページを認識してもらえないという状態を避けるために、Search Consoleでインデックス状況を確認することも必要です。
その中で「クロール済み-インデックス未登録」という項目が表示された経験はありませんか?
今回の記事では、この「クロール済み-インデックス未登録」とは何なのか、その原因や解決方法について詳しく解説します。
検索流入の拡大に向けて、ぜひ参考にしてください。
目次
「クロール済み-インデックス未登録」とは
まずは「クロール済み-インデックス未登録」の概要を説明します。
制作したページがGoogleの検索結果に表示されるには、Googleのクローラーがページを発見し、クロールし、インデックスに登録する必要があります。
しかし、何らかの要因で「インデックスする必要はない」と判断され、インデックス登録が行われなかった状態を「クロール済み-インデックス未登録」と呼びます。
Search Consoleヘルプでは「クロール済み-インデックス未登録」について次のように説明しています。
ページは Google によりクロールされましたが、インデックスには登録されていません。今後、インデックスに登録される可能性がありますが、登録されない可能性もあります。この URL のクロールのリクエストを再送信する必要はありません。
ページ インデックス登録レポート – Search Console ヘルプ
そのため、「クロール済み-インデックス未登録」の状態になった時は、コンテンツの改善やリライトを行う必要があります。
クロール済み-インデックス未登録が大量にあるサイトは低品質なサイトと判断される可能性もある
「クロール済み-インデックス未登録」に該当するページが少なければ問題ありませんが、大量のページが該当している場合、Googleから低品質なコンテンツが多いサイトと判断される危険性があります。
サイト全体が低品質と評価されると、良質なコンテンツを掲載しても検索順位が上がりにくくなることがあります。
そのため、「クロール済み-インデックス未登録」に適切に対応することで、Googleからの流入を大幅に改善できることがあります。
「クロール済み-インデックス未登録」と「検出-インデックス未登録」は何が違うの?
「クロール済み-インデックス未登録」とよく似た項目に「検出-インデックス未登録」があります。
「検出-インデックス未登録」は、URL自体はクローラーに発見されたものの、クロールはされていない状態を指します。
この2つの違いは、クロールされているか否かです。
つまり、前者はクローラーによってページが訪問されているがインデックスされていない状態、後者はページがまだクロールされていない状態です。
「クロール済み-インデックス未登録」になる原因
では、なぜインデックスが拒否されるのでしょうか。考えられる主な原因を以下に紹介します。
コンテンツが低品質である
Googleはユーザーにとって有益で価値の高いコンテンツを求めています。
情報量が極端に少ないページなどは、低品質とみなされ「クロール済み-インデックス未登録」となることが多いです。
ニュースやお知らせのページで、極端に短いページが大量にある場合や、お問い合わせページやお問い合わせ完了ページもインデックスされないことが一般的です。
例えば「お客様の声」というコンテンツを1クライアント1ページにしてしまうと、極端な短文ページになってしまい、「クロール済み-インデックス未登録」になります。
さらに、乱発されたtagの一覧ページにtagの記事が全く無いなど、2記事しか無いページも「クロール済み-インデックス未登録」になりやすいページです。
もしあなたが会社のウェブサイトを運営する担当者でありインデックスさせなくても問題ないと判断できる場合は、放置せずnoindexを設定することをおすすめします。
影響は大きい
重複コンテンツである
コンテンツが重複している場合も「クロール済み-インデックス未登録」になります。
URLの末尾の「/」の有無や「www.」の正規化の問題、パラメータで大量の重複コンテンツが生成されることが原因です。
canonicalタグが設定されていても、正規ページが誤認されている可能性があります。
影響は大きい
RSSフィード
RSSフィードはGoogleから使用が推奨されており、基本的に特別な対策は不要です。
ただし、クロールバジェットの節約のために、robots.txtでDisallowにすることも検討できます。
影響は無い
記事の一覧のトップページではない
記事一覧のページネーションの2ページ目以降は、検索エンジンにとってもユーザーにとっても不要な情報です。
これらのページが「クロール済み-インデックス未登録」となっていても問題ありません。
影響は無い
画像だけのページ
WordPressなどのCMSが生成する画像だけのページは、テキストがテンプレートのみでページ固有の情報が無いため、検索結果に表示する必要がありません。
これらのページが大量にあると、Googleからの評価が悪化します。
影響はとても大きい
検索結果の「検索結果は0件でした」のページ
サイト内検索機能がある場合、「検索結果は0件でした」のページが検出されていることがあります。
これらのページが大量に検出されると、Googleのクロールバジェットを無駄に消費します。
これらの原因を理解し、適切な対応をすることで、「クロール済み-インデックス未登録」の問題を解決し、Googleからの評価を改善することが可能です。
このようなページはユーザーにとって全く価値のないものですので、検索結果に表示されるページはインデックスさせないようにしましょう。
影響は大きい
真っ白なページなのにサーバーステータスで200を返している
「クロール済み-インデックス未登録」の中には、ページにアクセスすると真っ白なページが表示されることがあります。
通常、このようなページはサーバーステータスとして404エラー(Not Found)を返すべきですが、中身が全くないにも関わらず200(成功)を返している場合があります。
そのため、Googleはインデックス対象と誤認し、結果として未登録になります。
影響はとても大きい
日付アーカイブや投稿者アーカイブ
月別や投稿者の一覧ページは、ユーザーが望んで見るものではありません。
ユーザーは問題解決に役立つページを求めていますので、これらのページはインデックスする価値がありません。
多少影響がある
誘導ページ
営業範囲や都道府県名だけ異なる誘導ページを大量に作成している場合、これらはユーザー向けではなく検索エンジン向けに作成されたページです。
そのため、インデックスする価値がなく、「クロール済み-インデックス未登録」となることがあります。
また、誘導ページはスパムポリシーに違反しますので、絶対に作成しないようにしましょう。
影響はとても大きい
リニューアル前の古いページ
古いページが必ずしも低品質であるとは限りませんが、通常、ホームページをリニューアルして以前のコンテンツを移行した場合、古いデータは削除するべきです。
古いデータが残り、それが低品質と判断される場合があります。
極端に古いデータが残っている場合は、削除することを検討しましょう。
影響は大きい
ハッキングで低品質なページを大量に生成される
サイトがハッキングされると、外国語のページが大量に生成されることがあります。
ハッキングされたサイトはほぼ「クロール済み-インデックス未登録」とされます。
サイトがハッキングされた場合、早急に対処する必要があります。
影響はとても大きい
類似コンテンツがある
Googleがコンテンツの独自性が不十分と判断するページは、「クロール済み-インデックス未登録」となることがあります。
コンテンツには独自性と価値が必要です。
類似した既存のページが多い場合、インデックスされる可能性が低くなります。
影響がある
サーチコンソール側の問題
サーチコンソールにおいて誤検知やバグが起き、一時的に「クロール済み-インデックス未登録」が表示されることもあります。
数日程度の間、様子を見て問題が解決しなければ対処を検討しましょう。
「クロール済み-インデックス未登録」を解決する方法
それでは次に「クロール済み-インデックス未登録」を解決するための方法を紹介していきましょう。
リライト
コンテンツが低品質と判断された場合は、リライトを行い高品質なコンテンツに改善することが重要なポイントです。
リライトにはいくつかのアプローチがありますが、以下の点を確認しましょう。
- 検索意図に沿った内容かどうか
- 競合他社のコンテンツと比較して不足している情報がないか
- 検索クエリに適切に答えているか
- 関連記事に内部リンクを適切に設置しているか
もし品質向上が難しいと判断される場合は、記事を削除することも検討しましょう。
ページの統合
リライトしても問題が解決しない場合は、関連するページを統合して整理します。
統合する際には、元のページにアクセスしたユーザーが自動的に統合先のページにリダイレクトされるように、301リダイレクトを設定することを忘れないでください。
例えば、乱発されたtagページがある場合は、tagを整理して減らすか、tagページ自体をnoindexに設定します。
また、お客様の声が1クライアント1ページに分かれている場合は、解決課題ごとにページを作成し、複数のクライアントの声を1ページにまとめることで、「クロール済み-インデックス未登録」を回避できます。
これらの手法を組み合わせて、ページの品質を向上させ、Googleによるインデックス登録を促進しましょう。
ニュースやお知らせのページは別ドメインに移す
ニュースやお知らせの超短文のページは、別ドメインに移すことを検討しましょう。
別ドメインに移す場合、サブドメインではなく完全に別のドメインを使用する必要があります。
異なるトップレベルドメイン(.jp、.com、.netなど)も内部リンクと見なされますが、完全に異なるドメインにすることで、別サイトとして扱われます。
別ドメインにする場合、メインメニューからのリンクを設置することになりますが、注意が必要です。
メインメニューやサイドバーなどのテンプレートからのリンクは、広く配布されるリンクに分類され、リンクスパムと見なされる可能性があります。
そのため、これらのリンクにはnofollow属性を付与することをおすすめします。
nofollow属性を設定することで、リンクスパムの自動ペナルティを回避し、低品質なコンテンツがサイト全体に与える悪影響を防ぎます。
canonicalタグ
canonical(カノニカル)タグは、サイト内に重複したり類似したページがある場合に使用され、どのページを評価してほしいかを検索エンジンに伝えるためのタグです。
正規のURLにcanonicalタグを設定することで、検索エンジンに正しいページを表示するよう指示します。
noindex又はDisallow
画像だけのページや検索結果のページは、改善して高品質なページにすることが難しい場合があります。
これらのページには、Googleによるインデックスを防止するためにnoindexタグを使用するか、robots.txtでDisallowを設定してクローラーのアクセスを制限しましょう。
多数のページが「クロール済み-インデックス未登録」となったら
もしも自社のウェブサイト内で多くのページが突如として「クロール済み-インデックス未登録」となった場合は、注意が必要です。
特定のページだけでなく複数のページで問題が発生している可能性がありますので、以下の点を調査しましょう。
まず、全体のウェブサイトなのか、ある特定のディレクトリ内で問題が増加しているのかを確認します。
そして、それらのページに共通する原因を特定することが重要です。
誤ってnoindexタグを設置してしまったり、自動生成されたコンテンツが原因である可能性も考慮しましょう。
まとめ
今回は、「クロール済み-インデックス未登録」が発生した場合の対処法をご説明しました。
例外として除外されるページ(例えばfeed/RSSや2ページ目以降のページなど)を除き、他のページは高品質なコンテンツに改善するなど早急に対処する必要があります。
問題を放置すると、ウェブサイト全体の評価が低下し、先に進めているSEO対策やマーケティング施策の効果を損なう恐れがあります。
このような状況に直面した場合は、専門家に相談することをおすすめします。
集客に強いサイト作成はSEO対策専門会社へご相談を
インデックスの管理は集客において極めて重要ですが、実際に問題が発生した際には、ブログや動画での一般的な解説を参考にするだけでは正確な対処が難しいこともあります。
特にSEO対策は、一見簡単に見えても実際にはデジタルマーケティングの専門知識と経験が必要な分野です。
また、リソースが不足していたり、他の業務に忙殺されている場合は、問題に適切に対処することが難しいこともあります。
そのため、ウェブサイトで起こる問題やSEO対策の成果が上がらない場合には、専門のSEO対策会社である当社にぜひご相談ください。
弊社はSEOの専門家として、全国の企業のサイトアクセスを大幅に改善してきました。
お客様の目標達成に向けて、ユーザーの視点に立った情報掲載のサポートを行っています。
また、サイトを上位表示させる方法や内部・外部対策に関するご相談に対して、豊富なノウハウを活かした対応を行っています。
SEO対策についてお悩みでしたら、お気軽にご連絡ください。
最後までご覧いただきありがとうございました。
清水 康次
最新記事 by 清水 康次 (全て見る)
- SEO対策の外注は高すぎる?費用の内訳とコストを抑えるポイント - 2024年10月4日
- SEOを外注するメリットと注意点:成果を出すための正しい選び方を徹底解説! - 2024年9月17日
- ホームページがインデックスされない理由とその解決方法 - 2024年9月10日