低品質コンテンツの見つけ方と対処法を解説
サイトに低品質なコンテンツがあるとSEOにおいてGoogleからの評価が下がり、検索結果の上位表示を阻む要因になることもあります。
しかし、「低品質なコンテンツ」とひと言で言われても具体的にどのようなものを言うのか分からない、という人もいるでしょう。
そこで今回の記事では、低品質なコンテンツの定義とその見つけ方、対策方法について解説します。
どうぞ最後までご覧いただき、SEO対策の参考にしていただければと思います。
低品質コンテンツとは?
低品質コンテンツとは、簡単に言うと検索ユーザーが求める情報や価値のある情報が掲載されておらず内容が薄いコンテンツのことを指し、最近では文字数の少ないページも低品質なコンテンツとして判断される傾向にあります。
ユーザーの検索意図に合っているコンテンツは良質です。文字数が少なくても、例えば「草冠に西」で検索しているユーザーは「茜」の読みを知りたいと思っているので「あかね」が分かれば良いので、短文のページでも高品質ですが、「SEOとは」と言うキーワードで検索している場合は、「良質なコンテンツを掲載することです」と言うテキストだけでは低品質と評価されます。
Googleの検索品質評価ガイドラインでは以下のように低品質コンテンツを定義しています。
低品質コンテンツは、有益な情報を提供できないページを指します。
メインコンテンツの量が少ない、メインコンテンツ作成者の専門知識がかけているなどのページです。
以下の項目が1つでも当てはまる場合は、低品質コンテンツとみなします。
・E-A-T(専門知識、権威性、信頼性)のレベルが低いページ
・メインコンテンツの品質(内容)が低いページ
・メインコンテンツのタイトルが誇張されていて、実際のページ内容とタイトルの整合性がとれていない
・広告、サブコンテンツといった、メインコンテンツ以外の情報が中心になっている
・作成者の情報が不十分
(引用元(著者翻訳):General Guidelines July 20, 2018)
低品質コンテンツの評価基準はメインコンテンツが中心となっており、メインコンテンツのオリジナルのテキスト(テンプレートや広告を除く)が少ないと、質の低いコンテンツと言えるでしょう。
低品質コンテンツと判断される例
Googleでは更に具体的に低品質コンテンツの例を公式(Google検索セントラル)で公開しており、以下の4種類を示しています。
低品質コンテンツかどうかを見分けるポイントになります。
自動生成されたコンテンツ
プログラムを利用して収集したコンテンツを使って自動生成したコンテンツを意味します。
ここでポイントとなるのは、自動生成自体が問題なのではなく「検索ランキングを操作する目的」で行われた場合に低品質コンテンツとされる点です。
ワードサラダのように意味のない文章やコピー、無断複製したコンテンツをつなぎ合わせたコンテンツを作成していると、ガイドライン違反としてペナルティ措置を受けることになります。
アフィリエイトページ
すべてのアフィリエイトページが問題なのではありません。
独自の付加価値を持たないアフィリエイトページについてが低品質コンテンツと判断され、評価が低くなります。
・無断複製されたコンテンツ
いわゆるコピーサイト、コピーコンテンツです。
アフィリエイトページと同じように、独自の付加価値を含まないコンテンツは評価の対象になりません。
誘導ページ
誘導ページはその名の通り、ユーザーを特定のページへ誘導するためのページを指し、サテライトサイト」の中にも、誘導ページにあたるものが多くあり、ドアウェイページと呼ばれることもあります。
事例としては地域名だけを変更した同じ内容のページを量産しそれぞれのページで検索上位を狙う手法で、ガイドライン違反とされます。
CMSが生成する中身の無いページ
WordPressなどのCMSが生成する画像だけのページや、大量に作られたtagページでtagに該当するページが無いか1~2件程度しか無いページ。検索結果ページで「該当する結果が0件でした」のようなユーザーにとって何の価値も無いページ。いずれも大量に生成されていることが多く、放置することはとても危険です。
このようなページをGoogleに見せると、「ウェブサイトの一部に質の低いコンテンツが掲載されている場合に、サイト全体のランキングに影響が及ぶ可能性があります。」
お問合せページや完了ページ
お問合せフォームだけのページやお問合せ完了ページは、ユーザーの検索意図に対する回答が掲載されているページではありません。このページも低品質なページに分類されるので、インデックスしないようにしましょう。
ニュースページ
ニュースのカテゴリーに掲載されている「ホームページを開設いたしました」や「年頭のご挨拶」やニュース一覧に掲載するだけのタイトルだけしか記載されていないページもユーザーの疑問や質問を解決するページでは無いので、低品質と判断されます。
低品質かどうかの判断は、ユーザーに価値を提供しているかどうかで判断出来ます。
真っ白なページなのにサーバーステータスで200を返している
真っ白なページは通常404エラー(Not Found)を返すべきなのですが、200(成功)を返していることがあります。
「クロール済み-インデックス未登録」の中に真っ白なページがあった場合は、サーバーステータスを確認して、200を返している場合は、robots.txtでDisallowにしましょう。
低品質コンテンツの見つけ方
それでは次に、ツールを使った自社のサイト内にある低品質コンテンツの見つけ方について説明していきましょう。
アナリティクスで見つける方法
低品質コンテンツの見つけ方、一つ目はアナリティクスを利用して見つける方法です。
まず、アナリティクスの管理画面にある「行動」をクリックし、「サイトとコンテンツ」から「すべてのページ」を開きます。
1ヶ月の期間でユーザーの滞在時間を見て、平均滞在時間が20秒以下のページは低品質コンテンツである可能性が高いです。
ユーザーの滞在する時間が短い理由としては、興味が持たれない内容であったり文字数が少ないページであることが考えられ、それはつまりユーザーにとって低品質なコンテンツであると言えます。
ただ、平均滞在時間はあくまで目安であり、そのサイトのジャンルや内容によっても異なり、例えば天気であればページが表示されて瞬時に求めている情報が分かるため、数秒でページを離れるのが普通というケースもあります。
このような場合は低品質のコンテンツとは言えません。
サーチコンソールで見つける方法
続いてGoogleサーチコンソールを利用した低品質コンテンツの見つけ方です。
アナリティクスではユーザーの行動や反応から質の低いコンテンツを見つけていきましたが、サーチコンソールでは既にGoogleから低い評価を受けているページから見つける方法になります。
ここで見つかったものは低品質というよりも、検索意図とコンテンツが合っていないことが原因で低評価を受けている場合が多く、検索順位を上げるためにも定期的にチェックして改善することが必要です。
サーチコンソールの「検索トラフィック」→「検索アナリティクス」をクリックし、上部に表示されている「クリック数・表示回数・CTR・検索順位」の4つにチェックを入れ、その下の「ページ」をクリックします。
一覧の項目の中にある「掲載順位」をクリックして降順にソートします。
そこで掲載順位が50位以下、クリック数が1桁のページが低品質コンテンツの目安となります。
もう一つ、「クロール済み-インデックス未登録」と処理されているページから低品質コンテンツを見つける方法です。
インデックスに登録されていない理由はさまざまですが、クロールの結果、品質基準を満たしてない、RSSフィードのURL、重複ページや重複コンテンツ、誤検知といったものが考えられます。
手順としては、インデックス→ページ→ページのインデックス登録を表示して、リストアップされたページの中から上記に該当しそうなページを探し修正しましょう。
Search consoleのページの中の「未登録」のページ
Search consoleの「未登録」は何らかの理由でGoogleがインデックスしなかったページです。この中で、「noindex タグによって除外されました」や「代替ページ(適切な canonical タグあり)」のようにサイト管理者として意図した通りのページは問題ありませんが、「クロール済み-インデックス未登録」や「検出-インデックス未登録」のほとんどはGoogleが低品質と判断してインデックスしなかったページと考えて良いページです。
ドメインパワーが低くて未登録が多いこともありますが、サイトを公開して半年以上経過していて、「インデックス未登録」に多くのページが掲載されている場合は注意が必要です。「インデックス未登録」の中には、画像だけのページや、全く中身の無いページが見つかることが多いです。
乱発されたtag一覧や日付アーカイブ、投稿者アーカイブ、お問合せページやお問合せ完了ページや、時には検索結果ページで、「検索結果0件」のページがインデックス対象になっていることもあります。Googleにインデックスさせる必要の無いページはインデックス対象から外しましょう。
また、feedはRSSリーダーに通知するためのページで、Googleにインデックスする必要はありませんので、robots.txtでDisallowにするなどの対応を行いましょう。
同じように未登録の中の「重複しています」に分類されているページも低品質なページと考えられます。ネット上にあるコンテンツは印刷物とは違い1つのコンテンツがあれば、サーバーの処理能力の範囲内でどれだけでもアクセスを処理出来ますので、重複コンテンツが存在する意味は無いので、重複コンテンツは低品質なコンテンツと判断されます。
これらのページはサイト運営者が低品質のページが生成されていることに気付いていないことが多く、全く対策されていないページでこのページが大量にあって低評価になっているサイトは多いです。
このようなページをGoogleに見せないように適切に対応することで、サイト全体の評価が上がってアクセス数が大幅に増加することがあります。
低品質コンテンツを見つけたら行うべき対処法
低品質コンテンツはそのままにしておくとSEOに悪い影響を及ぼす可能性が高いため、適切な対策を実施しなければなりません。
低品質コンテンツを検索エンジンにインデックスさせないことが重要です。
ウェブサイトの一部に質の低いコンテンツが掲載されている場合に、サイト全体のランキングに影響が及ぶ可能性があります。そのため、質の低いページを削除する、コンテンツの内容が薄いページを有用なページに統合するか改善する、または質の低いページを別のドメインに移動することによって、コンテンツの質が良くなり、掲載順位が上昇する可能性があることをもう一つの具体的なガイダンスとして提示しています。
主な方法を紹介します。
リライトする
低品質コンテンツはリライトし、高品質なコンテンツに仕上げましょう。
どこを強化するか、競合サイトをよく見て自分たちに何が足りないかを分析することもおすすめです。
ウェブページというのは制作して終わりではありません。常にメンテナンスしアップデートをするためにリライトすることは非常に重要です。
その際、コンテンツの目的やキーワード、タイトルは設定されているか、ターゲットにしているのはどんなユーザーか、ユーザーのニーズを解決できる内容か、他のサイトの情報をコピーしたり寄せ集めたものではなく、独自性や専門性のある情報や見解を含んでいるか、他社のコンテンツと比較して優位性があるか等のポイントに注意しましょう。
リライトの手順
まず、低品質なコンテンツがSearch consoleの「ページ」→「未登録」→「クロール済み-インデックス未登録」か「検出-インデックス未登録」にある場合。この場合、そもそもページをGoogleがどのキーワードで評価されているかも分からないので、記載されているタイトルがユーザーの疑問や質問に対する回答になっているかを考えて、適切な内容に変更します。
その内容に従って、ページの内容をユーザーの疑問の回答に合うように追記します。
ページがGoogleにインデックスされている場合。ページのURLを「検索パフォーマンス」→「ページタブを選択」→「ページたありの行数を500にする」→「Ctrl+Fで検索窓を表示して、URLを検索する」→「ヒットしたURLをクリックしてURLのみの検索パフォーマンスを表示する」→「クエリタブを選択してヒットしているキーワードを表示する」。これで、ページがどのキーワードで評価されているのかが分かります。
ヒットしているキーワードとページに記載してある内容と合わないこともあります。これは、ページに記載されている内容はGoogleで検索されておらず、別のキーワードでニーズがあるると言うことです。このヒットしているキーワードに対する質問の回答として適切な内容に修正することでユーザーの検索ニーズに合ったコンテンツになります。
noindexを設定する
noindexとは検索エンジンに対しページをインデックスしないように指示する目的で設定されるHTMLのmetaタグの一つです。
低品質なコンテンツがウェブサイトに必要な場合は、noindexを記述することでサイト全体の品質が下がることなく保つことが可能です。
この時、評価を得ている外部リンクなどはcanonicalタグでURLの正規化をするように注意して下さい。
但し、noindexにしてもGoogleはページをクロールし、低品質なページが存在していることは認識していますので、時間を掛けてもリライトして高品質にするか、リライト出来ないページは削除しましょう。
noindex出来ないページはDisallowにする
画像だけのページや検索結果のページは自動生成されるので、noindexの設定が出来ないことがあります。そのような場合は、robots.txtでDisallowにしましょう。
コンテンツを削除する
低品質コンテンツを見つけ、そのページが特に必要なコンテンツでない場合は潔く削除するという手法もあります。
もし必要であれば上記のようにnoindexの設定を行って下さい。
重複コンテンツはcanonicalか301リダイレクト
重複コンテンツはnoindexやDisallowをGoogleは推奨していません。canonicalで正規ページを指定するか、301リダイレクトで正規ページにリダイレクトするようにしましょう。
低品質コンテンツを生成しないための対策
低品質コンテンツを見つけても、わざとそのようなコンテンツを作成しようとしているわけではないでしょう。
多くの場合は知らないうちに作成してしまう、時に大量に量産してしまっているものです。
そうならないためには以下の注意点に気を付けてください。
ディレクターを配置する
オウンドメディアを運営している場合、複数のライターがコンテンツの作成に関わっているかと思います。
その際、コンテンツ全体の品質を管理するディレクターがいないと知らないうちに似たコンテンツが増えてしまうというケースは多いのです。
各コンテンツのテーマやページの関連性を理解した構成にするなるようにディレクターを配置することは重要です。
コンテンツ管理を徹底する
常に一定の品質を保つことの出来るストックコンテンツは、しっかりとSEOを意識して施策していくことで評価を得やすく、Google検索での順位の改善や流入、顧客の獲得に役立つでしょう。
逆にもっとライトな内容のもの、時期やトレンドに合わせたフローコンテンツは短期的な流入が見込めるメリットがありますが、時間が経過すると情報が古くなるというデメリットがあります。
古くなったフローコンテンツは当然低品質なコンテンツとして判断されるようになりますが、フローコンテンツの特徴から量産されてしまうためストックコンテンツとのバランスを取らないとWebサイト全体の品質が下がり、マイナスな評価を受ける要素になってしまいます。
そのため、SEOの観点からストックコンテンツとフローコンテンツは別にして管理しましょう。
フローコンテンツではSNS等からの集客と考え、noindex処理するという方法もあります。
まとめ
低品質コンテンツはSEO内部対策の一つとしてサイトから減らす、削除することはとても重要です。
しかし知らずに品質の低いコンテンツを量産してしまっているケースは少なくないため、アナリティクスやサーチコンソール等、Googleが無料で提供しているツールを使って定期的に確認し、適切に対処することが重要です。
社内にリソースが足りずこのような施策の実施が難しい場合は、SEO対策専門会社である弊社にぜひご相談ください。
低品質コンテンツを見つけるだけでなく、SEOを意識したブログやコラムを作成したり、定期的に更新をしてコンテンツの品質向上を図ります。
また、無料のサイト診断サービスも提供していますので、ぜひお気軽にお問合せいただければと思います。
清水 康次
最新記事 by 清水 康次 (全て見る)
- SEO対策の外注は高すぎる?費用の内訳とコストを抑えるポイント - 2024年10月4日
- SEOを外注するメリットと注意点:成果を出すための正しい選び方を徹底解説! - 2024年9月17日
- ホームページがインデックスされない理由とその解決方法 - 2024年9月10日