サイト内の重複コンテンツを見分ける方法


低品質なサイトと判断される重複コンテンツ

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。とSearch consoleのヘルプの中に記載されています。

本のような印刷物の場合は、同じ本が大量に印刷されて、重複したコンテンツが大量に市場に出回りますが、ネット上のコンテンツは同じ情報が複数存在する意味は無く、重複コンテンツはオリジナルのみが検索結果に表示され、コピーコンテンツは検索結果から除外されます。重複コンテンツは検索エンジンにとっては邪魔な存在でしかありません。重複したコンテンツを検索結果の上位に並べるとユーザーの利便性が低下するだけです。サイト内で重複コンテンツがある場合は、リダイレクト設定やどちらかのページをnoindexにするか、canonicalタグでリンク要素をマークして、正規ページを1つになるように、Googleに伝えるようにしましょう。

重複コンテンツはGooglebotがクロールしても、インデックス除外されるので、重複しているどちらかのページはGoogle検索に表示されません。

同一サイト内に大量に重複コンテンツがあると、Googleから低品質なサイトと判断され、検索順位を下げられたり、最悪の場合圏外に飛ばされる可能性があり、上位表示の妨げになります。大量のコピーコンテンツを有するサイトはペナルティが課せられるよう、すでにアルゴリズムが調整されています。

Googleはサイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の根拠とはなりません。と公開していますが、偽装では無くても、大量に重複コンテンツがあると、ランキングはかなり落ちます。

重複コンテンツが大量にあるとSEO上も大きなマイナス要因となりますので、定期的にチェックしましょう。

titleやdescriptionの重複はSearch consoleのHTMLの改善ページに表示されるので、Googleから指摘されているページのtitleやdescriptionは修正しましょう。

Search consoleでも分からないのは、ページ本文の重複です。

こうした重複コンテンツはサイトを長期間運営していると、悪意がなくても作成される場合があります。特に複数の人が担当してブログを記載していると、意図しなくても、内容が重複することがあるので注意しましょう。

こうした重複コンテンツは主にフッターに文章で記載されるケースが多くあります。フッターに記載されたテキストは全ページに共通して表示され、本文のテキストが少ないと、かなり高い確率で重複コンテンツになります。

ユーザーに同じ内容のページを見せることは、価値のあることではありません。出来る限りオリジナルな記事を掲載するように対処方法を考えるのはSEO上、重要なことです。

ホームページの情報はそれぞれ異なるオリジナルのコンテンツを求められます。他のサイトからの無断コピーや同じサイト内のコピーなどが掲載されないようにしましょう。

重複コンテンツの例

重複コンテンツが大量に発生していた例をご紹介すると、会員限定ページがあるサイトで、非ログインページの表示(閲覧するには、会員登録が必要です)が全ての会員限定商品のページのURLで表示されたものや、多言語対応しているページで、多言語用のページを選択しても、正規化したURLで表示されて、重複となっていたものや、パラメータで生成した大量の重複が発生していたサイトなどがありました。どの重複もサイト内部の設定によるもので、WEB制作側の問題でした。ホームページ制作会社は何がランキングに悪影響が出るのかを知らずにサイトを作成していることが多く、納品されたホームページのアクセスが全く上がらないことは良くあります。このような重複は専門的な知識が無いと見つけにくいかもしれませんが、運用を開始してから、アクセスが増えないことを問題にして、調査を開始して、問題を特定して、改善するのは成果を上げるまでの時間を大きく無駄にしてしまいます。出来れば、納品前の検収段階で発見して欲しいものです。

ECサイトなど、商品データをデータベースで管理している場合、パラメータで大量に重複が発生する場合があります。パラメータによる重複を避けるように設定が出来る場合は適切に設定しましょう。もしも無理な場合は、Search consoleでパラメータをクロールしないに設定するなど対応しましょう。

Googleが重複コンテンツと判断しているか見極める方法

サイト内に大量に重複コンテンツがあるか見極める方法として、&filter=0のコマンドがあります。

トップページのtitleでまず検索します。

検索結果には、自分のドメインのページが数ページ表示されるはずです。これは、同じドメインのページを大量に検索結果に表示しないようにフィルターを掛けているからです。

このフィルターを外すのが以下のコマンド、&filter=0です。

検索結果のURLの最後に続けて&filter=0を記載して再度検索を行うと、同じドメインのページが大量に出てくれば重複や類似コンテンツが大量にある可能性があります。

この検索でも表示されるページが数ページしか無い場合は、大量の重複ページや類似ページは無いと考えて良いと思います。

また、自分で重複かどうか疑わしいと思っているページがあれば、site:URL キーワード でそのページが検索結果に表示されず、次に、site:URL キーワード で検索した結果のURLの最後に&filter=0を追加して再度検索すると、そのページが表示されれば、重複ページとGoogleが判断していることになります。

重複とGoogleが判断しているページがある場合は、重複していると思われるテキストを削除し、オリジナルのコンテンツの追加をして、重複を回避するようにしましょう。

Saerch consoleで重複を表示してくれるようになりました

2019年に新しいSearch consoleの提供が開始され、Search consoleを使用していれば、重複コンテンツは簡単に見つけることが可能になりとても役立つ機能です。新しいSearch consoleのカバレッジで除外をクリックすると、「重複しています」と記載されて、重複に該当している対象ページ数が確認出来ます。「重複しています」のメッセージをクリックすると、重複しているURLの一覧が表示されます。どれかURLをクリックして、右側に表示される「URLを検査」をクリックすると、どのページと重複しているのか表示されますので、チェックしましょう。Search consoleで「重複しています」と指摘されるのは完全なコピーコンテンツです。「重複しています」と認識されているページはGoogleのデータベースにはインデックスされず、アクセスを増やす効果も無いので修正が必要です。
システムの設定の問題で重複が発生していることが多いので、修正しましょう。

大量の重複コンテンツは著しく評価が落ちて、ペナルティを受けるので、最優先で改善する必要があります。canonicalで正規化を指定することも有効です。

Search consoleでは、外部のサイトをコピーしたり、他のサイトをパクったような重複を表示してくれませんが、ページに記載されているセンテンスを検索窓に入れて検索した時に、自分のサイトが表示されない場合は、重複コンテンツとみなされていると考えて間違いありません。

Search consoleは新しくなってからサイトの問題をウェブマスターに知らせてくれるとても便利なツールになりました。WEB集客を目指す場合は是非登録して有効活用しましょう。

ドメイン移転する場合は301リダイレクトを設定しましょう

例えば、無料ブログから独自トメインに移転する場合のように、ドメイン移転を行ってサイト移転をする際は、移転元のドメインに301リダイレクトを設定して、重複を避けて、リンクの評価も引き継ぐようにしましょう。移転元と移転先に同じコンテンツが存在すると、重複コンテンツになります。301リダイレクトを設定せずに、移転元から移転先にリンクを設置すると、不自然なリンクになって、移転先のサイトがペナルティを受けてしまいます。
301リダイレクトの記載は.htaccessファイルに下記の記載をしてアップロードします。
Redirect permanent / http://newdomain.jp/
この記載をすれば、移転元へアクセスすると自動的に移転先へ転送されます。

スマホページをレスポンシブ対応していない場合も重複コンテンツになります

モバイル対応は今では必須ですが、例えばモバイル対応をレスポンシブにしていないと、PC向けのページとスマホ向けのWEBサイトが複数存在することになります。この場合も重複コンテンツになります。もしも、両方のページが存在しないといけない場合は、PC向けのページをnoindexにしましょう。デバイスごとにページを作っている場合はモバイル向けのページのみindexさせるようにしましょう。

SEO無料サイト診断