ハッキングされたサイトは関係の無いページをURL削除とrobots.txtでブロックする
目次
ハッキングされると関係の無いページが大量に生成される
ホームページのログインパスワードなどを単純なものにしていたり、プラグインを最新のバージョンに更新していないと、ハッキングされることがあります。ハッキングされると本来のサイトに記載されている情報では無くなり、全く関係の無いページが大量に生成されます。
すぐに発見出来て、修復出来れば被害はそんなに大きくなりませんが、復旧に手間取ると、その間にGoogleがハッキングされたページを大量にインデックスしてしまいます。Googleはハッキングされたページの情報でサイトを評価し始めますので、本来のサイトの評価とは全く違った低品質のサイトと評価されてしまいます。
復旧してもハッキングされた情報はGoogleのデータベースに長く残る
サイトを復旧して、サイトを完全にクリーンな状態にしても、復旧までの間にGoogleにインデックスされた情報は、長期間Googleのデータベースに残り続けます。この情報が残っている限りGoogleは低品質なサイトと評価します。サイト本来の評価を取り戻すにはかなりの長期間を要することになります。ハッキングされる以前に獲得していたアクセスにはなかなか戻らず、悩ましい時間が続くことになってしまいます。
Search consoleのURL削除から生成されたページを削除する
Googleのデータベースに残り続ける低品質なページはSearch consoleのURL削除から削除します。
Search consoleの削除をクリックして、「新しいリクエスト」をクリックします。
このプレフィックスで始まる URL をすべて削除を選んで、ディレクトリ毎削除します。この URL のみを削除にすると、全てのURLを入れないといけないので、ディレクトリ毎削除すれば早く作業が終わります。
URL削除を行った結果
1月の末頃にハッキングされて、60ページ程しかなかったサイトが2,822ページまで増えました。4月15日にURL削除を行い、18日には478ページまで減りました。まだまだ低品質なページが残っていますが、急激にページは減っているのでこのまま待てば正しい評価がされると思います。
サイトがハッキングされると言うのはそんなに頻繁に起きることではありませんが、万一ハッキングされた場合には、不復旧後にURL削除を行うことをお勧めします。
URL削除はあくまでも検索結果に表示しないようにするもので、Googleのデータベースから削除される訳では無いので、あくまでも応急処置です。
クロール済み-インデックス未登録にも大量のページが残る
ハッキングされたサイトは自動生成されたページが大量に作成されるのでインデックスされるページもありますが、クロール済み-インデックス未登録にも大量のページが表示されます。クロール済み-インデックス未登録はGoogleが低品質と判断してインデックスしなかったページなので、ここに大量のページがあるとサイト全体が低品質と判断されるのでクロール済み-インデックス未登録を放置していると長期間に渡ってハッキングの悪影響が継続します。
自動生成されたページをrobots.txtでブロックする
クロール済み-インデックス未登録に表示されている自動生成されたページはサイトがクリーンになれば長期間を掛けてインデックス未登録からは消えて行きますが、完全に無くなりGoogleから適正な評価が行われるまでにはかなりの時間を要します。
Googleからの評価を少しでも早く正常化したい場合は、robots.txtでブロックして、自動生成されたページを無いことにするのが良い方法です。
robots.txtでブロックした結果
11月の下旬にrobots.txtを更新してアップロードして、それまで全く減らなかったページが減少に転じました。大量に生成されたページを全て記載してアップロードするのは大変ですが、確実に効果が出ますので、ハッキングされて大量のページがSearch consoleのページに記載されている場合はrobots.txtでブロックして、Googleの低品質との認識を少しでも早く解消することが重要です。
robots.txtでDisallowにすることで、当該ページをGooglebotがクロールしなくなりますので、「クロール済み-インデックス未登録」は減少して行きますが、最終的には、当該ページが「見つかりませんでした」になってサイト内に存在していないことを認識してもらう必要があります。
ハッキングの痕跡を完全に除去できたらrobots.txtのブロックは解除する
ハッキングの痕跡が残っているとマカフィーなどでチェックすると不審なサイトと判断されます。
このような時点ではrobots.txtでブロックすることは有効ですが、痕跡を完全に除去できたら、robots.txtでブロックしていると、生成されたページが無くなったことをGoogleが認識するのが遅れます。
なので、ハッキングの痕跡が完全に削除出来ればrobots.txtのブロックは解除して、クリーンになったサイトをクロールしてもらいましょう。
Googleがハッキングによって生成されたページが完全に無くなってクリーンな状態になったことを認識することが重要ですが、ハッキングによって生成されたページは元々低品質なので、クロール頻度も低いので、Googleが完全にクリーンになったと評価するまでにはかなりの時間を要します。
何度もハッキングされるとユーザーに見せるのは危険なサイトと判断される
一度だけのハッキングであれば、完全にクリーンにして再評価されれば評価はかなりの確率で戻ると思いますが、何度もハッキングされるサイトは、サイトの運営者が管理が出来ていないと判断され、そのサイトの情報をユーザーに見せることは、ユーザーを危険に晒す可能性があるので、検索結果には表示さないようになってしまいます。
サイトは絶対にハッキングされないように常に最新の状態を保つようにしましょう。
清水 康次
最新記事 by 清水 康次 (全て見る)
- 指名検索とSEO:効果的な施策で上位表示を目指す方法 - 2025年1月16日
- SEO対策の注意点と効果的な施策:上位表示を目指すためのガイド - 2025年1月15日
- 中小企業がSEOで成功するためのポイント - 2025年1月8日