重複コンテンツとは、ほかのコンテンツと完全に同じか、非常によく似たもののことを指します。ドメイン内に存在する場合もあれば、複数ドメインにまたがっていることもあります。ドメイン内の重複コンテンツには、意図せずして発生してしまうものもあります。Googleがオリジナルなコンテンツを求めていることもあって、重複コンテンツが発生してしまった場合にペナルティが存在するかどうか、気になる方もいるでしょう。
そこで今回は、重複コンテンツとペナルティの関係をはじめ、重複コンテンツに該当するケースや対処法などを解説します。
目次
重複コンテンツでペナルティは発生するのか?
まずは重複コンテンツの定義と、ペナルティの有無についてご説明します。
重複コンテンツとは?
Googleでは、重複コンテンツについて以下のように記載しています。
一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。
重複コンテンツの多くは、偽装などの目的で意図的に作られたものではありません。サイト内の重複コンテンツの中には、ページの生成方法やパラメータの設定などによって自動的に発生してしまうものもあります。
ペナルティは発生しないが、対策したほうが良い
重複コンテンツによってペナルティになることはありません。検索順位が落ちるとペナルティと認識しがちですが、正しくはマニュアル・自動アクションと呼ばれるGoogleによるスパムへの対策がペナルティです。本来は悪質なスパム行為に対して与えられるものであって、Googleは重複コンテンツをスパム行為とはとらえていません。
Googleは自社のブログでも重複コンテンツによるペナルティを否定しています。
Let’s put this to bed once and for all, folks: There’s no such thing as a “duplicate content penalty.” At least, not in the way most people mean when they say that.
Webmasterでは重複コンテンツによる影響を公開しています。
Google では関係するサイトのインデックス登録とランキングに対して適切な調整を行います。その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。
引用:重複するコンテンツ Search Console ヘルプ
ペナルティが発生しないとはいえ、ユーザーの混乱を避けるため、またGoogleに正規のURLを認識してもらうためにも、対策はしたほうが良いでしょう。
重複コンテンツが多いとどうなるのか?
Webサイトにおいてユーザーが不利益を被るような行為を、Googleは排除したいと考えています。そのため、重複コンテンツが多いと、サイトはさまざまな影響を受けます。過剰な重複コンテンツがどのような影響を及ぼすのか、見ていきましょう。
検索結果に表示されにくくなる
同じ内容の検索結果がいくつも表示されないようにするため、重複コンテンツは検索結果に表示されにくくなります。何度も同じ内容のページを見ることは、ユーザーにとって不利益だからです。
重複コンテンツがある場合、Googleが一つのURLを選び、インデックスに登録します。重複コンテンツは検索結果に表示されないようにインデックスから排除されたり、順位上昇が鈍化したりします。そのため、ペナルティによる順位下降と認識されていた方もいるかもしれません。
重複コンテンツがサイト内で発生している場合、同じコンテンツをGoogleBotがクロールすることになります。よって、クロールバジェットにより本来クロールしてほしいページまでたどり着かないリスクがあります。
サイト全体の評価低下につながる可能性もある
サイト内に含まれる重複コンテンツの割合が多いと、サイト全体の評価低下につながる可能性があります。2011年に実施されたパンダアップデートにより、「他サイトからのコピーで構成されているようなサイト」の掲載順位が下がるようになったからです。
重複コンテンツが異なるURLでインデックスされた場合、本来正規URLのページで獲得したい評価(PageRank)が複数に分散される可能性があります。Googleは「良質なサイトを作るためのアドバイス」という記事の「良質なサイトとは?」の項目で、以下の内容を紹介しています。
サイト内に同一または類似のトピックについて、キーワードがわずかに異なるだけの類似の記事や完全に重複する記事が存在しないか?
重複コンテンツに該当するケース
重複コンテンツに該当するケースには、さまざまな場合があります。PCサイトとモバイルサイトの両方を持っていると、悪意がなくても重複コンテンツとみなされる場合がありますので、自社サイトに該当する例がないかどうかを注意して見ていきましょう。
該当するケースの例
今回は、具体的に5つの例をご紹介します。
1.一つのページのURLを統一せずに、複数の端末からのアクセスに対応している
https://example.com/
https://m.example.com/
https://amp.example.com/
https://www.example.com/index.html
URLの先頭や末尾が異なると、検索エンジンでは全く別のページとして認識されるため、重複を疑われるおそれがあります。
2.他サイトの文章をコピーしている
他サイトの文章を盗用し、語句を類義語に置き換えるなどの修正を加えただけの場合も、重複コンテンツに当てはまります。大手通販サイトなどの商品説明文をコピーして、自社サイトの文章に挿入するケースも該当します。
3.PCサイトとモバイルサイトの両方のページを持つ
両方に対応したサイトが存在し、モバイルサイトからPCサイトへインデックスの統合処理がなされていない場合も、重複コンテンツと判断されることがあります。
4.他サイトにコンテンツを提供している
他サイトにコンテンツを提供しているケースでは、コンテンツ元である自社サイトがオリジナルとして評価されるのが一般的です。ところが、検索エンジンはプログラムに沿って判断するため、悪意がなくても重複コンテンツと判断される場合があります。ほとんど同じ内容のページがサイトに複数含まれる場合は、優先してほしいURLをGoogleに指定する必要があります。
5.固有のコンテンツがないページ
サイト内のページに固有のコンテンツがない、または少ないページが大量に生成されている場合、ページ同士の重複率は自然と高くなります。固有のコンテンツがない場合はユーザーにとって役立つ情報ではないことから、低評価を受け、さらに重複コンテンツとして評価が下がる可能性があります。
重複コンテンツに対処する方法
ここでは、重複コンテンツの具体的な回避策について確認しましょう。自社サイトの重複コンテンツを解消したい場合の方法と、万が一盗用されたときの対処法について、それぞれ解説します。
重複コンテンツを回避するには?
一つのページに複数のURLでアクセス可能になっていたり、異なるページのコンテンツが類似していたりする場合は、どのURLが正式なものかをGoogleに示す必要があります。Googleは以下の対策方法を示しています。
一貫性を保つ
代表のURLを一つに定めるなど、内部リンクの一貫性を保つようにしましょう。
例:以下の中から代表を一つに絞る
http://www.example.com/page/
http://www.example.com/page
http://www.example.com/page/index.html
「一貫性を保つ」とは、正規URLを判断するということなので、施策の前提条件でもあります。そこで301リダイレクトや、noindexを付与し、インデックスを統合します。
301リダイレクトによる削除
類似したコンテンツが別のURLで存在し、ユーザーがそのページにとどまる必要がない場合は、301リダイレクトを使用します。301リダイレクトは、ユーザーを一つのページからリダイレクト先へ移動させるための命令です。
たとえば、サイトのページが次のような複数の方法でアクセス可能な状態だとしましょう。
https://example.com/home
https://home.example.com
https://www.example.com上記のURLのいずれか1つを正規URLとして選び、301リダイレクトを使って、他のURLからのトラフィックを、この優先的に使用するURLに送信します。サーバー側での301リダイレクトは、ユーザーや検索エンジンを正しいページに確実に誘導するのに最適な方法です。ステータスコード301は、ページが別の場所に完全に転移したことを意味します。
引用:重複したURLを統合する Search Console ヘルプ
使用するドメインを設定する
Google Search Consoleを使用し、どのバージョンのドメインを正規ページとするかをGoogleに伝えることができます。
Search ConsoleのWebサイトで、該当するサイトをクリックします。設定アイコンをクリックし、「サイトの設定」を選択したら、「使用するドメイン」で希望のオプションを選択します。
rel=”canonical “リンクタグを使用する
他サイトにコンテンツを提供していたり、PCサイトとモバイル用サイトが存在したりする場合には、rel=”canonical”リンクタグを使用して評価が分散されるのを防止します。ヘッダーに<link>タグを使用すると、そのページが別のページの重複であることがわかります。ただし、canonicalは絶対的な命令ではないため、統合されないケースも存在します。
方法
1.重複したすべてのページをrel=”canonical”リンク要素でマークします。
rel=”canonical”属性を指定した<link>要素を、重複ページの<head>セクションに追加して、正規ページを指すようにします。この例では次のようになります。
<link rel=”canonical” href=”https://example.com/dresses/green-dresses” />2.正規ページにモバイル向けの類似バージョンがある場合は、rel=”alternate”リンクを追加して、モバイル版のページを指すようにします。
<link rel=”alternate” media=”only screen and (max-width: 640px)”
href=”http://m.example.com/dresses/green-dresses”>3.該当のページに合わせて適切なhreflangや他のリダイレクトを追加します。“
引用:重複したURLを統合する Search Console ヘルプ
そしてalternateが向けられているモバイルページには、PCページへcanonicalを向けることで、同一コンテンツとしてGoogleへ伝えます。ここで重要なのは、rel=”alternate “とrel=”canonical “は1対1であることです。
著作権侵害による削除を依頼するには?
もし、自社サイトのコンテンツが丸ごと外部の他サイトにコピーされている場合は、Google Search Consoleで削除依頼を送信することが可能です。申し立てが受理されると、コピーコンテンツは削除またはアクセス不可能になったり、登録ユーザーへのサービスが停止されたりします。
画像出典:著作権侵害による削除 Google Search Console
重複コンテンツのインデックス排除
重複しているコンテンツで、検索エンジンに表示される必要性がないページの場合は、重複ページの<head>セクションに以下のタグを追加し、Googleのインデックスへの登録自体を排除することも可能です。
<meta name="robots" content="noindex">
meta noindex, canonicalと301リダイレクトの特徴は以下の通りです。
重複コンテンツをチェックする方法
検索結果に表示されにくくなったり、サイト全体の評価が下がったりする前に、重複コンテンツがないかをチェックする方法があります。ここでは、自社サイト内における重複コンテンツの確認方法と、他社サイトにおける重複コンテンツのチェックの仕方をご紹介します。
自社サイト内での重複コンテンツをチェック
自社サイト内での重複コンテンツの有無は、Google Search Consoleを活用することで確認できます。「検索での見え方」→「HTMLの改善」をクリックし、タイトルタグの重複と重複するメタデータが存在しないかどうかを確認します。該当するページがある場合は、そのページ内でコンテンツの重複が発生しているかどうかも確認しましょう。また、クローラーの巡回によって修正などがSearch Consoleに反映されていない可能性があるため、重複しているページがcanonicalやnoindexでインデックス制御されているかもチェックします。
他社サイトと重複しているコンテンツをチェック
検索エンジンで自社コンテンツの内容の一部を検索する
「 site: 」でドメインを入力し、重複対象となる文言やキーワードを一緒に検索してみてください。複数のページがヒットする場合は、対象ページの内容を確認します。検索結果に下記の内容が表示される場合は、「ここから再検索してください」をクリックすると類似ページが表示されるので、そこから重複コンテンツを検出することも可能です。
ツールを使用する
コピーチェックツールを使用すると、Web上にある文章と自社サイトの記事を比較し、重複がないかどうかを調べることができます。無料か有料かはツールによって異なりますが、類似している割合(%)や連続して重複する文字の数、重複している箇所などを検出できるのが一般的です。
重複コンテンツは早めの対策を
重複コンテンツによるペナルティの発生はありません。しかし、評価が下がることはあるので301リダイレクトによる削除や、rel=”canonical “リンクタグを使用するなど、対策したほうが良いでしょう。また、悪意がなくても重複コンテンツとみなされる場合はあるので、注意が必要です。もし、自サイトのコンテンツを丸々コピーされたときはGoogle Search Console を使って、削除を依頼しましょう。
今回ご紹介した回避策は一例に過ぎず、技術的な対応が求められる場合もあります。検索順位に影響する可能性があり、放置できない問題ですので、なるべく早く対処するように心がけましょう。