重複コンテンツとは?SEOへの影響とチェック方法・8つの内部対策

重複コンテンツとは、完全に同じ、あるいは類似したコンテンツが、異なるURLで複数存在することだ。

こう聞くと盗用によるコピーコンテンツを連想する人が多いが、SEO用語としての「重複コンテンツ」は、かならずしもそうではない。

やむを得ず重複コンテンツが生成されるケースが多く、サイト運営者であれば誰しも気に掛けるべきトピックである。

ただし、「重複コンテンツがあるとGoogleからペナルティを受ける」というのもよくある誤解だ。

枝葉(戦術レベル)では気にしたほうがよいが、根幹(大きな戦略レベル)で重大な損害が発生するものではない、というニュアンスをつかんでほしい。

本記事では、そんな誤解の多い「重複コンテンツ」を、基礎知識から実践すべき内部対策まで解説する。

ebook
ebook

1. 重複コンテンツとは?基本の知識

最初に重複コンテンツとは何か、基本の知識から見ていこう。

1-1. 重複コンテンツとは異なる複数のURLに同じ情報があること

重複コンテンツとは、インターネット上で複数の場所に同じ情報が表示されているコンテンツのことだ。

違うURLで同じ情報

検索エンジンのクローラー(Googlebotなど)は、同じ情報が複数のURLで公開されている場合に、重複コンテンツとみなす。

たとえば、以下のようにまったく同じコンテンツが、複数のURLに表示されているケースが挙げられる。

▼ まったく同じコンテンツの例

全く同じコンテンツただし、完全に同じではなくても、“ほぼ同じ、非常に似ている”場合でも、重複コンテンツとみなされる。

▼ 非常によく似たコンテンツの例

よく似たコンテンツ気になるのは、「実際にどういう基準で重複コンテンツとみなされるのか?」だろう。

ページ全体なのか、あるいは数行のテキストが重複しただけでも、重複コンテンツになるのか。続いてGoogleの基準を紹介しよう。

1-2. Googleにおける重複コンテンツの基準

Googleは重複コンテンツについて、以下のとおり述べている。

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、同じ言語の他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。

出典:Google Developers

ポイントをまとめると、以下のとおりとなる。

  • 自サイトのページ同士でも、外部サイトのページとの間でも発生する
  • 完全に同じであるか、非常によく似たコンテンツ
  • ページ単位ではなくブロック単位で判定される

1-3. 多くの重複コンテンツは悪意なしに生成される

もうひとつ押さえておきたいのは、Googleが「重複コンテンツ」という用語を使うとき、悪意なく生成された重複コンテンツを前提としていることが多い、という点だ。

以下はGoogle公式サイトからの引用である。

多くの場合、偽装を意図したものではありません。悪意のない重複コンテンツの例には、以下のものがあります。

・通常ページとモバイル デバイス用の簡易ページの両方を生成するディスカッション フォーラム

・複数の異なる URL で表示またはリンクされるオンライン ショップの商品

・ウェブページの印刷用バージョン

出典:Google Developers

類似ページまたは重複ページを保持する理由

出典:Google Developers

冒頭でも触れたことだが、日本語では「重複コンテンツ」という語感から、「著作権侵害のコピーコンテンツ、悪意ある盗用コンテンツ」を連想する方が多い。

しかし、SEO用語としての重複コンテンツ(Duplicate content)のニュアンスは異なることを覚えておこう。

重複コンテンツがSEOに与える影響については、次章で詳しく解説する。


2. 重複コンテンツがSEOに与える影響

重複コンテンツとは何か理解できたら、SEOとの関係性を見ていこう。

2-1. 重複コンテンツによるペナルティはない(悪意がなければ)

「重複コンテンツを掲載すると、ペナルティを受けて、サイトが圏外に飛んでしまう」

といった勘違いをしている方がいるので重要なポイントから先にお伝えすると、悪意のない重複コンテンツの掲載に対してGoogleはペナルティを科していない。

以下はGoogleの公式サイトからの引用である。

サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の根拠とはなりません。

出典:Google Developers

悪意がある=検索エンジンに対して

悪意がある重複コンテンツにペナルティが科せられるケースはあるが、人間の倫理観での「悪意」とは若干異なり、「検索エンジンに対しての悪意」というニュアンスが強い。

先ほど引用文に、

“偽装や検索エンジンの結果を操作する意図がうかがえない限り”

というフレーズがあったとおり、SEO用語としての悪意ある重複コンテンツが指すのは、

「検索エンジンの結果を操作して、より多くのトラフィックを獲得しようという悪意」

である。

こういった重複コンテンツは「検索エンジンスパム」として知られている。

以上をまとめると、私たちが通常のサイト運営をしていて発生する重複コンテンツに、ペナルティが科せられることはない。

2-2. コンテンツの25〜30%は重複しており気にする必要はない

……と聞いてもまだ不安な方へ補足しよう。

Googleのマット・カッツは、2013年の動画で、

「重複コンテンツが、スパムなどの悪意あるものでなければ、気にする必要はない」

と明言している。

彼によれば、Web上のコンテンツの25〜30%は重複しているという。つまり、重複コンテンツが存在することは普通のこと(正常)という認識だ。

よって「重複コンテンツがあってもペナルティを受けることはない、心配する必要はない」という主旨を明確に述べている。

またGoogleのジョン・ミューラーも、

「多少の重複コンテンツがあっても、それはたいした問題ではない。複数のページに共有されたコンテンツがあることは、ある意味正常なことである」

という主旨の発言をしている。

上記以外のGoogleの発信も含めて、Googleサイドが言いたいことを要約(意訳)してみると、こんな感じになる。

「重複コンテンツがあるのは普通のことだから、サイトごとにペナルティを科すような無駄なことを、Googleはしていないよ。そんなことは気にしなくていい。

重複コンテンツがどれだけあろうが、Googleは検索ユーザーにとってベストなページを選び出し、検索結果に表示させるだけだ」

2-3. ただし重複コンテンツにはネガティブな側面もある

私たち自身も、Googleの考えと同じように、必要以上に重複コンテンツを気にする必要はないと考えている。

重複する/しないにかかわらず、そのページが果たすべき目的・満たすべきユーザーニーズに向かって、最善のコンテンツづくりに突き進むのみだ。その結果を、Googleは正しく解釈し、評価してくれると信じる。

しかし、

「重複コンテンツを気にするのはゼロにして、完全に忘れてよいか?」

といえば、それは極端すぎる。

ペナルティのような致命的なダメージはないが、ネガティブな側面もあるからだ。以下3つのポイントを理解しよう。

1:検索結果が自動フィルタリングされる

前述のマット・カッツは、

「Googleはすべての重複コンテンツを取得し、それらをクラスターにグループ化する。

次にGoogleは、そのクラスターで最高の検索結果を表示する」

と述べている。

Googleの公式サイトでの説明を見てみよう。

検索結果の自動フィルタリング

可能な限り最適な検索結果を提供するために、Googleは2つの手法を使用して、一般的に好ましくないとされる検索結果を自動的にフィルタリングしています。

・重複コンテンツ:複数のページに同じ情報が含まれている場合、その中で最も関連性の高いページのみが検索結果に含まれます。

・ホストクラウディング:同じサイトからの検索結果が多数ある場合、Googleはそのサイトからのすべての結果を表示しないか、そうでない場合よりもランキングが低い結果を表示する場合があります。

出典:Google Developers

重複コンテンツが、検索結果に数多く表示されたらユーザーエクスペリエンスを損なうので、Googleは重複コンテンツのうち1つを「正規版(正規URL)」として認定し、正規版のみ表示させようとする。

正規版と認定されなかったURLは、検索結果から表示されなくなったり、順位が低くなったりする。

これは、キーワードのカニバリゼーション(​​共食い現象)とも関連するトピックである。詳しくは「あなたの知らないキーワードカニバリゼーションの本質と最短の解決策」も確認してほしい。

2:被リンク評価が分散する

Googleは「PageRank」と呼ばれる、被リンクの量と質によってページを評価するアルゴリズムを持っている。

簡単にいえば、質の高い被リンクを多く持っているほど、Googleに高く評価される。

しかし、ユーザーから見たとき、同じコンテンツで複数のURLのページが存在すると、ユーザーがリンクするURLは分散してしまう。

被リンクが分散するPageRankの評価が分散してしまい、検索順位のアップに苦労することになる。

重複コンテンツがなければ、被リンクをひとつのページへ統合でき、効率的に評価を上げることが可能だ。被リンクがひとつのページに統合

※被リンクについては別記事「被リンクとは?SEO初心者向けの基本と調べ方・増やす獲得方法の極意」にて解説しているので、詳しく知りたい方は参照してほしい。

3:ユーザーエクスペリエンスが損なわれる

最後に、Webサイトのユーザーエクスペリエンス(UX、ユーザー体験)の問題がある。

サイトの読者になったつもりで、想像してみてほしい。

Googleでキーワード検索からあなたのWebサイトを見つけ、最初のページにたどりつき、

「これは面白い記事だ」

と興味を持つ。

もう1ページ読んでみようとクリックする。すると、似たような記事ばかり出てくる。

「あれ、さっき読んだ記事と、同じURLをクリックしてしまったかな」

と混乱しつつ、再びクリックすると、また似たような記事だ。フラストレーションが溜まるだろう。

重複コンテンツの多いサイトは、初回アクセスで去る“一見さん”ばかりで、リピーターの“愛読者”が増えない。ユーザー満足度が低いからだ。

ここまでの話をまとめると、以下のとおりだ。

▼ まとめ

  • 重複コンテンツを必要以上に心配することはない。悪意のない重複コンテンツなら、Googleからペナルティを受けることはない。

  • 重複コンテンツを気にしすぎるよりも、ページの目的・ユーザーニーズを満たすコンテンツづくりに注力したほうがよい。

  • ただし、完全に重複コンテンツを忘れてよいかといえば、それは極端である。ネガティブな側面もあることを知っておこう。

では、重複コンテンツに対して、私たちはどんな態度で臨むべきだろうか(何を・どう対処すれば十分だろうか)。続けて読み進めてほしい。


3. 重複コンテンツのチェック方法

ここからは重複コンテンツ対策について、具体的に解説していきたい。まずは現状把握するために、重複コンテンツのチェック方法を紹介する。

3-1. 自動フィルタリングを無効にしてGoogle検索する

前述のとおり、Googleは重複コンテンツを自動フィルタリングで除外している。

自サイトで除外されているコンテンツがないか確認するために、自動フィルタリングを無効にしてGoogle検索をしてみよう。

「デフォルトの設定ではヒットしないのに、自動フィルタリングを無効にするとヒットするページは、重複コンテンツとみなされている」

と推測できるためだ。

自動フィルタリングを無効にする方法は3つある。

1:検索結果の最後尾から再検索する

1つめは、検索結果の最後尾から再検索する方法だ。

「上の**件と似たページは除外されています。検索結果をすべて表示するには…」という表示を、見たことがあるだろう。

検索結果の最後尾から再検索ここから再検索することで、除外されたページが表示される。

2:「&filter=0」のパラメータをURLに追加する

2つめは、「&filter=0」のパラメータをURLに追加する方法だ。

パラメータを最後に追加する検索結果のURLの末尾に「&filter=0」を追加すると、前述の検索結果の最後尾から再検索したときと同じ挙動が得られる。

参考:Google Developers

3:検索演算子でサイトを絞り込む

検索演算子の「site:○○」でサイトを絞り込んで検索する場合には、自動フィルタリングはかからないので、除外されたページを見つけやすい。

特定サイト※「検索演算子って何?」という方は、Googleの「ウェブ検索の精度を高める」を確認しよう。以下が該当する。

特定のサイトを検索する

出典:Google

3-2. Search Consoleのカバレッジを確認する

Search Console(サーチコンソール)のカバレッジのレポートを見ることも、重複コンテンツを発見するのに役立つ。

※「サーチコンソールって何?」という方はGoogleの「Search Console の概要」にて確認してほしい。

Search Consoleの管理画面から[カバレッジ]をクリックすると表示できる。

Google Search Console

重複がレポートされていることがあるので、確認してみよう。レポートをクリックすると、該当URLまで確認できる。

Search Consoleと先ほどのGoogle検索での確認の違いは、Search Consoleではインデックスから除外された重複URLを確認できる点だ。

重複コンテンツが原因でインデックス登録がされないケースがあり、インデックス登録されないと、自動フィルタリングを無効にしても検索結果に表示されない。

※インデックスについて詳しくは別記事の「seo インデックス」にて詳説している。


4. 外部サイトによる悪意の重複コンテンツが見つかったときの対処法

重複コンテンツについてチェックしていたら、

「自サイトではなく外部サイトによって、自サイトのコンテンツが複製されている」

と発見することがある。

重複コンテンツの内部対策について解説する前に、「外部サイトに対する対処法」をお伝えしておく。

4-1. 海外のスパムサイトは放置でよい

多いのが、海外のスクレイピングサイト(他サイトのデータを自動収集し、自サイトのコンテンツとして公開するスパムサイト)の被害だ。

前述のとおり、このような悪意のあるサイトはGoogleによるペナルティを受け、Googleの検索結果から除外される。放置で問題ない。

海外のスパムサイトは抗議したところで対応されることはまずない、という理由もある。

4-2.国内のドメインパワーの強いサイトに盗用されたら

問題は、自サイトよりもドメインパワーが強いサイトにコンテンツを盗用され、自サイトよりも検索上位に当該ページが表示されている場合だ。

人間の倫理観的には悪意だが、Googleのアルゴリズムはその悪意を認識できず、盗用コンテンツが正規版として採用されてしまうことがある。

Googleが以下のとおり対処法を提示している。

まれに、コンテンツを無断でホストしている外部サイトの URL が Google のアルゴリズムで選択されることがあります。

別のサイトが著作権法に違反してご自分のコンテンツを複製していると思われる場合は、そのサイトの所有者に連絡して削除を要求することをおすすめします。

さらに、デジタル ミレニアム著作権法に基づく通知を提出することによって、権利侵害にあたるページを Google の検索結果から除外するよう Google にリクエストできます。

出典: Google Developers

相手サイトへの削除要求とGoogleへの通知を行って、対処しよう。


5. 重複コンテンツの内部対策ですべきこと

続いて、自サイト内の重複コンテンツを減らす具体的な内部対策を見ていこう。

やるべきことは明確で、Googleが提示する8項目を実践することだ。以下はGoogle公式からの引用である。

▼ Googleが提示する対策8項目

対策8項目出典:Google Developers

上記だけでは意味がわかりづらい部分もあるので、以下に補足説明をする。

5-1. 301を使用する

301を使用する

301とはリダイレクト(=別ページへ自動転送すること)のコードを指す。

“301を使用する”の狙いは、重複しているコンテンツのページを、統合したい別ページへ転送することで1つにまとめることである。

「リダイレクト先のページが正規URLです」とGoogleに伝えることができる。リダイレクト先のURLはインデックスに残り、インデックスから除外されるのはリダイレクト元のURLとなる。

301リダイレクトの詳しいやり方は、別記事の「301リダイレクトとは?SEOへの影響と転送の書き方・設定後の留意点」にて説明しているので、参考にしてほしい。

5-2. 一貫性を保つ

一貫性保つ同じコンテンツにアクセスするURLが複数ある場合、1つに絞る、というのがこの項目だ。1つの正規のURLにまとめることを「正規URLに統合する、正規化する」という。

正規化の具体的な手法はGoogleの「重複した URL を正規 URL に統合する」に詳細が解説されているので、確認してほしい。

複数の方法があるが、それぞれ特徴やメリット・デメリット、手順が掲載されている。

▼ URL正規化の方法と説明(一部引用)

正規化の方法と説明

出典: Google Developers

以下に関連記事をリンクするので、あわせて参考にしてほしい。

5-3. トップレベルドメインを使用する

トップレベルドメインを使用する

この項目は少々わかりづらいかもしれないが、「国別のコンテンツを扱う場合」のアドバイスである。

トップレベルドメインとは、ドメインの最後のドットに続く「jp」や「com」を指す。

トップレベルドメインの説明これを見て「com」ではなく「co.jp」や「ne.jp」にドメインを変えなければ、と思うのは誤解で、おもに英語で書かれた重複コンテンツを、国ごとにURLを分けて展開する際の推奨、といえる。

たとえば、

日:http://example.com/ja
英:http://example.com/uk
豪:http://example.com/au

ではなく、

日:http://example.co,jp
英:http://example.co.uk
豪:http://example.com.au

のほうが望ましい、という話だ。

5-4. シンジケーションは注意して行う

シンジケーションは注意して行う

シンジケーションとは、第三者サイトへの配信による記事提供だ。

たとえば、Yahoo!ニュースへ、さまざまなWebメディアがシンジケーションを行っている。

配信記事は「https://news.yahoo.co.jp/***」のURLに表示されるが、同じコンテンツが、配信元メディアのドメイン下のURLにも表示されることになる。

Yahoo!ニュースのドメインは強いので、Google検索結果では、配信元メディアよりも上位にYahoo!ニュースが表示されることも珍しくない。

例を挙げると、2022年6月15日にマグミクスよりYahoo!ニュースへ「ソフト価値の任天堂VSハード価値のソニー、ゲームメーカー2強「真逆の戦略」」という記事が配信された。

記事タイトルでGoogle検索すると、以下のとおりマグミクスより上位にYahoo!ニュースが表示される。

ヤフーニュースとマグミクス

こういった状況に対しGoogleは、コンテンツ提供先(例:Yahoo!ニュース)に、検索エンジンをブロックするなどの対応を依頼するようアドバイスしている。

しかし現実的には難しいケースが多いだろう。

シンジケーションの是否をどう判断すべきかといえば、自サイトが達成したい目的によって変わる。

たとえば「不特定多数にメディア名を露出したい」「社会貢献として情報を伝えたい」といった目的なら、自サイトの検索順位が下がっても問題とならない。

一方、自サイトへのアクセス増が目的なら、シンジケーション提供による集客効果と、提携せず自サイトへの検索流入による効果と、どちらが高いかよく検討する必要がある。

5-5. 定型文の繰り返しをできるだけ少なくする

定型文の繰り返しをできるだけ少なくする

たとえば、WordPressの自動挿入プラグインなどを利用して、自社サービスを宣伝する定型文を全記事に挿入しているサイトがある。

こういった定型文の繰り返しは推奨されない、ということだ。

Googleのアドバイスどおり、短いテキストから詳細ページへリンクするよう改善しよう。

5-6. スタブを公開しないようにする

スタブを公開しないようにする

これは「テスト用のダミーページや、未完成のテンプレートページを公開しないように」という意味だ。

上記文中に登場する言葉で、“スタブ”とはテスト用のダミー、“プレースホルダ”とは後から内容を挿入するための仮の場所(テンプレートなど)を指す。

たとえばWordPressを構築すると、あらかじめ「Hello!」など仮テキストが挿入されたページが1ページ用意されているが、これがプレースホルダにあたる。

▼ プレースホルダのイメージ

Hello world!

特別な事情があってダミーページを作成した場合には、「noindex」のmetaタグを使用し、そのページがGoogleのインデックスに登録されないよう対処しておく必要がある。

具体的なやり方は、以下をhtmlの<head> と</head>の間に記述する。

<meta name=”robots” content=”noindex”>

詳しくは「noindexの使い方」を参照してほしい。

5-7. コンテンツ管理システムについて理解する

コンテンツ管理システムについて理解する

上記の日本語訳では「コンテンツ管理システムについて理解する」となっているが、原語では「Understand your content management system」、つまり「自サイトで使っているCMSを理解せよ」と言っている。

CMSとはWebコンテンツの制作や管理を容易にするシステムのことで、WordPress、Wix、ShopifyなどがCMSである。

WordPressでサイトを構築しているのなら、「WordPressの挙動をよく理解してください」ということだ。

WordPressは、使用しているテーマによって、コンテンツの表示のされ方が異なる。自サイトのテーマがどんな挙動になっているのか、よく確認しよう。

必要に応じて、テーマの作者に問い合わせるのもよい方法だ。

5-8. 類似するコンテンツをできるだけ少なくする

類似するコンテンツをできるだけ少なくする上記でGoogleがアドバイスしていることをイメージ図にすると、次のようになる。

類似のコンテンツ補足として、これは重複コンテンツとはまた別の視点でも、Googleのページ品質評価を高めるために役立つ。

というのもGoogleの「検索品質評価ガイドライン」には、「a satisfying amount(満足な量)」というワードが頻出で、ユーザーが納得できるだけの十分な情報量が提供されているかを重視していることがうかがえる。

Aページに50・Bページの50の類似コンテンツがあるなら、Aページに100と統合したほうが効果的だ(数字は情報量を表すイメージ)。

あるいは、各ページのユーザーニーズに合わせた独自コンテンツを追加すれば、Aページ70・Bページ70という具合に、ユーザーが納得するだけの情報量を増やせるだろう。


6. まとめ

本記事では「重複コンテンツ」をテーマに解説した。以下に要点をまとめる。

  • 重複コンテンツとは異なる複数のURLに、完全に同じ、または類似したコンテンツがあること
  • 悪意がなければペナルティ対象とはならない
  • 通常のサイト運営で重複コンテンツは発生する

重複コンテンツにはネガティブな側面として以下が挙げられる。

  • 検索結果が自動フィルタリングされる
  • 被リンク評価が分散する
  • ユーザーエクスペリエンスが損なわれる

重複コンテンツのチェック方法として以下2つを紹介した。

  • 自動フィルタリングを無効にしてGoogle検索する
  • Search Consoleのカバレッジを確認する

外部サイトによる悪意の重複コンテンツが見つかったときは、海外のスパムサイトは放置でよい。

国内のドメインパワーの強いサイトに盗用されたら、削除要求とGoogleへの通知を行う。

重複コンテンツの内部対策ですべきことは以下の8項目だ。

  • 301を使用する
  • 一貫性を保つ
  • トップレベルドメインを使用する
  • シンジケーションは注意して行う
  • 定型文の繰り返しをできるだけ少なくする
  • スタブを公開しないようにする
  • コンテンツ管理システムについて理解する
  • 類似するコンテンツをできるだけ少なくする

重複コンテンツは、SEO用語としての意味を正しく理解して具体的な対策をすれば、恐れるものではない。

不安を抱いていた方も本記事でスッキリ解消していただき、やるべき対処をしたら、あとはユーザーに目を向けた価値あるコンテンツづくりを進めていこう。

カテゴリー SEO

記事をシェアする

  • B!

無料eBook:バズ部式マーケティング
広告費を1/10にして売上を倍増させる全手法

広告に頼り切ったマーケティングの打開策としてコンテンツマーケティングについて調べているけれど、よく分からないと悩んでいませんか?

本書は弊社やクライアント様がコンテンツマーケティングに取り組み

  • ・SEOのみで月間100万PV集めた方法
  • ・平均6.92%のコンバージョン率が出た新規顧客獲得法
  • ・CPLやCPAを大幅に改善した方法とそのからくり

など、コンテンツマーケティングの効果と、具体的な施策内容を全94ページに渡って詳細に解説しているものです。

ぜひ、貴社のWEBマーケティングにもご活用ください。

eBookをダウンロード