- オンライン
10/23水12:00〜13:00
「noindex」とは、インデックス登録をブロックする設定のことである。新規ページに設定すればインデックスを防ぐことができ、既存ページに追加すれば検索結果から削除できる。
※インデックスとは、検索エンジンのデータベースに登録されることである。インデックスされなければ検索結果に表示されることはない。
単語を羅列しただけの低品質ページや、内容がわずかに違うだけの重複コンテンツがたくさんあると、Googleはサイト全体の評価を下げてしまう可能性がある。
そのようなページにnoindex設定することで、サイトの評価下落を回避し、SEOの観点からも良い影響を得られる可能性がある。
この記事では、「noindexとは何か?nofollowやrobots.txtと何が違うのか」という基本的な知識から、「noindexを適切に設定するとなぜSEO効果があるのか」を具体的に解説していく。
さらに、noindexを設定すべき3種類のコンテンツと8つの具体例を分かりやすく説明する。
サイトの価値を下げる 低品質コンテンツや重複コンテンツ |
❶Googleが求める品質に合致しない低品質コンテンツ ❷サイトの価値を下げる可能性がある重複コンテンツ 削除/リライトがおすすめ➡︎できない場合にnoindexを活用 |
検索ユーザーによって 必要がないコンテンツ |
❸サンクスページ(受付完了ページなど) ❹エラーページ(404エラー・not found) ❺XMLサイトマップなど検索エンジン向けの情報 |
検索結果に表示させたくないコンテンツ |
❻WordPressなどの管理画面 ❼テストページ(デザインリニューアルなど) ❽【要・検討】CMSで自動生成されるタグページなど |
また、4. noindexを設定してインデックスを削除する方法
4章ではnoindexを設定してインデックス削除するための3種類のやり方を、5章ではnoindexを設定する上での注意点を詳しく解説していく。
noindexは、ページを削除しなくても検索結果から削除できる便利な方法である。しかし、勘違いや早合点で安易に設定してしまうと、解除してもすぐに検索順位が戻ってこないことが確認されている。
noindexを設定するなら、仕組みや注意点を理解した上で、慎重に行わないといけないのである。
noindexを正しく理解してSEO施策に活用したい方は、ぜひこの記事を参考にしてほしい。
noindexとは、metaタグの1つで、サイト内のあるページを検索エンジンにインデックスさせないために使う。つまり、noindexを設定すると、検索エンジンの検索結果に表示させないようにできる。
※metaタグに直接記述する方法以外に、WordPressで設定する方法やHTTPレスポンスヘッダーで設定する方法もある。
noindexを設定すべきページの最たるものが、低品質なページや重複ページだ。そうしたページがあると検索エンジンからサイト全体の評価を下げられてしまうことがあるからである。
noindexを使ってサイト全体のインデックスを適切に管理することで、サイト全体の価値を上げ、SEOに良い効果が期待できる。
「インデックスされる」とは、検索エンジンのデータベースに登録されることである。インデックスされなければ、もちろん検索結果に表示されない。
検索順位が決まるまでのプロセスには、❶クロール→❷インデックス登録→❸検索結果の表示の3つのステップがある。metaタグにnoindexを設定すると、2番目のインデックス登録をブロックでき、検索結果に表示されなくなる。
検索エンジンのクローラーが新規ページを見に行った時にnoindex設定がされていれば、クローラーはインデックス登録を見送る。
既にインデックスされているページに後からnoindexを設定した場合も有効である(反映までに少し時間はかかる)。次にクロールした時にnoindexを検出すると、そのページはGoogleの検索結果から完全に削除される。
noindex を使用して検索インデックス登録をブロックする
ページやその他のリソースが Google 検索に表示されないようにするには、noindex メタタグまたはヘッダーを含めます(ヘッダーの場合は HTTP レスポンスで返す)。Googlebot がそのページを次にクロールしたときに、このタグまたはヘッダーを検出すると、他のサイトがそのページにリンクしているかどうかにかかわらず、そのページが Google 検索結果から完全に削除されます。
SEO初心者は、「検索結果に表示されなくなるとユーザーから見られなくなっちゃうのでは?」と心配するかもしれない。しかし、noindexでインデックスされなくてもアクセスはできるので安心してほしい。
noindexを設定すると検索結果に表示されないので、Googleなどの検索エンジンから直接流入はされなくなる。しかし、サイト内にリンクがあれば、そのリンクを辿ってアクセスできる。
このあたりの考え方を、しっかり頭で理解しておこう。
noindexと混同しやすいものに「nofollow」がある。同時に使われるケースも多いので、違いをしっかり理解しておこう。
noindex | metaタグに設定 ➡︎インデックス登録をブロックできる |
nofollow | metaタグ(またはaタグ)に設定 ➡︎そのページ(またはリンク)から発するリンク先を辿らないように設定できる |
nofollowとは、ページ全体に設定した場合、ページ全体に含まれるリンク先をクローラーが辿らないように設定できるタグのことだ。noindexとは全然役割が違う。
なお、noindexだけだとクローラーはリンク先を辿ってしまうので、nofollowを同時に設定することが多いだろう。
<meta name=”robots” content=”noindex, nofollow”>
nofollowについてさらに詳しく知りたい方は、「nofollowの使い方」を確認してほしい。
noindexとrobots.txtも混同されやすいが、こちらも目的が違うためしっかり理解しておこう。
noindex | metaタグに設定 ➡︎インデックス登録をブロックできる |
robots.txt | ルートディレクトリにファイルを設置 ➡︎disallowを設定したコンテンツに対してクロールしないように設定できる |
❶クロール→❷インデックス登録→❸検索結果の表示のうち、noindexは2番目のインデックス登録をブロックするものだが、robots.txtでは1番目のクロールをブロックできる。
クロール自体を拒否したい場合は、noindexではなくrobots.txtを活用しよう。
robots.txtを設定すべきケースや詳しい設定方法を知りたい方は、「robots.txtとは?クロール拒否する方法・書き方・必要性を解説」をご覧ください。
サイトに低品質なページや重複コンテンツが存在する場合には、noindex設定でそれらをインデックスから削除することでSEOに良い影響を与えられる可能性がある。
なぜならば、サイトに質の低いページが存在すると、サイト全体の検索順位が下がる可能性があるからだ。
ウェブサイトが質の低いコンテンツを含む場合、サイト全体のランキングに影響が及ぶ可能性があります。質の低いページを削除したり、コンテンツの内容が薄いページを有用なページに統合あるいは改善したり、質の低いページを別のドメインに移動したりすることによって、コンテンツの質が良くなり、掲載順位が上がる可能性があることを Google の他の個別のガイダンスで説明しています。
また、Google社員のジョン・ミュラー氏は、ビデオ通話イベントで以下のように発言している。
Googleはインデックスされているコンテンツのみを見ており、インデックスされていないコンテンツは見ない。
低品質コンテンツがある場合に一番良いのは品質を改善することだが、数が多すぎて対処できなかったりUGC(ユーザー生成コンテンツ)だったりするなら、しばらくnoindexにしておき、サイト全体の評価に影響を与えないようにできる。時間をかけて、もっと適切に対処する方法を見つければよい。
実際に、低品質なページをインデックス削除することによってサイト評価が上がった事例を紹介しよう。
住太陽さんの「インデックスの整理で検索流入が二倍になった話」の記事では、Piggというソーシャルブックマーク構築システムが自動生成した重複ページのインデックスを削除した結果、オーガニック検索数が2倍になった事例を紹介されている。
この事例のように、重複コンテンツが大量にあることでペナルティを受けているケースでは、noindexを活用することで大きく順位が上がる結果となりえる。
※ただし、ジョン・ミュラー氏が言うように、低品質コンテンツにnoindexを使うのはあくまで暫定的な措置と考えた方が良い。そもそも価値の無い低品質ページや重複ページが存在するならば、noindexを使うのではなく、削除するか、リライトして良いコンテンツにする方がSEO評価を上げるために効果的である。
どのようなコンテンツにnoindexを設定すべきかを具体的に紹介していこう。
基本的な考え方として、noindexを設定すべきコンテンツは3つの種類に分かれる。今回は3種類のうち、具体的な8つの具体例を交えて解説する。
サイトの価値を下げる 低品質コンテンツや重複コンテンツ |
❶Googleが求める品質に合致しない低品質コンテンツ ❷サイトの価値を下げる可能性がある重複コンテンツ 削除/リライトがおすすめ➡︎できない場合にnoindexを活用 |
検索ユーザーによって 必要がないコンテンツ |
❸サンクスページ(受付完了ページなど) ❹エラーページ(404エラー・not found) ❺XMLサイトマップなど検索エンジン向けの情報 |
検索結果に表示させたくないコンテンツ |
❻WordPressなどの管理画面 ❼テストページ(デザインリニューアルなど) ❽【要・検討】CMSで自動生成されるタグページなど |
それぞれ詳しく解説していくので、じっくり読んで理解してほしい。
SEOのためにnoindexを設定するなら真っ先に取り組むべきは、サイト全体の価値を下げる可能性がある低品質コンテンツである。
※ただし、できるなら低品質コンテンツは、削除するかリライトすることが望ましい。それが難しい場合に「noindex」を設定し、サイト全体の評価を下げなくできるという考え方である。
「2. noindex設定はSEOに良い影響を与える可能性がある」でも解説した通り、低品質コンテンツがあるとそのせいでサイト全体の評価が下がり、検索順位が下落する可能性がある。
低品質コンテンツとは、Googleが公開している「品質に関するガイドライン」に違反するようなコンテンツのことである。例えば、以下のようなものが含まれる。
これ以外にも、例えば「社員ブログ」がサイト内にあり、内容が業務とは関係がなく極端に短い記事の場合、低品質コンテンツに該当する可能性がある。(例:「今日はみんなでラーメンを食べました」)
こうした低品質コンテンツがあるとサイト全体の評価を下げられる可能性があるため、できればこうしたコンテンツは削除するかリライトすることが望ましい。
何らかの理由で残しておきたい場合には、noindexを設定し、検索エンジンのデータベースから削除しよう。
内容がほとんど同じ重複コンテンツにも、noindex設定することが望ましい。
内容がほぼ同じである重複コンテンツの例 ・ECサイトなどでソートをかけると作成される機械的なコンテンツ ・色やサイズの違いでURLを分けているECサイトなどのコンテンツ ・パラメーターが違うだけで同じ内容の申込ページなど |
こうしたコンテンツは、ユーザーからすると重要なコンテンツだが、検索エンジンから見ると「ほとんど内容が同じ重複ページだ」と見なされ、評価を下げられる可能性がある。
そのため、noindexを活用するか、URLの正規化を図ることで、重複コンテンツと見なされない対応をすることが望ましい。
URLの正規化とは、類似ページを検索エンジンに伝えて、正しい評価をしてもらう方法である。さらに詳しくは「URLの正規化とは?具体的な方法と正規化すべきケースを解説」を確認してほしい。
サンクスページとは、サイト上でお問い合わせや資料請求、セミナー申込などを行った際に、「ご購入ありがとうございました」などと表示されるページのことである。
サンクスページは、問い合わせなどを行ったユーザーだけが見れば良いページであり、検索結果に表示する必要がないページである。
noindex設定をしていないと以下のように検索結果に表示されてしまう。
必須ではないが、検索結果に表示したくない場合にはnoindex設定を行うと良いだろう。
404エラー(not found)ページとは、URLが存在しないことを表すページのことである。
ユーザーが間違ったURLを入力した場合や、ページが削除されている場合などに表示される。エラーページがなければページが存在しないことをユーザーに伝えられないため、エラーページの存在はとても重要である。
しかしエラーページは、検索結果に表示される必要はないし、検索エンジンに評価してもらう必要もない。
こうしたページをインデックスさせたくない場合には、noindexを設定しても良いだろう。(ただし、設定しなくても評価を下げられる原因とはならないため、設定は必須ではない。)
XMLサイトマップとは、検索エンジンがサイトの構造を把握するために設置するファイルのことである。サイトマップはあくまで検索エンジン向けのファイルであり、検索ユーザー向けのものではない。
必須ではないが、検索結果にこうした検索エンジン向けの情報を出したくない場合には、noindex設定を行うのも良いだろう。
ちなみに、XMLサイトマップはmetaタグ設定ができないため、HTTPヘッダーを使って設定しよう(やり方は後述している)。
WordPressなどのCMS管理画面は、特定のユーザー以外はアクセスしなくて良い(できればアクセスしてほしくない)ページである。
こうした管理画面には、リスク回避のためnoindex設定をしておくのがおすすめである。
デザインをリニューアル中でテストページを作成する場合には、必ずnoindex設定しておくことをおすすめする。
なぜならば、テストページの内容は本サイトと同じ内容が入っていることが多いため、重複コンテンツと認識されかねないからである。
クロールもさせる必要がないため、robots.txtでクロール拒否も行っておくと良いだろう。
なお、noindex設定したテストページをリニューアルページとして使う場合には、noindex設定やクロール拒否を解除することを忘れないようにしよう。
【サイトリニューアルの必読記事】
WordPressなどのCMSを使ってサイト作成をすると、タグページやカテゴリーページが自動生成される。こうしたページにnoindex設定をするかどうかは、判断が分かれるポイントである。
結論から言うと、こうしたページがむやみに存在し、検索エンジンが重複コンテンツと見なす可能性がある場合にはnoindex設定する意義はあるだろう。
例えば、以下のサイトのように投稿にタグを付けたサイトについて考えてみよう。サイトの右側にあるタグをクリックすると、タグごとに分類されたページにアクセスできる。
ユーザーにとっても有用なのでタグ自体に問題はないが、例えば「むやにみタグを作りすぎて数千以上のタグが存在している」「1つの投稿にしか付いていないタグが100個以上ある」など、あまりに乱用してしまうと、問題になる可能性はあるだろう。
その結果ペナルティを受けている状態なら、noindex設定することに意味がある。
ただしそれよりも大切な考え方として、全てのページが検索ユーザーにとって価値があるものだけになるようにサイト構成をすることが重要である。
もしあなたにサイト構成を見直す十分な時間があるなら、カテゴリーやタグを整理し直し、カテゴリーページやタグページを検索ユーザーにとって役立つように作り直すことの方が効果的である。
また、その際は「複数ページの関係を伝えられるタグ(rel=”next”、rel=”prev”)」も効果的に使用することをおすすめする。
noindexの設定方法には、以下の3種類の方法がある。それぞれの方法を解説していこう。
noindexを設定する3種類の方法 |
❶HTMLのmetaタグに記述する方法 ❷WordPressでプラグインを用いて設定する方法 ❸HTTPレスポンスヘッダーで設定する方法 |
なお、noindexを設定してもすぐに検索結果から削除はされないので注意しよう(削除されるのは、次にクロールされた時点)。
何らかの理由で即座にインデックス削除したい場合は、「5-1. noindexが反映されるまでには時間がかかる」を参照してほしい。
ページに「noindex」を設定する方法は簡単だ。以下のmetaタグを、設定したいページのHTMLコードの<head>セクションに記述するだけで良い。
<meta name=”robots” content=”noindex”>
既にインデックスされているページにも有効で、このコードを記述した後にクローラーが巡回してnoindex設定を確認するとインデックスを削除できる。
WordPressでサイトを構築している場合は、プラグインを利用することで簡単に設定できる。
例えば「Yoast SEO」というプラグインをインストールすると、新規投稿画面の下部に以下のような設定画面が表示される。
「検索エンジンに、この投稿の検索結果への表示を許可しますか?」で「いいえ」を選択すると、そのページのmetaタグにnoindexが設定される。
記事がアップされたら念のためソースコードを確認し、metaタグにnoindexが設定されているか確認しよう。
PDFや動画、画像ファイルなど、HTML形式ではないためにnoindexタグを記載できないファイルの場合には、X-Robots-Tag HTTP ヘッダーを使用して設定ができる。
例えば、WebサーバーにApacheを使用していて「sample.pdf」というファイルをインデックスさせたくない場合は、.htaccessに以下のように記述しよう。
<Files sample.pdf>
Header set X-Robots-Tag “noindex”
</Files>
※利用しているサーバーによって設定方法が違うため、詳細はサーバー管理者に確認してみてほしい。
最後に、noindexを設定する時の注意点をまとめて紹介していく。noindex設定する前に必ず目を通しておこう。
既にインデックス済みのページにnoindex設定した場合、noindexが反映されてインデックス削除されるまでにはタイムラグがある。すぐにはインデックス削除されないので注意しよう。
noindexが反映されるのは、次にクローラーが回って来たタイミングである。クローラーの巡回のタイミングはサイトによって異なるため、一概にいつとは言えない。数日で反映される場合もあれば、1カ月程度かかるケースもあるだろう。
もし、何らかの理由でできるだけ早く検索結果から削除したいなら、Googleサーチコンソールの削除機能を使って一時的な削除を申請しよう。
「新しいリクエスト」から削除したいコンテンツのURLを送信すると「リクエストの処理中」となり、数日中に検索結果から(一時的に)削除される。筆者がテストしたところ、約1日半後に削除された。
あくまで一時的に6カ月間ブロックする機能だが、noindex設定と並行して活用することで、早めのインデックス削除を実現できるだろう。
一度インデックス削除してしまうと、「やっぱりインデックス登録したい」とnoindex設定を解除したとしても、インデックス再登録され、以前通りの順位に戻るまでに時間がかかる可能性がある。
Web担当者Forumの記事では、間違ってサイトの全ページをnoindexにしてしまった後、問題を修正してから回復までの記録を紹介している。それによると、全体的な検索トラフィックが回復するまでに6週間、全てのコンテンツが再登録されるまで8週間以上かかったそうだ。
一度noindexを設定してしまうと、すぐには元の状況まで回復できない。そのため、noindexは細心の注意を払って設定するようにしよう。
5-2と関連して、そのページに施すべきは「noindex設定でいいのか」よく考えた上でnoindex設定を行おう。
特に、以下の2点は間違いやすいので注意しよう。
❶クロール自体をさせたくない場合は、noindexではなくrobots.txtで制御すべき
❷低品質コンテンツがある場合は、noindexではなく、コンテンツを削除するか改善すべき
その他、noindexを正しく理解せず別のmetaタグ(例えばnofollowなど)と混同していた場合、間違えてnoindex設定してしまうことがあるかもしれない。
5-2で述べた通り、一度インデックス削除すると、解除してもすぐには順位が回復しないので注意してほしい。
noindexでインデックス削除すると同時に、robots.txtでクロールも拒否したい場合は、その順番に注意しよう。
noindex | metaタグに設定 ➡︎インデックス登録をブロックできる |
robots.txt | ルートディレクトリにファイルを設置 ➡︎disallowを設定したコンテンツに対してクロールしないように設定できる |
metaタグに記述してnoindex設定を行う場合、クローラーがそのページに辿り着かないとnoindex設定ができない。そのため、先にnoindex設定を行い、インデックス削除を確認した後にrobots.txtでクロール拒否する必要があるのである。
間違って先にrobots.txtでクロール拒否してしまうと、ページまでクローラーが到達しないため、noindex設定がいつまで経っても有効にならないので注意しよう。
noindexは、ページを削除せずとも検索結果から削除できる便利な方法である。
しかし、一度noindex設定してしまうと、解除してもランキングが戻ってくるまでにはかなりの時間がかかってしまうことがある。noindexに限らずだが、こうした技術面での調整は、一歩間違えると大きなロスになってしまう。
noindexにした方が良いのか良く考えた上で、慎重に注意深く行おう。
また、SEOにとって一番重要なのは、あくまでも良質なコンテンツを作ることだ。常にコンテンツ作成を最優先にSEOを行おう。
広告に頼り切ったマーケティングの打開策としてコンテンツマーケティングについて調べているけれど、よく分からないと悩んでいませんか?
本書は弊社やクライアント様がコンテンツマーケティングに取り組み
など、コンテンツマーケティングの効果と、具体的な施策内容を全94ページに渡って詳細に解説しているものです。
ぜひ、貴社のWEBマーケティングにもご活用ください。