- オンライン
11/27水19:00〜20:00
ワードサラダとは、文法は正しいが意味が破綻している支離滅裂な文章を指す。
ワードサラダ |
文法としては正しい意味が破綻している支離滅裂な文章(コンテンツテキスト)のこと |
主に複数の文章や言葉をもとに、自動生成するコンテンツテキストで発生する。例えば、下記のような意味の分からない文章が羅列されているところがワードサラダの特徴だ。
【ワードサラダの一例】 私はソファで遊ぶ。その後にポーチや皿と合流して庭の外まで15時間食べた。 |
この文章を見ても意味が分からないためユーザーのストレスとなるのはもちろんのこと、Googleからのペナルティ対象となる。ワードサラダは絶対に避けるべきSEO対策だからこそ、発生する仕組みやリスクとなる理由を理解しておく必要がある。
そこでこの記事では、ワードサラダの概要や仕組み、ワードサラダを避けるべき理由をまとめて解説する。
【この記事を読むと分かること】 ・ワードサラダとは |
この記事を最後まで読めばワードサラダの危険性が把握でき、絶対に使用しないようになるだろう。正しいSEO対策を実施するためにも、ぜひ参考にしてみて欲しい。
目次
冒頭でも述べたようにワードサラダとは、文法としては正しいが意味が破綻している支離滅裂な文章(コンテンツテキスト)を指す。
統合失調症の患者に見られる言語障害「言葉のサラダ」に似ていることから、ワードサラダと呼ばれるようになった。
例えば、下記のように文章になっているものの脈絡がなく、理解ができない文章がワードサラダに当てはまる。
【ワードサラダの一例】 今日は晴れだから鍋を食べる。 |
例文を見ると分かるが、人が何らかの目的を持ち文章を書けばここまで支離滅裂な文章になるはずがない。では、なぜワードサラダが生まれるのかというと、自動生成によってコンテンツを作成しているからだ。
つまり、文章の意味を理解できないプログラムが特定のキーワードを使い自動で文章を作成することで、ワードサラダが生まれる。
次の章では、ワードサラダが生成される仕組みをより詳しく解説していく。
ワードサラダは、
①形態素解析
②マルコフ連鎖
の2つの要素で生成される。それぞれどのような仕組みなのか詳しく見ていこう。
形態素解析とは、文章を最小の単位で区切り意味や文章を分析する方法だ。検索エンジンにも活用されている自然言語処理方法の一つとして知られている。
英語はもともと単位ごとに区切って書く習慣があるが、日本語は代名詞や助詞、動詞をつなげて記載する。そのため、コンピューターが処理をすることが非常に難しかった。
そこで、下記のように文章を細かく区切り、ソフトウェアに搭載されている文法知識や辞書に基づき品詞情報などを機械的に付与する。
ソフトウェアにより分析の精度や付与できる情報は異なるが、一例として「私はパンを食べます」を最小単位に区切ると下記のようになる。
最小単位に区切った後にパンは名詞、食は動詞と品詞と紐づけて処理をするのが形態素解析となる。
マルコフ連鎖とは、簡単に言うと過去の結果や事象に囚われず現在の状態のみで未来が決まる確率過程モデルの一つだ。例えば、「私はご飯を食べる」と「私はコップと皿を買った」という2文があるとしよう。この文章を3つの単語の単位で区切ると下記のようになる。
冒頭が「私は」だとすると、次は「は」から始まるブロックを探して連結をする。「は」から始まる文章を「は コップ と」と「は ご飯 を」の2つがあるが、どちらを選択するのかはランダムで決まる。
この作業を繰り返すことで、1つの文章が完成する。
完成した文章を見ると「私はコップと皿を食べる」となった。「コップと皿を」という現状の次に来る言葉は「コップと皿を」という現在の言葉のみで決定され、過去に選択をした「私は」とは無関係であるというのがマルコフ連鎖の仕組みである。
ここまでの解説を読むと、文章を単語単位で区切る形態素解析とマルコフ連鎖を組み合わせることでワードサラダが完成することが把握できるだろう。
今回は分かりやすく2文の例文で解説をしたが、実際のワードサラダでは非常に多くの関連性がありそうな文章を用意して文章の自動生成を行う。例文よりも意味の通じない文章が短時間で大量に生成でき、ワードサラダで作った文章をコンテンツ内に貼り付けて使用する。
ワードサラダが普及した背景には、SEO対策がある。実は、Googleがコンテンツの文脈を理解できなかったころ、ワードサラダは効果的なSEO対策として取り入れられていた。
文脈を理解できないのなら、白紙のページや同じ言葉の羅列でもいいのでは?と思う方もいるだろう。当時のGoogleは文脈が理解できないとは言え、キーワードの有無程度なら理解できた。キーワードとなる単語を使用した文章を大量に用意しワードサラダを作成することは、少なからずSEO対策の意味があった。
また、当時はページランクを指標としたSEO対策が主流だった。ページランクは被リンクの質と量でページを評価する仕組みだったため、少しでも多く被リンクを獲得する必要がある。
そこで、自動生成したワードサラダを貼り付けたコンテンツを大量生産していた。ワードサラダを貼り付けたコンテンツから被リンクを獲得できれば、短期間で被リンクの数を大幅に増やせる。
当時はワードサラダを使用したサイトからの被リンク獲得により、検索結果の上位表示を実現したサイトも確かに存在した。そのため、有効なSEO対策だと捉えられ、ワードサラダを使ったコンテンツが増えてしまったのだ。
繰り返しとなるがワードサラダを使用したコンテンツからの被リンク獲得で上位表示が狙えたのは、過去の話に過ぎない。現在は検索エンジンの精度が向上し文脈を把握できるようになったのはもちろんのこと、被リンク以外にも200以上の要素を含めてコンテンツを評価している。
では、現在ワードサラダを使用するとどうなるのか、次の章で詳しく解説していく。
ページランクについて詳しく知りたい場合は、下記も参考にしてほしい。
現在、ワードサラダは絶対に使用してはいけないSEO対策の一つだ。主な理由としては、下記の2つが挙げられる。
ワードサラダが大きなリスクとなる2つの理由 |
❶ Googleのガイドライン違反になる ❷ 自動生成した文章は見破られてしまう |
なぜ、ワードサラダを使用してはいけないのか把握するためにも一つずつ確認していこう。
1つ目は、Googleのガイドライン違反となるからだ。Googleのガイドラインには下記のように「マルコフ連鎖などの自動処理によって生成されたテキスト」が違反となることをはっきりと明記している。
自動生成されたコンテンツは、プログラムによって生成されたコンテンツです。Googleは、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。具体例の一部を以下に示します。 マルコフ連鎖などの自動処理によって生成されたテキスト |
ワードサラダを使用していると意図的なランキング操作をしていると判断され、検索結果に表示されないなどのペナルティの対象となる。
ワードサラダのように検索エンジンの隙をついて検索順位の上位を狙う手法は、ブラックハットSEOと呼ばれている。
今はGoogleのガイドラインに沿ったホワイトハットSEOが主流なので、わざわざリスクの高いブラックハットSEOを実施する必要はない。ホワイトハットSEOの概要や施策は下記を参考にしてみて欲しい。
「ホワイトハットSEOとは?ブラックハットSEOとの違いや施策を解説」
2つ目は、今のGoogleは自動生成した文章を判断できるレベルに達していることだ。この裏付けとしては、2019年に実施されたBERT(バート)アップデートがある。
BERTアップデートは、検索アルゴリズムのアップデートの一つだ。人工知能(AI)を活用した自然言語処理技術を導入していることが特徴で、より複雑な文脈が理解できるようになった。
例えば、BERTアップデート前は「日本に旅行に行くアメリカ人」と検索をすると、「to」の意味が正しく認識できず日本に行くアメリカ人とアメリカに行く日本人の情報が混じって表示されていた。
BERTアップデート後は「to」の意味を正しく把握でき、日本に旅行に行くアメリカ人向けの情報が表示されるようになったのだ。この事例からも、細かな文脈まで読み取れるようになっていることが分かるだろう。
Googleの公式アカウントでも、言葉を理解し検索結果を改善する方法として紹介されている。
Meet BERT, a new way for Google Search to better understand language and improve our search results. It’s now being used in the US in English, helping with one out of every 10 searches. It will come to more counties and languages in the future. pic.twitter.com/RJ4PtC16zj
— Google SearchLiaison (@searchliaison) October 25, 2019
検索エンジンが文章の文脈を把握できれば、ワードサラダが支離滅裂な文章であることはすぐに判断できる。その結果、ウェブマスター向けガイドライン違反となり、ペナルティを受ける可能性がある。
次のような手法を使用しないようにします。 検索ランキングを操作することを目的としている自動生成コンテンツ |
Googleの検索エンジンの成長により、意味のない文章の羅列はコンテンツとして意味や価値を持たなくなった。今やワードサラダの使用はリスクしかないことが分かるだろう。
あなたのWebサイトやコンテンツでワードサラダを使用していなくても、知らず知らずのうちにワードサラダを使用したコンテンツから被リンクを獲得している可能性がある。
質の低いWebサイトやコンテンツからの被リンクは、あなたのWebサイトやコンテンツの評価を下げる危険があるので早めの対処が欠かせない。
被リンクの状況は、Googleが無料で提供している分析ツール「Google Search Console」を使い下記の手順で確認できる。
①被リンクの確認がしたいURLを使いGoogle Search Consoleにログインする。
②メニュー欄にある「リンク」をクリックする。
③画面に内部リンクと外部リンクが表示されるので、外部リンクの詳細をクリックする。
④被リンクページの一覧が表示されるため、被リンクの確認をしたいページをクリックする。
⑤リンク元のURLが表示される。
この手順で確認をすると、サイト内にいくつ被リンクがあるのか、どのようなサイトから被リンクをもらっているのか把握できる。
万が一、ワードサラダを使用したサイトから被リンクをもらっていた場合は、否認テキストファイルを送信で被リンクを拒否しよう。
さまざまなWebサイトを閲覧していたら、たまたまワードサラダを使用したサイトに遭遇するときもあるだろう。そのままスルーすることもできるが、Googleに報告をして対処してもらうことも可能だ。
①Google Search Consoleにログインする。
②ウェブスパムレポートをクリックし、「不正行為があるウェブページのアドレス」を入力する。
③スパムサイトの詳細や問題のある検索キーワードを適宜入力する。
Googleに報告すると検索順位を下げるなどの処置を行う可能性があるため、ワードサラダを使用したサイトが気になったら報告してみよう。
ここまで見てきたように、ワードサラダは自動生成に頼りコンテンツを作成するから発生する。Googleの精度が低かったころは被リンク獲得の手段として使用されていたものの、今はペナルティの対象となる。ブラックハットSEOの一つでもあり、絶対に使用してはならない手段だ。
現在のGoogleはユーザーファーストを掲げており、ユーザーにとって有益となるコンテンツを推奨している。支離滅裂な文章となるワードサラダはユーザーファーストから程遠く、ユーザーにとってもSEO対策にとっても得策ではない。もちろん、ワードサラダを使用したサイトから自作自演の被リンクをもらうこともGoogleのガイドラインに反する行為なので、絶対に行ってはいけない。
できるだけ早く大量のコンテンツを作成したい、できるだけ多くの被リンクを獲得したいという気持ちだけでコンテンツの自動生成を使用せず、ユーザーによって有益となるコンテンツ作成を丁寧に積み重ねていくことが重要だ。
最後まで読みワードサラダとはどのような手法なのか、なぜ使用してはいけないのか把握できただろう。最後に、この記事の内容をまとめてみると
〇ワードサラダとは、文法としては正しいが意味が破綻している支離滅裂な文章(コンテンツテキスト)
〇ワードサラダは形態素解析とマルコフ連鎖の2つの要素で生成される
形態素解析 | 文章を最小の単位で区切り意味や文章を分析する方法 |
マルコフ連鎖 | 過去の結果や事象に囚われず現在の状態のみで未来が決まる確率過程モデル |
〇Googleがコンテンツの文脈を理解できなかったころ、ワードサラダは効果的なSEO対策として取り入れられていた
〇現在のSEO対策ではワードサラダを使用してはいけない理由は次の2つ
1)Googleのガイドラインには「マルコフ連鎖などの自動処理によって生成されたテキスト」が違反だと明記されておりガイドライン違反になる
2)現在の検索エンジンは文脈を理解できるようになったため自動生成した文章はすぐに見破られてしまう
〇自動生成した文章を使いSEO対象をするのではなくユーザーに寄り添う質の高いコンテンツを作成することが大切
ワードサラダは、絶対に実施してはいけないSEO対策の一つだ。現在のGoogleの考え方やガイドラインに沿って、有効なSEO対策を実施しよう。
広告に頼り切ったマーケティングの打開策としてコンテンツマーケティングについて調べているけれど、よく分からないと悩んでいませんか?
本書は弊社やクライアント様がコンテンツマーケティングに取り組み
など、コンテンツマーケティングの効果と、具体的な施策内容を全94ページに渡って詳細に解説しているものです。
ぜひ、貴社のWEBマーケティングにもご活用ください。