インデクサビリティを高めて検索エンジンのインデックスを最適化する
検索エンジンのクローラーはインターネット上のコンテンツ(HTML)を収集するためのプログラムです。クローラーが取得したコンテンツを解析してデータベースに保存するのはインデクサの役割です。インデクサビリティとはこのインデックス登録の最適化するための取り組みです。適切なコンテンツ解析はキーワードとの関連性を高めやすくなります。
論理的構造に則ったHTMLマークアップ
インデクサビリティは検索エンジンを対象とした取り組みです。なのでWebブラウザの表示といった人間の視覚的な部分は変わらなくても、HTMLの構成によってインデクサビリティは大きく変わります。例えばページ全体を画像で用意するのと、テキスト化するのとでは検索エンジンのページの理解しやすさは大きく変わります。
- 画像よりもテキストの方がインデクサビリティが高い
また、HTMLは論理的構造に則ったマークアップをすると検索エンジンが理解しやすくなります。論理的構造に則ったマークアップとは、ページ内容により見出し・段落・リスト・定義リストなど使い分けることです。
- 論理的構造に則ったHTMLマークアップはインデクサビリティが高い
なお、論理的構造に則ったマークアップとは決してキーワードを見出しタグでマークアップすることではありません。筆者は15年以上Web業界におりますが、HTML文書の構造化は一般的になりましたが、論理的なマークアップはまだ少ないと感じております。
[参考]
▼クローラビリティとインデクサビリティの確保
https://www.searchengineoptimization.jp/optimizing-crawlability-and-indexability
HTML5普及によるHTMLマークアップの難易度向上
2014年に勧告されたHTML5は使用できるHTMLタグの種類が大幅に増えました。今までDIVタグでマークアップしていた部分をHEADERタグ、FOOTERタグ、NAVタグ、SECTIONタグ、ARTICLEタグ、ASIDEタグなどに振り分けることで検索エンジンのHTML文書の理解度は高くなります。
しかし、HTML5が普及するにつれHTML文書の論理的構造化は以前よりも難易度が増しました。HEADERタグ、FOOTERタグの使用箇所はどのサイトでもほぼ変わらないはずですが、SECTIONタグ、ARTICLEタグ、ASIDEタグの使い方は検討の余地があるように感じます。また、メインコンテンツであることを示すMAINタグは使用しているケースを見たのはかなり少ないです。
[参考]
▼HTML5リファレンス
http://www.htmq.com/html5/
構造化データ マークアップによるインデクサビリティ向上
構造化データでマークアップすると検索エンジンにページの内容を適切に伝えることができます。構造化データは商品・お店の情報・動画・イベント・レシピ・求人情報など様々な情報をサポートしています。構造化データマークアップはインデクサビリティ以上にリッチリザルトの表示という検索結果で目立つ可能性があるという期待値があります。
▼構造化データ マークアップを追加する「検索エンジン最適化(SEO)スターター ガイド」
https://support.google.com/webmasters/answer/7451184
構造化データが適切か否かはGoogleが用意しているテストツールで確認できます。また、Search Consoleには構造化データ マークアップ支援ツールもあります。
▼構造化データ テストツール
https://search.google.com/structured-data/testing-tool
質の低いページに対する対処
サイト全体として品質を高めることが一番良いことは当然として、万が一低品質なページが存在している場合はnoindexをするという方法があります。筆者は質の低いページを作らないということを実践しているので会員制コンテンツ以外でnoindexを使用することは基本的にありませんが、Googleはページ上でnoindexの使用を明記しています。
noindex を使用して、非表示にするページを Google がクロールまたは検出することを防ぎます。ただし、robots.txt によってブロックされているページで「noindex」を使用しても、noindex が認識されず、ページがインデックス登録される可能性があります。
▼インデックス登録「Google 検索の仕組み」
https://support.google.com/webmasters/answer/70897
ただし上記記載にもありますが、noindexが検索結果で表示されることはあります。他からリンクされているページをnoindexとしても必ずしも想定通りの結果とはなりません。また、重複ページに対してはnoindexではなくcanonicalを使用するようにGoogleは明示しています。
正規ページの選択を妨げる手段として noindex を使用しないでください。このディレクティブは、正規ページの選択を管理するものではなく、インデックスからページを除外するためのものです。
▼一般的なガイドライン「重複した URL を統合する」
https://support.google.com/webmasters/answer/139066
ウェブマスター向けガイドラインへの準拠
最後にウェブマスター向けガイドラインに関する話です。検索エンジンの順位アップを目的としたスパム行為をしてはいけません。検索エンジンスパムは必ずしも違法行為とは限りないものもありますが、クリーンなイメージはありません。以下はGoogleが禁止するガイドライン違反となるものです。
- コンテンツの自動生成
- リンク プログラムへの参加
- オリジナルのコンテンツがほとんどまたはまったく存在しないページの作成
- クローキング
- 不正なリダイレクト
- 隠しテキストや隠しリンク
- 誘導ページ
- コンテンツの無断複製
- 十分な付加価値のないアフィリエイト サイト
- ページへのコンテンツに関係のないキーワードの詰め込み
- フィッシングや、ウイルス、トロイの木馬、その他のマルウェアのインストールといった悪意のある動作を伴うページの作成
- リッチ スニペット マークアップの悪用
- Google への自動化されたクエリの送信
▼ウェブマスター向けガイドライン(品質に関するガイドライン)
https://support.google.com/webmasters/answer/35769
このようにインデクサビリティを高めることで検索エンジンのインデックスを最適化することができます。
※当記事はWebの間のコラムを再編集したものです。元記事はこちら。
https://www.web-ma.co.jp/column/crawlability/134.html
https://www.web-ma.co.jp/column/creative/1340.html