中小企業のIT営業戦略術:ITmediaオルタナティブ・ブログ (RSS) 中小企業のIT営業戦略術

中小企業がITを活用して売り上げにつなげるにはどうしたらいいか?WEBマーケティングとWEB戦略コンサル実績350社50業種以上の実績とノウハウで、海外の最先端情報を中心に、噛み砕いてご紹介。

Screenshot_03SEObyTheSEAにて、興味深い記事があったのでご紹介です。

How a Search Engine Might Identify the Functions of Blocks in Web Pages to Improve Search Results

内容はMicrosoftが今年の2月22日に取得したパテントの紹介です。

そして、そのパテントは

 「Classifying functions of web blocks based on linguistic features

訳すると、「WEBページを言語学的な特徴で分割する」という刺激的な題名なんです。

これに関して、MicrosoftはBingの解析指標としてこのパテントのような内容でページ内要素の重み付けを行っているのでは?という点に注目が集まっています。

Googleで言う"ボイラープレート"の判断基準を明かす!といったところでしょうか。

それが分かれば、検索エンジンに対してコンテンツをよりロス無く伝えられる、また効果的に伝えられるので、とても大事なポイントですよね。

記事をご紹介する前に

Bing以外でも特にGoogleに対して、そのアルゴリズムを所有特許から推測していこうというアプローチは少なからずありました。

ただ、Googleは公式にも言っていますが、200から300以上の指標を見て判断しているんです。

特許の内容と解説をそのまま飲み込んで、それにあったように最適化するというのは、やめた方がいいかと思います。

あくまで指標の一つとして、他のたくさんの指標の存在を忘れないようにしながら、適切な対応を行った方がいいかと思います。

記事概要

該当記事の中で気になった部分を抜き書きしてご紹介します。全文は元記事をご覧ください。

まずは特許概要についてですが、

A classification system trains a classifier to classify blocks of the web page into various classifications of the function of the block. The classification system trains a classifier using training web pages.

基本的には分類プログラムにたくさんの学習をさせて、精度を上げていくという方向性のようです。

そして重要なのはこの後ですが、

generates feature vectors for the blocks that include a linguistic feature, and inputs classification labels for each block.

言語学的な解析と、ラベリング、このラベリングとは「そのブロックの大きさや配置箇所、中身のフォントサイズなどのレイアウト要素」が入るようです。

つまり

  • 言語学的な解析
  • 色や形や実際にレンダリングされた配置

の2点が主要な判断基準のようです。

言語学的な解析とは具体的には

言語学的な解析とは、例えば以下のようなものとのことです。

  • 「文章が一切無く、短い単語の羅列が続いていると言うことは、ナビゲーション部分か?」
  • 「複雑な文章構成をしていると言うことは、ここが本文部分かもしれない…」
  • 「“copyright,” “privacy,” “rights,” “reserved,”という言葉がある…これはフッターかな」

パテントには「名詞、代名詞、動詞、形容詞、副詞、外国語、前置詞、接続詞などの出現頻度を見て、例えば平均すると名詞が10に対して、動詞が5、形容詞が7、前置詞や接続詞が2くらいだと、これは本文かなと判断する」など、言語解析して、それが実際の文章における割合にちかいかどうか、なども考えると書いてあります。

レイアウトも考慮する

このレイアウトとは、「色や形や実際にレンダリングされた配置」のことですが、例えばパテントには以下のようなことが書いてあるようです。

空間的な位置

  1. X座標とY座標、どのあたりにその要素が配置されるか
  2. 横幅と高さ

見た目(デザイン)

  1. 中のテキストは、どこまで大きなフォントを使っているか
  2. 中のテキストは、太字をどのくらい使っているか
  3. 文章の中の単語量
  4. アンカーテキストの中の単語量
  5. 画像の大きさ
  6. フォームの大きさ

HTMLのタグ

  1. <form><input><option><select>などのフォーム要素
  2. <table><td><th>などのテーブル要素
  3. <p>
  4. <li><dd><dt>などのリスト要素
  5. 見出し(<hn>)

※このような要素が他と比して多いと、ここが本来のコンテンツでは?と考えられるかもしれない。

リンク

  1. 文中から張られているリンクの数
  2. 内部リンクの数
  3. 外部リンクの数
  4. リンクの中でテキストリンクであるものの割合と、画像リンクであるものの割合

結局は自然かどうか

いろいろとパテントにはありますが、結局のところ「自然な文章を書いて、一般的によくあるサイトレイアウトにしておく」ことが最良のSEOだといえます。

もし、自然にきちんと記事を更新しているのに…という方が、その原因を探るための材料になります。

HTML構造などを見直して、サーチエンジンのクローラにきちんと大事な文章のところを理解してもらえているかどうか。妙なバナーに囲まれて、せっかくのオリジナルコンテンツが埋もれてしまっていないか。

過剰な本文中のWikipedia的なリンクで、不自然さを出していないか…などなど、そういう場合に力を発揮する情報化と思います。

繰り返しになりますが、これはパテントにすぎず「使われているかどうか」も「使われていたとして、どのくらいの重みなのか」も分かっていません。

一つの参考情報と、あるいは最近の検索エンジンはこういうことを考えているんだ、という材料になれば幸いです。

無料「ウェブ解析ガイドブック」のご案内

Banner_miniアクセス解析やウェブサイトの現場での運用について書いた初心者向けガイドブック、『「現場で使える」WEB解析入門』をリリースしました。

企業でウェブ解析を内製化したい!ノウハウを溜めたい!というあなたにぴったりです。約3万文字、ぜひ会社に一冊どうぞ。

無料でダウンロードできますので、ぜひお持ち帰り下さい。印刷も自由です。(^-^

→ 無料ダウンロードはこちらから

メールマガジンのご案内

この連載や他の運営ブログの内容にプラスして、ここには書いていない情報をメールマガジンで発行予定です。記事として書いていない情報を配信します。

ご興味のある方は、下記フォームからご登録下さい。

 

中山陽平

Special

- PR -
コメント

コメントを投稿する
メールアドレス(必須):
URL:
コメント:

» このブログのTOP

» オルタナティブ・ブログTOP



プロフィール

中山 陽平

中山 陽平

Office BeginToGone 代表/WEB戦略アドバイザー
350社50業種以上のWEB戦略コンサル経験と、2006年から続けている海外WEBマーケティング情報発信による最新のノウハウをもとに、中小企業のみなさんを支援するIT営業術・WEBマーケ情報を発信。
また、複数の企業にて、ウェブ戦略顧問や外部パートナーとしてコンサルやコンテンツ提供などを行う。
GoogleAnalyticsIndividualQualified、Adwords Professional認定者。
その他、アクセス解析イニシアティブ運営スタッフなど。

詳しいプロフィール

カレンダー
2012年5月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
カテゴリー
エンタープライズ・ピックアップ

news094.gif ストレス社会との付き合い方
政府がメンタルヘルス検査の義務化を検討しています。しかしうつになった後だけではなく、なる前の予防も大切なのではないでしょうか。(5/24)

news094.gif 「思いやり経営」のススメ
産学・NPO連携の民間団体が先頃、「思いやり経営」という観点で評価した指標や企業ランキングを発表した。企業のマネジメント力を知る手立てとして注目されそうだ。(5/24)

news094.gif テレワークが労働者のマインドを変える
テレワークが普及すると、労働者の評価は従来の「時間×生産性」から「成果」へと変化する。時間や場所を自分の裁量でコントロールできる変わりに、成果を最大化するために労働をマネジメントする能力とマインドが労働者には必要になる。(5/23)

news094.gif 求む、クックパッド男子
高身長も高学歴も高収入もいらない。私が男性に求めるのは「料理の腕」だけです。(5/18)

news094.gif 37歳の常識――我々は一生学び続ける
学び続けなければ衰退するのみだ。(5/18)

オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。

Special

- PR -

サイトマップ | 利用規約 | プライバシーポリシー | 広告案内 | お問い合わせ