« 三十四万アクセス:MuBlogとその分析 | トップページ | NHK風林火山(17)由布姫の慟哭 »

2007年4月29日 (日)

KGR:blogアクセス「キーワードと記事」の記事力(利用者求心力)指標によるMuBlog記事の分析

(1)はじめに
 Googleなどの検索エンジンで、キーワードによる記事検索をした結果、ヒットした記事リスト上での記事順番は「記事のランキング」として一定の意味を持つ。しかし、同じ条件でどれだけ競合する記事があったかによって、そのキーワードやヒットした当該記事の重みは変わってくる。これを比較検討するためにKGR指標を考えてみた。
 用いたキーワード(群)は、「三十四万アクセス」で得た、MuBlogへのアクセス頻度が高いものを使った。

 以下事例に示す指標は、数値が小さい方が、「キーワードと記事」との関連が深く、キーワードが妥当ならば、記事力(記事が持つMuBlog内外での利用者求心力)が強い。かつ同等条件における他記事との比較が可能となる。

(2)KGR指標の計算式
 KGR指標キーワード(群)でヒットした記事の検索エンジン内順位/ヒット記事総件数*100000

 係数10万(100000)は、指標の簡明さの為に用いた経験的数値である。実験対象blogのMuBlogでは、ヒット記事総件数が564000で、ランキングが2位の事例があったことによる。現状ではこれがMuBlog内の「キーワードと記事」の重みに関して、上限と考えられる。

(3)表記事例
 KGR指標(単位kgr、日付):小数点以下3桁で四捨五入し、小数点以下二桁表示とする。
  キーワード{京都 大型書店}
  2位/564000件 * 100000 → 0.35kgr(070428)

  表記キーワード(群)で、2007年4月28日にGoogle検索した結果、ヒットした記事の総数が564000で、当該MuBlog記事「京都の書店」の順位は2番目だった。

(4)KGR指標のサンプル
 2007年4月28日に検索エンジン・Googleから採取したサンプルデータから、blogアクセスキーワードのKGRを算出した。検索に用いたキーワードは、「三十四万アクセス:MuBlogの分析」の末尾から採った。

→下記表をクリックすると、フルサイズの表を見ることができる。
Kgr_3

(5)KGR指標(サンプル)の分析
 表から、KGR1位については、判定を特殊とした。初期の情報検索理論にもあるが、一般には一定の枠組みの中で極めて特徴的な現れ(他から外れた高頻度などを指す)を示すものは、特殊と判定するのが妥当と、経験的に言われている。その特徴の原因が有意味であることもあるが、おそらく特殊な条件の結果であろう。この場合、0.35kgr(070428)はGoogleによるヒット母数が56万となり、キーワード{京都 大型書店}は一般用語に近い。よって、情報発信をする個人の心性からみると有意義なことではあるが、KGR指標という客観的な数値判定から見るならば、ノイズと考えるのが妥当である。
 (ただし、私はこの記事「京都の書店」への好感度は高い)

 KGR2位~KGR8位までの記事がMuBlog総体の中で記事力(利用者求心力)が高いと考えられる。よってこれらの記事を、「高・記事力」を持つと判定した。4.5kgr(070428)~16.26kgr(070428)という数値は、今後の目安となる。
 いずれの記事も、記事タイトルとキーワード群とが直接マッチしている事例が殆どなので、利用者求心力は、利用者が使い易いキーワード(思い浮かべ易い固有名詞)を持った記事タイトルによって、強化されると推測できる。ただ、この点については試験に用いたGoogle等の記事判定アルゴリズムとの関係があるので、ここでは省略する。

 KGR9位以下を、「一般記事力」と判定したのは、このサンプルでは深く検証できないからである。試験的に分析するならば、次のような個別の特徴があると推測できる。

 ★KGR9位のキーワード「じょうしょうこうじ」、及びKGR10位の「うぶめのなつ」は共にひらがなでのアクセス事例である。KGR3位の「じぶり」はもともとの博物館名が「三鷹の森ジブリ美術館」だから、ひらがなないしカタカナ表記は明確な固有名詞の一部である。しかし、前2者は、こういうひらがな表記がインターネット上に普及していないのだから、該当するMuBlog記事のGoogleヒット順位が高くても(1位、2位)、MuBlog記事の真の記事力を表しているとは言えない。さらに、KGR9位以下の総てに言えるが、Googleによるヒット母数が3桁台で、上位に比較して小さく、KGR指標は大きくなる。これは比較する土俵が狭いと言えよう。

 ★KGR12位の「佐野邸」は、431.03kgr(070428)と、他の佐野藤右衛門関連記事に比べて、指標が悪化している。これはキーワードと記事とのアンマッチの好例となる。すなわち「佐野邸」という用語は、特徴的な固有名詞として特化するには至っていない。

 ★KGR13位の「リストランテ ティ・ボリオ・ベーネ」は、KGR1位「京都の書店」記事と対照的な指標数を出した。現状ではこれも判定として「一般記事力」に納めたが、2040.82kgr(070428)は特殊である。母数が98と非常に低いからそうなった。つまりそこにある総数98から、極めてマイナーな記事であることが分かる。
 これは現実の記事を参照すれば明確だが、このイタリアン・レストランの開設時期が2007年1月ころで、MuBlog 記事投稿が同年3月と、観測日の同年4月を合わせて考えると、カレントな意義は非常に高いが、一過性の可能性もある。
 インターネットメディアにおけるカレント(今、その時の、話題)な情報交換は重要なことではあるが、MuBlog自体は常に過去遡及、蓄積を目指してきたので(MuBlog:blogの情報処理ツールとしての可能性)、この場合、個人的には非常に好感度の高い記事だが、KGR指標による記事力が低い結果は、KGRの妥当性を示していると、考えている。

(6)まとめ
 MuBlog(PML:個人電子図書館と規定する:MuBlogのブロッグパーツについて)の記事にアクセスするキーワードを用いて、検索エンジンGoogleでの、同キーワード群による記事順位と、ヒット総件数を得た。
 この記事順位とヒット総件数から、KGR指標を作成し、これをMuBlog記事自体にフィードバックさせて整理した。
 この結果から、
 インターネットという客観的な「世界」の中での、個々のMuBlog記事の位置づけを見た。KGR指標の導入によって、検索エンジンでの順位のみで記事の意義を計るだけではなくて、実質的な記事力(利用者求心力)の尺度を得ることができた。

 ここに若干の想念を披瀝するなら、インターネット上の記事にあって、利用者の想定するキーワード群と個々記事とは「一体のもの」であると考えている。たとえば、「キーワード:長尾真」と「記事:長尾真のノート」は、両者が独立しているのではなくて、インターネットという仮想空間内に情報受容者と発信者の間に、ペアで「新たな生を得た」と、いえよう。

 今後は記事分析に、積極的にKGR指標を用い、その妥当性を見ていくことにする。
 なお、Googleを用いた事情は、注記に記した。

(7)注記
KGR命名由来
  KeyWord群のGoogleによるRanking(ratio)

検索エンジンGoogleを対象とした理由
 MuBlogをアクセス対象とした使用検索エンジンの統計を見た結果、下記のように過去4ヶ月の実績でGoogleがほぼ60%の使用率を得ていた。これは、MuBlogを検索する利用者の過半数がGoogleによるものと判定できる。

MuBlogを検索したサイト(検索エンジン)の統計
  解析対象期間: 2007年1月1日(月) ~ 2007年4月28日(土)
  集計対象アクセス数:36,229
  (この期間、実際のページアクセス数は88075で、訪問者総数は62798だった)
  (このことから、36229/88075*100→41%の利用者が検索エンジンを使用している)

  順位/検索/割合
  1 Google     21,410 59.1%
  2 Yahoo      9,370 25.9%
  3 goo      1,697 4.7%
  4 MSN     1,359 3.8%
  5 BIGLOBE     1,222 3.4%
  6 @nifty       575 1.6%
  7 Infoseek   321 0.9%
  8 Excite       124 0.3%
  9 NAVER       55 0.2%
 10 livedoor    51 0.1%

|

« 三十四万アクセス:MuBlogとその分析 | トップページ | NHK風林火山(17)由布姫の慟哭 »

情報図書館学」カテゴリの記事

Blog統計」カテゴリの記事

KGR」カテゴリの記事

コメント

「アフィリエイト……」殿
 トラックバックありがとう。
 貴殿の記事を読みました。
 示唆に富む内容がいろいろありました。

 一般に、KEI値については、そういう考え方が、一種の複雑さを含むので、私は思考の中で、採用する考えはありません。情報の海に対しては、屁理屈の過ぎた理論は、無力であると、かねがね考えて参りました。

さて、
「アフェリエイト」という目的の中でのモノの考え方として、現実的な処方であると、貴殿の記事を読んだわけです。

 当該記事を御覧になればお分かりと思いますが、Muの志向するところは、アクセス数を稼ぐことにはありません(現実的思考では、あり得ないとお考えかも知れませんが、事実です)。Muの生成する記事が、客観的にインターネット世界でどのような扱いを受けるかという点で、KGRという実に単純な指標を使い出したわけです。
 たとえば、実にマイナーな記事を書いて、それが一位になったとき、KGR指標の大きさは単純に意味をもってくるわけです。

 目的が大きく異なっても、世間にあるこけおどしの学術的色彩や、逆に占いじみた嘘っぱちとは違った所で、実質的な経験則による手法は似通ってくるモノと考えます。
 そう言う意味で、貴殿の記事は当方記事にとって、意味を持つと思い、トラックバックを謹んで受け取った次第です。

では

投稿: Mu→アフィリエイトで稼ぐブログ | 2007年5月 1日 (火) 18時39分

コメント、ありがとうございました。

実質的な経験則の中にこそ真実があるというご指摘は、
その通りだと思います。

有名な法則は、実用性や共感性があるから
有名になったというのが私の持論です。

今後ともよろしくお願いします。

投稿: 知ろうと | 2007年5月 2日 (水) 10時46分

「知ろうと」さん
 わざわざの来室ありがとうございます。
 ネット社会はいろいろな人にいろいろな楽しみや苦痛(笑)や、哀しみや、怒りをまきおこす巨大な、即時的な世界ですね。
 Muはそういう世界で、いろいろ実験して、楽しんでいます。「知ろうと」さんも、沢山稼いでください(爆笑)。
 しかし、秘伝をあみ出したなら、研究者以外の場合、極秘になさったほうが、競争力がつくでしょうね。
 ただし、こっそり、Muには教えてください。

想像
 GoogleのメインDBに潜り込んで、密かに、ランキングを操作する仕掛け人がこの世にいるのかもしれません。おもろいですね。

投稿: Mu→知ろうと | 2007年5月 2日 (水) 12時53分

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: KGR:blogアクセス「キーワードと記事」の記事力(利用者求心力)指標によるMuBlog記事の分析:

» 競合数が10個以内のキーワードなら勝てる! [アフィリエイトで稼ぐブログ]
キーワード選びの際、競合をどう考えるかの記事です。ご参考までに。 [続きを読む]

受信: 2007年5月 1日 (火) 18時13分

» 新語「KGR」(指標)の、検索サイト{Google, Yahoo, Goo}での出現比較 [MuBlog]
1 はじめに  2007年4月29日に発表したKGR指標(インターネット上での記事の重み)について、同5月3日に3種類{Google, Yahoo, goo}の検索サイト(エンジン)で検索した結果、次のような結果を得た。用語「KGR」は意味的には新語なので、指標がどう出るか予測できなかったが、意外に上位にランキングされ... [続きを読む]

受信: 2007年5月 3日 (木) 14時08分

» 「桜 場所」でのGoogle検索記事(MuBlog)のKGR指標による分析 [MuBlog]
承前:新語「KGR」(指標)の、検索サイト{Google, Yahoo, goo}での出現比較 ↓初稿:2007年5月11日(金) (1)はじめに  MuBlogの記事には例年「桜」記事が多い。これは関西を中心に、各地へ観桜にでかけ記録したものである。2004、2005、そして2007年のものが多数ある。毎年春になると... [続きを読む]

受信: 2007年5月11日 (金) 01時56分

« 三十四万アクセス:MuBlogとその分析 | トップページ | NHK風林火山(17)由布姫の慟哭 »