KGR:blogアクセス「キーワードと記事」の記事力(利用者求心力)指標によるMuBlog記事の分析
(1)はじめに
Googleなどの検索エンジンで、キーワードによる記事検索をした結果、ヒットした記事リスト上での記事順番は「記事のランキング」として一定の意味を持つ。しかし、同じ条件でどれだけ競合する記事があったかによって、そのキーワードやヒットした当該記事の重みは変わってくる。これを比較検討するためにKGR指標を考えてみた。
用いたキーワード(群)は、「三十四万アクセス」で得た、MuBlogへのアクセス頻度が高いものを使った。
以下事例に示す指標は、数値が小さい方が、「キーワードと記事」との関連が深く、キーワードが妥当ならば、記事力(記事が持つMuBlog内外での利用者求心力)が強い。かつ同等条件における他記事との比較が可能となる。
(2)KGR指標の計算式
KGR指標→キーワード(群)でヒットした記事の検索エンジン内順位/ヒット記事総件数*100000
係数10万(100000)は、指標の簡明さの為に用いた経験的数値である。実験対象blogのMuBlogでは、ヒット記事総件数が564000で、ランキングが2位の事例があったことによる。現状ではこれがMuBlog内の「キーワードと記事」の重みに関して、上限と考えられる。
(3)表記事例
KGR指標(単位kgr、日付):小数点以下3桁で四捨五入し、小数点以下二桁表示とする。
キーワード{京都 大型書店}
2位/564000件 * 100000 → 0.35kgr(070428)
表記キーワード(群)で、2007年4月28日にGoogle検索した結果、ヒットした記事の総数が564000で、当該MuBlog記事「京都の書店」の順位は2番目だった。
(4)KGR指標のサンプル
2007年4月28日に検索エンジン・Googleから採取したサンプルデータから、blogアクセスキーワードのKGRを算出した。検索に用いたキーワードは、「三十四万アクセス:MuBlogの分析」の末尾から採った。
→下記表をクリックすると、フルサイズの表を見ることができる。
(5)KGR指標(サンプル)の分析
表から、KGR1位については、判定を特殊とした。初期の情報検索理論にもあるが、一般には一定の枠組みの中で極めて特徴的な現れ(他から外れた高頻度などを指す)を示すものは、特殊と判定するのが妥当と、経験的に言われている。その特徴の原因が有意味であることもあるが、おそらく特殊な条件の結果であろう。この場合、0.35kgr(070428)はGoogleによるヒット母数が56万となり、キーワード{京都 大型書店}は一般用語に近い。よって、情報発信をする個人の心性からみると有意義なことではあるが、KGR指標という客観的な数値判定から見るならば、ノイズと考えるのが妥当である。
(ただし、私はこの記事「京都の書店」への好感度は高い)
KGR2位~KGR8位までの記事がMuBlog総体の中で記事力(利用者求心力)が高いと考えられる。よってこれらの記事を、「高・記事力」を持つと判定した。4.5kgr(070428)~16.26kgr(070428)という数値は、今後の目安となる。
いずれの記事も、記事タイトルとキーワード群とが直接マッチしている事例が殆どなので、利用者求心力は、利用者が使い易いキーワード(思い浮かべ易い固有名詞)を持った記事タイトルによって、強化されると推測できる。ただ、この点については試験に用いたGoogle等の記事判定アルゴリズムとの関係があるので、ここでは省略する。
KGR9位以下を、「一般記事力」と判定したのは、このサンプルでは深く検証できないからである。試験的に分析するならば、次のような個別の特徴があると推測できる。
★KGR9位のキーワード「じょうしょうこうじ」、及びKGR10位の「うぶめのなつ」は共にひらがなでのアクセス事例である。KGR3位の「じぶり」はもともとの博物館名が「三鷹の森ジブリ美術館」だから、ひらがなないしカタカナ表記は明確な固有名詞の一部である。しかし、前2者は、こういうひらがな表記がインターネット上に普及していないのだから、該当するMuBlog記事のGoogleヒット順位が高くても(1位、2位)、MuBlog記事の真の記事力を表しているとは言えない。さらに、KGR9位以下の総てに言えるが、Googleによるヒット母数が3桁台で、上位に比較して小さく、KGR指標は大きくなる。これは比較する土俵が狭いと言えよう。
★KGR12位の「佐野邸」は、431.03kgr(070428)と、他の佐野藤右衛門関連記事に比べて、指標が悪化している。これはキーワードと記事とのアンマッチの好例となる。すなわち「佐野邸」という用語は、特徴的な固有名詞として特化するには至っていない。
★KGR13位の「リストランテ ティ・ボリオ・ベーネ」は、KGR1位「京都の書店」記事と対照的な指標数を出した。現状ではこれも判定として「一般記事力」に納めたが、2040.82kgr(070428)は特殊である。母数が98と非常に低いからそうなった。つまりそこにある総数98から、極めてマイナーな記事であることが分かる。
これは現実の記事を参照すれば明確だが、このイタリアン・レストランの開設時期が2007年1月ころで、MuBlog 記事投稿が同年3月と、観測日の同年4月を合わせて考えると、カレントな意義は非常に高いが、一過性の可能性もある。
インターネットメディアにおけるカレント(今、その時の、話題)な情報交換は重要なことではあるが、MuBlog自体は常に過去遡及、蓄積を目指してきたので(MuBlog:blogの情報処理ツールとしての可能性)、この場合、個人的には非常に好感度の高い記事だが、KGR指標による記事力が低い結果は、KGRの妥当性を示していると、考えている。
(6)まとめ
MuBlog(PML:個人電子図書館と規定する:MuBlogのブロッグパーツについて)の記事にアクセスするキーワードを用いて、検索エンジンGoogleでの、同キーワード群による記事順位と、ヒット総件数を得た。
この記事順位とヒット総件数から、KGR指標を作成し、これをMuBlog記事自体にフィードバックさせて整理した。
この結果から、
インターネットという客観的な「世界」の中での、個々のMuBlog記事の位置づけを見た。KGR指標の導入によって、検索エンジンでの順位のみで記事の意義を計るだけではなくて、実質的な記事力(利用者求心力)の尺度を得ることができた。
ここに若干の想念を披瀝するなら、インターネット上の記事にあって、利用者の想定するキーワード群と個々記事とは「一体のもの」であると考えている。たとえば、「キーワード:長尾真」と「記事:長尾真のノート」は、両者が独立しているのではなくて、インターネットという仮想空間内に情報受容者と発信者の間に、ペアで「新たな生を得た」と、いえよう。
今後は記事分析に、積極的にKGR指標を用い、その妥当性を見ていくことにする。
なお、Googleを用いた事情は、注記に記した。
(7)注記
KGR命名由来
KeyWord群のGoogleによるRanking(ratio)
検索エンジンGoogleを対象とした理由
MuBlogをアクセス対象とした使用検索エンジンの統計を見た結果、下記のように過去4ヶ月の実績でGoogleがほぼ60%の使用率を得ていた。これは、MuBlogを検索する利用者の過半数がGoogleによるものと判定できる。
MuBlogを検索したサイト(検索エンジン)の統計
解析対象期間: 2007年1月1日(月) ~ 2007年4月28日(土)
集計対象アクセス数:36,229
(この期間、実際のページアクセス数は88075で、訪問者総数は62798だった)
(このことから、36229/88075*100→41%の利用者が検索エンジンを使用している)
順位/検索/割合
1 Google 21,410 59.1%
2 Yahoo 9,370 25.9%
3 goo 1,697 4.7%
4 MSN 1,359 3.8%
5 BIGLOBE 1,222 3.4%
6 @nifty 575 1.6%
7 Infoseek 321 0.9%
8 Excite 124 0.3%
9 NAVER 55 0.2%
10 livedoor 51 0.1%
| 固定リンク
「情報図書館学」カテゴリの記事
- 小説木幡記:アップル社のiBooks-Authorなどでうむふむ(2012.03.10)
- 小説木幡記:電子書籍と電子図書館はPMLで一つのものなのだ(2011.06.01)
- 小説木幡記:メディア変換の中での紙や電子書籍(2011.05.01)
- 小説木幡記:海辺の駅図書館(2011.03.01)
- 葛野司書・共同演習(2010後期)情報サービス・資料組織Ⅰ (2010.12.26)
「Blog統計」カテゴリの記事
- 百二十万アクセス(120万/全体205.8万):MuBlogの分析(2011.06.28)
- 200万アクセス(Asajiharaサイト全体/MuBlog他)(2011.04.17)
- 190万アクセス(Asajiharaサイト全体/MuBlog他)(2010.12.20)
- 百十万アクセス(110万/全体189.9万):MuBlogの分析(2010.12.19)
- 小説木幡記:2010/12/21(火)MuBlog統計のおもしろさ(2010.12.21)
「KGR」カテゴリの記事
- 小説木幡記:20070603(日)浄霊と除霊とGoogle革命(2007.06.03)
- KGRノート:仮想レファレンス(2007.05.25)
- 「地名 桜」でのGoogle検索記事(MuBlog)のKGR指標による分析(2007.05.11)
- 新語「KGR」(指標)の、検索サイト{Google, Yahoo, goo}での出現比較(2007.05.03)
- 小説木幡記:20070501(火)長期休暇とKGRメモ(2007.05.01)
この記事へのコメントは終了しました。
コメント
「アフィリエイト……」殿
トラックバックありがとう。
貴殿の記事を読みました。
示唆に富む内容がいろいろありました。
一般に、KEI値については、そういう考え方が、一種の複雑さを含むので、私は思考の中で、採用する考えはありません。情報の海に対しては、屁理屈の過ぎた理論は、無力であると、かねがね考えて参りました。
さて、
「アフェリエイト」という目的の中でのモノの考え方として、現実的な処方であると、貴殿の記事を読んだわけです。
当該記事を御覧になればお分かりと思いますが、Muの志向するところは、アクセス数を稼ぐことにはありません(現実的思考では、あり得ないとお考えかも知れませんが、事実です)。Muの生成する記事が、客観的にインターネット世界でどのような扱いを受けるかという点で、KGRという実に単純な指標を使い出したわけです。
たとえば、実にマイナーな記事を書いて、それが一位になったとき、KGR指標の大きさは単純に意味をもってくるわけです。
目的が大きく異なっても、世間にあるこけおどしの学術的色彩や、逆に占いじみた嘘っぱちとは違った所で、実質的な経験則による手法は似通ってくるモノと考えます。
そう言う意味で、貴殿の記事は当方記事にとって、意味を持つと思い、トラックバックを謹んで受け取った次第です。
では
投稿: Mu→アフィリエイトで稼ぐブログ | 2007年5月 1日 (火) 18時39分
コメント、ありがとうございました。
実質的な経験則の中にこそ真実があるというご指摘は、
その通りだと思います。
有名な法則は、実用性や共感性があるから
有名になったというのが私の持論です。
今後ともよろしくお願いします。
投稿: 知ろうと | 2007年5月 2日 (水) 10時46分
「知ろうと」さん
わざわざの来室ありがとうございます。
ネット社会はいろいろな人にいろいろな楽しみや苦痛(笑)や、哀しみや、怒りをまきおこす巨大な、即時的な世界ですね。
Muはそういう世界で、いろいろ実験して、楽しんでいます。「知ろうと」さんも、沢山稼いでください(爆笑)。
しかし、秘伝をあみ出したなら、研究者以外の場合、極秘になさったほうが、競争力がつくでしょうね。
ただし、こっそり、Muには教えてください。
想像
GoogleのメインDBに潜り込んで、密かに、ランキングを操作する仕掛け人がこの世にいるのかもしれません。おもろいですね。
投稿: Mu→知ろうと | 2007年5月 2日 (水) 12時53分