« 小説木幡記:20070430(月)由布姫と無聊GW | トップページ | 十三の冥府(じゅうさんのめいふ)/内田康夫 著 »

2007年5月 1日 (火)

小説木幡記:20070501(火)長期休暇とKGRメモ

 最初の起床は午前三時半だった。ジュースを飲んで、さてと思ったが、もう一寝入りしたら、午前五時だった。
 塩水療法していた「グリ銀」君がみまかった。合掌。
 と、あれこれ追悼と思ったが、止めておく。思い出すと寂しい。

 『夜麻登志宇流波斯』の第70回目を書こうとしたが、これは「お知らせ」で連休中不定と書いていれておいた。あの作品は書くのも読むのむ相当に重いし、キツイので、お休みくらいは自由にしようと突然思ったわけ。日曜作家、早朝作家の気楽なところを有効利用した。

 さて。湯治にでもでかけて心身楽にしましょう。

 この四月は例年以上にしんどいことが多かった。何が原因? と分析しかかったが曖昧にしておくことにした。つまりは、虚弱体質の上に、昼の仕事の授業も会議も内容が難しかったからなのだろう。いずれも、本当は昨日今日のことじゃないのだから、軽く考えてもよいのだが、それでもちゃんといけるのだが、人の心はおかしなもので、晩節を汚してはならぬという、曖昧な気持がむくむくわいてきて、いろんなことを検証し始めたのが、しんどい原因だったのだ。

 検証というのは、自己反省とか他人批判のことじゃない。両者はペアなんだろう。自分の方法論と他人や組織の方法論はペアなんだ。作家と作品と読者の関係にも通じる。なにが最良というよりも、その仕組みをちゃんと理解しておきたいという気持が、この四月に湧いた。

 嵯峨野にうまい蕎麦をだす店がある。遠い。車で通う。美味い。若干高価だ。
 美味いと感じるには年季がいる。蕎麦をたべたこともない宇宙人には無意味な世界だ。
 しかし、美味いと思わせる蕎麦を作るにも年季がいる。味オンチの者にはどんな風に造っても無意味だろう。
 美味いと思う余がいて、美味いと思わせる蕎麦をつくって、そこに若干の高額や、若干のガソリン代を媒介にしたとき、初めて余は満願の笑みをみせ、店主も深々と「また、お越し下さい」と声をかける。

 余と蕎麦とはペア。うまくスリ合わさったとき、双方に利得がある。
 組織と余。
 余と学生(授業)

 情報検索も、そういうことなのだろうと、深々と味わった。現代は用語(自然語)による検索エンジンが普及している。昔から、精度がどうの、網羅性がどうのと、その世界ではいろいろ研究されてきた。
 数日前に、KGR指標という、実に簡便な方法論を考えてみた。
 そこで二つ気がついた。

1.用語と記事とは、ペアなんだ。
 適切な用語でGoogleなんかを使った時に、適切な記事が出たときに、KGR指標は適切になり、つまり、適切な情報検索をしたことになる。

 ああ、なんとなく禅問答じみてきた。
 つまり、適切な用語を思い浮かべない利用者にとっては、適切な記事も無意味と言える。
 さらに、適切な用語を使っても、適切な記事がでない検索エンジンは、無意味と言える。
 適切な用語を用いて、適切な記事を得られたとき、その利用者は幸せだし、記事作成者もハッピーだし、検索エンジンも上等なんだ。

 用語で検索するという現状では、{用語と記事}とは、一体のものなんだろう。両者をわけて考える「検索理論」は袋小路に入ってしまうでしょうなぁ。

2.KGR指標への利用者視点
 余がKGR指標を考えていたとき、それは情報発信者の立場として、MuBlogの個々の記事がこのインターネット世界でどのような位置を得るのかという観点だった。
 その記事を、そのスジの教授に見せて「ちょっと、どうだろうね」と聞いてみたら、すぐに返事があった。そしたら、ああ、やはりそのスジの教授だけあるよね(笑)、意外な回答が寄せられて、余は愕然とした。

 それは、こうだった。

Mu先生、面白いですね。
つまり、グーグルで検索するときは、ヒット数を1万から10万までくらいのヒット 数になるように、絞り込む(あるいは、一般的な言葉にする)、そうしたら、1~1 0番目くらいまでに、必要なサイトが出てくるということでしょうか?

 上記はもちろん、極めて、マイナーな対象を探す場合には補正しなければならないが、一般的な利用者検索として、Googleの場合には当てはまることだろう。
 カレント(今、とれとれの、新鮮な)な情報検索は別件として、
   ある程度の母数(検索総件数)がないと、安定した記事は見つからない。
   母数が50万とか100万の場合には、検索用語(群)が不適切。
   この両者の兼ね合いが、KGR指標で分かるということだ。
   余の推測では、おそらく、KGR指標が、1~100くらいの間に、良い記事がでてくるだろう。

 ただし、当たり前だが、Google以外では、KGRの係数10万は変更する必要がある。
 また、KGR指標は、検索用語群と、検索日時によって成立するもので、不変のものではない。
 (余が、しつこく、3.91kgr(070430)というように、日付を付けたのはそういう意味である)
 (KGR指標の時系列遷移なんて、おもしろいが、ちょっとシンドイ)

 さて、長い休暇。
 湯治、小説、ビデオ、散歩。いろいろある脳。

|

« 小説木幡記:20070430(月)由布姫と無聊GW | トップページ | 十三の冥府(じゅうさんのめいふ)/内田康夫 著 »

小説木幡記」カテゴリの記事

KGR」カテゴリの記事

コメント

 あのう・・。何度読んでも、難しいのですが。

以前、(Google革命)というTV番組を見て、ぞっとした覚えがあります。
Google検索によって、(検索順位15位以下はこの世に存在しないのも等しい)とか、検索順位を上げるために、トップ記事にキーワードをたくさん埋め込んだり、参照リンクをたくさん貼らせたり、検索順位を上げるためだけの専門企業まであることを知りました。

 一つ一つの内容が精査されて、順位がつけられている訳ではないんですよね。

 う~ん。でもこれだけの膨大な情報量から、何かを見つけ出そうとすると、検索エンジンに頼らざるをえないことはわかりますが。
 私の経験から言うと、瞬時に得られた情報は、あてにならないものが多くて、地道にコツコツ調べていると、いいものに巡りあえるなという印象です。

 本題とはずれてしまったかもしれませんが、難しいです・・。

投稿: wd | 2007年5月 1日 (火) 21時09分

Wdさん、おっしゃりたいことの半分は分かり、半分は誤解があると考えます。

1.アクセスを増加させるためにKGR指標を考え説明したわけではないのです。

 以上の誤解がもしあれば、弁明ではなくて、説明いたします。

* Mu記事のタイトルにキーワードが多いのは、情報検索や論文造りに昔精出した者として当然なのです。記事は純粋のエッセイ以外は、内容を明示するのが多くの世界での共通理念です。一般記事やレポに、小説のように、「あれから」、とか、「思うこと」とか、曖昧なタイトルを付けると、馬鹿扱いされますし、私も学生のレポ指導には、タイトルを明示することを原則としています。

 だから公開する限り、タイトルに内容を格別に表す用語を用いるのは、太陽が東から上がるくらいに、当然のことと思っています。

(特殊な、文藝作品なんかのタイトルとは、ちょっと話が違います。しかし、タイトルで売る作家もおりますね。これは感性の問題ですね)

* 参照リンクとトラックバックでは多少異なりますが、これもハイパーテキスト(これはそういう言葉と思って下さい。Muの昔のテーマだったのです)、ハイパーメディアを作ることがディジタル情報の基本であるならば、張って当たり前のことです。このことによって、知識網を適切につくるわけです。

 ただし、それが原則とは言っても、それをどう適用するかはまた別の問題です。

 そういう企業(記事力をあげる工夫をする)があれば、それは代書屋とか弁護士と同じでしょう。個人や企業がノウハウなくて、できないから、お金をだして、Googleなんかで目立つように、記事を整形してもらうわけですね。法律問題わからないから、弁護士に頼むのと、なんの変わりもないです。一種のコンサルタント、虚業でしょうね(Joさん怒るだろうなぁ)。

 そういう企業は、キャッチコピーを作る人達と、根は同じです。それで、利用者がGoogleなんかの出力ランキングを信じ切っても、それは、「今再びの奈良」と聞いて、JRに乗る関東人と変わらないわけで、まるっきり嘘でもないわけでしょうね。

2.MuBlogは、アクセスはうれしいですし、アクセスされる記事をつくりたいです。

 しかし、無駄な参照リンクやトラックバックは、しておりません。黙っておりましたが、私はある種のディジタルメディアのプロなんです。つまり、そう言うことの行く末を考えて、それとなく子供達に説明して、給料をもらっているのです。

 だから、かっこわるいことはしたくないです。相手の記事を精査もせずに、無意味にトラックバックしたり、無意味に引用するのは、ド素人がすることでしょう。
 いや、ド素人にはド素人の理がある。その楽しみの邪魔はしたくない。ただ、Muはそんな、無意味なアクセスを延ばすために、そういう無駄はかっこ悪くてしたくない。そういうことなんです。

 コメントリストやトラックバックリストを一時的に外しているのも、そういう理屈からなのです(これはMuだけの考えです。つまり、コメントやTBを、第一面に積極的には曝さない工夫です。コメントしてくださっても、普通なら、その記事を見ない限り、コメント単独ではすぐには、その人しか分からない工夫の一つなんです)

さて。
 ちょっと急激な反応と思われるかも知れませんが、日頃かんがえていたことが、Wdさんの言葉に触発されて、出てきただけです(笑)。

 Google関係者が、ランキング10とか15位以下は存在しないと言ったそうですね。そういうふしもあるでしょう。多くの人は、第一ページしか読まないから。

 もともと、旧来の考えでは、検索して千も二千も、ましてや万も100万も出てくるサーチエンジンは、適切な解を見せる点からは欠陥です。ゴミ箱をゴミ箱のまま見せるようなものです。

 しかし時代は変わって、完全に近い網羅性をGoogleなんかは見せています。だから、10万、100万のオーダーで結果をだします。その網羅性の中から、選ぶのは、ランキングが指標になるわけでしょうね。

 10数年前までは、情報検索世界で、ランキングという考えは技術的になかなか使えなかったのです。

 ランキング設定方法は、いろいろあるでしょうが、専門的な論議なので止めておきます。ただ、タイトルの用語を重要語とみなして重みをつけるのは、普遍的です。

(Muは、某N先生のもとで、目次の階層による、キーワードの重み付けを、実は、実験していたのです(笑))

さて、結論。
 KGR指標は、ランキングをあげる為のモノでは毛頭ないのです。書いた記事が、ネット社会、Google社会でどんな位置づけを持っているかを知る指標なのです。その場合、記事と用語とはペアなんです。
 Googleで
 {ホットケーキ 京都}
 {スマート珈琲 京都}
 この二つを確かめて下さい。どちらのキーワードが、作った者にとって大切か。それは人によります。そして未知の人はどちらが好きか。

 Muが最初に確かめたのは前者です。スマート珈琲という店名を忘れても、ホットケーキは頭にちらついたわけです。

 しかし、コメントが長くなりすぎました。この件、しばらくおきましょ。疲れました(爆笑)

投稿: Mu→Wd | 2007年5月 1日 (火) 22時17分

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 小説木幡記:20070501(火)長期休暇とKGRメモ:

« 小説木幡記:20070430(月)由布姫と無聊GW | トップページ | 十三の冥府(じゅうさんのめいふ)/内田康夫 著 »