« 清水寺の紅葉と自然言語処理・長尾真博士 | トップページ | blogの情報処理ツールとしての可能性(1)/谷口敏夫 »

2005年12月 3日 (土)

blogの情報処理ツールとしての可能性(2)/谷口敏夫

承前[目次
承前[その(1)]

3.記事間の連結について

 blogにはリンクとトラックバックという二つの記事間の連結機能がある。また特定主題記事に付加する用語群として「カテゴリー」設定がある。カテゴリーは別の用途に主眼があるが、これもまた記事間の同一テーマおよびその時系列連結と言える。

 リンクは、ハイパーテキストの基本的な手法として従来からあった。すなわち記事中に引用や参照をしたい相手の記事アドレスを埋め込むことによって、自由に他の文や記録を参照する機能である。

 トラックバックは、blogによって生まれた機能で、従来の用語を使うならば、逆リンク、相手通知型逆リンクと言える。すなわち、他のblog記事に対して、こちら側がそれを参照ないし注目しているというメッセージを、自分自身の記事アドレスを相手に送付することで、知らせる機能である。

 カテゴリーについては、主題を扱う点から別に記す。

 まとめてみれば、自らの記事を主体とすると、リンクは相手をポイントするだけであり、ポイントされた相手はその事実を知らない。トラックバックは、相手の記事の中に自らを参照するアドレスを埋め込むことによって、相手に注目していることを知らせる。

 この二つを利用することで、主体となる記事は、他の記事に対して双方向のリンクを張ることが出来るようになった。もちろん、トラックバックは受け取る方が制限を付けることができるので、トラックバックを一方的に送っても受け入れられないこともある。

 モデルとしたMuBlog(ニフティー社ココログ)では、主にこのトラックバックを自己blog内で、自己参照的に使用することによって、記事間の連結を強めた。以下にそのいくつかの事例をあげる。

双方向連結型
 長期間の連載記事を次々と、「承前」とトラックバックとで連結する。「承前」は直前記事を現し、トラックバックが次の記事をポイントすることに留意すれば、もっとも自然な連結である。しかし、目次記事を付けない限り、全体を見通すことはできない。
 事例:カテゴリー「NHK義経」(カテゴリーは途中から付け始めたので未完)、「NHK義経(18)清盛死す

円環連結型
 連続記事を次々とトラックバックで連結し、最後の記事を最初の記事に結んで、円環をつくる。
 連結には単純にリンクを張るだけでもよいが、トラックバックは当該記事に着目しているとき、どこからポイントされたかが分かるという利点がある。
 日々記事を書いていって、途中でまとめたくなったときに、よく使う。
 事例:カテゴリー「現代四物語」、スタートは「死の泉/皆川博子
 事例:スタートは「葛野2004P黒の製作(0)ケース

星連結型
 あらかじめまとまった記事を目次形式で連結させる。目次記事を読めば、当該テーマの全貌を見ることができるので、人には馴染みやすい。
 事例:「Mu氏その優雅な日曜:王仁博士、磐船神社、継体天皇・筒城宮

連結に関するまとめ
 双方向連結を通常のリンクと、トラックバックで行うので、上記の型はすべて同等ともいえる。ただ、blogは最初の記事を書く際にすべてを見通しているわけではなく、時系列にそって掲載していくにしたがって、途中いくつかの連結方式を選ばざるをえない。
 記事を内部で意味的にかつ掲載順に結ぶものとして「カテゴリー」設定があるが、これをもって同一記事をまとめるのは、ある程度記事数が増えないと、確定できない。だから、もともとある「カテゴリー」機能が主題を扱うに際して最良とは言えない。余程特定テーマでないと、間隔をあけた記事間の連結をカテゴリーだけに頼るのはこころもとない。記事観点は常に変化していくものである。

4.専用検索エンジン


 いろいろなblogサービスには、最初から簡単な内部検索エンジンが付いている。つまり記事にありそうな文字列を入れると、そのblog内で関連記事を検索するシステムである。サービスによっては、それを中央でまとめて管理しているので、特定サイトに行ってblog名を特定すれば、同じ機能を果たすことになる。

 MuBlogでは、全データのダウンロード機能と、RSS(他者が対象記事をXMLタイプで入手できる機能)とを組み合わせ、記事を一括してデータベース化し、それに対応する検索システムMuDB2005を独自に作っている。
 自製のblogならば、そういう複雑な操作をしなくてもよいのだが、MuBlogの様に外部の高度なサービス(ココログ)を用いて、なお内部で自由な扱いを可能とするには、一定の工夫が必要となる。

 MuDB2005の要諦は、ココログの内部にあるダウンロード機能を用いて、本文+コメント、を一括して自製データベース(ここではファイルメーカ・Pro)に格納し、またRSS機能によって全固定アドレスを別途ダウンロードし、両者を固定アドレス・その他によって関係づけている。これをWebDBの手法で検索エンジンにまとめたものである。
 なお、
  専用検索エンジン:MuDB2005 はMuBlogのサイドバーにある。
  MuDB2005の製作ノートは、KadonoMuBlogにある。「MuDB2005システムについて

5.統計とまとめ


 MuBlogではアクセス数が一万回に達成した時点で、一週間前のアクセス統計を取っている。記事の内容や、世間の動きの中で、アクセスの多寡は変化する。相対的に、MuBlogはカレント記事よりも、過去記事へのアクセスが多く、作成者の意図に合致している面もある。ただし、不特定多数の利用者動向は、各々の意図にしたがって変化するものだから、作成者の意図とは全く反するところも多い。

  一万件アクセス 2004.04.27
  十万アクセス 2005.01.17
  十八万アクセス 2005.11.17

まとめ 
 blogは従来に比較して多くの人が使えるシステムである。本論ではこのサービスの世間的、社会的影響については触れなかったが、そこここで新しい動きが見られているようである。

 本論でもっとも主張したかったのは、blogが簡便な利用者志向の装いを示している裏には、伝統的なRDBMSを中心にした強固なデータベース管理システムが全体を支えているという事実の提示である。そこからいくつかの機能が生まれ、その中でも本論は、記事固定アドレスを利用し、リンクとトラックバックによって双方向の連結が容易にできる可能性。そしてそのリンク関係操作を目次記事などの挿入によって、より使いやすくするための工夫である。これらの総合利用によって、単純な日記アプリケーションが、知識を管理しうるツールに変化する。

 これらのより実際的な利用、応用については、MuBlogが実験室であり、資料組織(blog目録)などへの適用、情報サービスへの応用など、別途考えている。

参照記録


 (1)情報サービスの上手な利用法/谷口敏夫


 (2)SixApart本社


 (3)MovableType/SixApart社


 (4)ココログ/ニフティー社

付録


 一般的なblogシステムの構成


 現在の多くのblogシステムは、UNIX、Linux、WindowsXPなどのOS下で、次の諸要素を満たして運用されている。以下のリストでは最初にシステム名を上げたが、これらはblog運用システム毎に違ってくる。

 (1)MovableType(Six apart社): 普及しているblog運用システムである。
 (2)MySQLないし、PostgreSQL: 普及しているRDBMSである。
 (3)Perl: blogとデータベースの連携操作に有効なスクリプト言語である。(以下のPHPが不要な場合もある)
 (4)PHP: blogとデータベースの連携操作に有効なスクリプト言語である。(高度な連携操作にもちいる)
 (5)Apache: Web発信運用システムである。
 
 まとめてみると、blogシステム自身、blogで格納するデータを扱う物(RDBMS)、両者を連携する物(PHP)、Perl、そしてWeb発信を可能とする物。これらがまとまって、blogサービスが行われている。時期によっては変化するだろうが、これらは殆ど無償のソフトウェアであり、自製のblogを構築することも可能である。

 自製blog事例では、KadonoMuBlogをあげておく。
 KadonoMuBlog(http://www.koka.ac.jp/taniguti97X/KadonoMuBlog/)

|

« 清水寺の紅葉と自然言語処理・長尾真博士 | トップページ | blogの情報処理ツールとしての可能性(1)/谷口敏夫 »

Blogメモ」カテゴリの記事

情報図書館学」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: blogの情報処理ツールとしての可能性(2)/谷口敏夫:

« 清水寺の紅葉と自然言語処理・長尾真博士 | トップページ | blogの情報処理ツールとしての可能性(1)/谷口敏夫 »