« 日本・中国文学・評論:孔子伝/白川静 | トップページ | うじし・しょくぶつこうえん(上):宇治市植物公園(上) »

2004年5月25日 (火)

MuBlog検索システム:MuDB2004

 以前からBlogメモで記してきた、膨大な(?)MuBlogやJO-Logを自由自在に検索できるシステムが、やっと形を顕してきた。
 blogは日記を柱としたシステムだから、過去の蓄積よりも「最近の記事」を見るのに便利になっている。過去はカテゴリーと、バックナンバーと日付。日付も、普通では当月分だけしか見つかりにくい。

 やぼったいシステムだが、ようやくできかけてきたので、公開する。

MuBlogの記事を検索

☆MuBlogの記事やコメントを、適切な言葉で検索できます。
☆試験中です。
☆2004年3月7日~5月21日までのデータ。

↑こんなリンクリストがMuBlog画面のサイドバーにありますから、クリックしてください。
使い方は? 
0.記事を捜すか、コメントを捜すか、選んでください。
1.空欄に適当な言葉をいれて、下段の「この条件で検索する」を押す。
2.結果がリストされたら、MuBlogと言う文字がリンクしてあるので、クリックすると本当のMuBlogに戻るはずです。

注意:格納データの範囲に注意してください。ないものは出ません。
注意:MuBlogリンクをクリックしても、正しく本当のMuBlog記事にもどるわけでもないです。
注意:  近接記事に到着することがママあります。
     本当のMuBlogの上段で、前後の記事を見てください。
注意:  該当アドレスが不明のこともあります。あきらめましょう。

コメント注意:執筆者は名前を変える毎に、変えた名前で捜してください。
コメント注意:本物のMuBlog記事に帰るかどうかあてになりませんから、ましてコメントをMuBlog内で捜すのはしんどおすえ(笑)。記事一つ一つを、本物のMuBlog内で直結させるのは、このシステムではいたしません。

総合注意:お気づきの点、運用の仕方、システムの改良など、なんなりとコメントください。だいたい一週間単位で手を加えていきます(日曜SE)。
 データ更新も一週間単位で行う予定です。
 この自家製DB、名称は、ああそうや「MuDB2004」にしませう。

修理予定:まあ、なんとか、ココログの「固定アドレス生成規則」を、推理し、完全なものにしたいです。
修理予定:せっかくの、リレーショナルDBなのに、記事とコメントを分離分割したシステムになっていますね。これはね、うむうむ、事情がありまして。まあ、そのうち、オプションで完全システムをつくります。

告知:常連のコメンテータさん達へ:もし、blogをたてて、膨大な記事になってきたら、このMuDB2004に、ちゃんと格納してあげますよ。それまでに、せいぜい、このシステムを使いやすくするために、ご助言くださいませ。

技術メモ:固定リンク(アドレス)生成規則の落とし穴

 タイトルから半角文字を抽出しアドレスを造るのと、順番(シーケンシャル)に造るのは、ほほほ、上手にできた。
 しかし、 
 時々シーケンスが狂うのは、削除データがあるからと分かった。そうなんだ、多分PostgreSQLかなんかを使っている(オラクルとか、なんでも)ココログは、じゃなかった、RDBMSは削除データ領域を普通は自動開放しない。データを再構築しないと、ゴミがすてられない。おお、昔なつかしい「ゴミ掃除」問題に直面した。
 つまり、削除データを最初は込めてココログは固定アドレスを作成する。
 そのうち、私がある記録を削除し、そしてダウンロードする。順番が狂うのは当たり前や。

 当方が、再構築すればよいのだが(そうすると、固定アドレスもきれいさっぱり穴のない新秩序でできあがってくる)、一々、それは面倒だ。
 なんとか、してみよう。
 削除データがあることは、固定アドレス情報がないのとおなじく、ダウンロードデータでは判別できない。

 ああ、奇策があった、ぞ。しかししんどいな、そこまでするなら、ココログやめて全部自製でやればよかろうに。・・・・

 つまりな。当方作成の固定アドレスを、目に見えないところで、10回程度テストさせるのや。
 当方の持つタイトルと、固定アドレスで得た本物MuBlogのタイトルを比較して、マッチしなければ、
 前後左右にずらして再検索をかけてみる。ヒットしたら、ピンポーン。

 むむむ。やっぱり、じゃまくさいな。

|

« 日本・中国文学・評論:孔子伝/白川静 | トップページ | うじし・しょくぶつこうえん(上):宇治市植物公園(上) »

Blogメモ」カテゴリの記事

コメント

 すごい~!私、Joさんのお料理教室に興味があって、コメント者「Jo」、キーワード「鰹」で検索したら、ヒットしました!
 ありがとうございました。早速、メモらなきゃ・・。 

投稿: wd | 2004年5月25日 (火) 19時38分

  検索してみました!!
 自分のコメントがズラリと並ぶのを見てしまいました。
 恥ずかしいです。でも、おもしろいです。

投稿: 羊 | 2004年5月25日 (火) 21時21分

WDさん
 JOと鰹なんて、よい組合せです。
 役立ててください。

投稿: Mu | 2004年5月25日 (火) 22時46分

羊さん
 こういう仕組みは、ずらりと並ぶという所にも意味を感じます。

投稿: Mu | 2004年5月25日 (火) 22時48分

宴会終わり、帰宅。
出雲、三輪山、ヒットしかし、箸墓、箸墓古墳はあかん。京極夏彦もあかん。入れ方が不味いのやろか?
しかし、先生頑張るな~~~感心するは。病気せんといてや。

投稿: jo | 2004年5月25日 (火) 23時13分

JOさん
 ありがとう。
 主記事部分ではね、カテゴリに「地図」がつく記録は軒並み、地図のアドレス部分で切断されていて、本文が未格納になっておった。
 すぐに治るが、プログラムレベルの修正は数日ちょっと休憩します。
(コメントを分離する方がややこしかったので、主記事はやっつけだね)

投稿: Mu | 2004年5月25日 (火) 23時32分

Muさんへ

 記事検索の「著者」キーの使い方が、よくわかりません。

 著者キーに「折口信夫」とか「白洲正子」を入力しても、「そんな記事、おまへん。」と出てくるのですが、「適当な言葉」のキーに上記の二名を入力すると、ヒットします。
 著者キーには「Mu」としか、入力できないんでしょうか?

投稿: wd | 2004年5月26日 (水) 10時56分

WDさん
 記事検索「著者」は記事の著者です。現在はMuしか入っていません。そのうち、JOとかXとか◎とかが入るでしょう。

 そうですね。図書館学のセンセなんだから、扱った図書を検索出来るようにしてもよいですね。
 現在ですと、タイトルが、書名/著者、の形式で入っています。

 日本・文学・評論:かくれ里/白洲正子

 だから、
 「かくれ里/白洲正子」と入れればでてくるはず。

投稿: Mu | 2004年5月26日 (水) 12時13分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/22035/653162

この記事へのトラックバック一覧です: MuBlog検索システム:MuDB2004:

» 固定アドレス生成規則が変わったようだ [MuBlog]
 ココログのMuBlog データを月に数回ダウンロードして、MuDB2004システムに格納してきた。  そのとき、MuBlog内での固定アドレスを、MuDB20 [続きを読む]

受信: 2004年12月17日 (金) 09時46分

« 日本・中国文学・評論:孔子伝/白川静 | トップページ | うじし・しょくぶつこうえん(上):宇治市植物公園(上) »