MuBlogの検索についてのメモ
記事数が100を越え、コメントが300になり、アクセスが一万を超えてくると、最初の意図とは異なり、大所帯になってきた。
普通のデータ管理なら500や1000件のレコードくらい、何の気無しにスッピン・テキストのままでも扱えるのだが、ネット上のデータは、アクセススピードがおうおうにして遅くなり、反応が数十秒、一分を越えることもある。回線は葛野では100Mbpsだから、遅いわけではない。要するに、中央のサーバー群がメンテナンスや集中アクセスで反応が鈍くなるだけである。
つまり、せっかくデータを格納整理していっても、いまのままでは、蓄積を有効に使い切れない。唯一の頼みは、カテゴライズされているので、そのカテゴリーが明確なら扱い切れるのだが。そのカテゴリーについても、現在システムの平面的な二次元リストでは、そのうち複雑怪奇なものになってしまう。
外部検索エンジンも最近は、Googleで記録へ直接アクセス出来るようになり(数週間前までは、MuBlogトップにアクセス出来るだけだったので、掲載日が古くなると固有記録へのアクセスができなくなった)、重宝はする。しかし、これもそれを使い勝手よくするには、限界がある。
よって。
当初予定通り、MuBlogを完全にデータベース、つまり、知識樹ないし知識DBとして洗練させていく考察をはじめなければならない。
それで以下のいくつかの方法を考えてみた。
(1)PostGreSQLとアパッチで自製する
これは、根気よく時間をかけないと頓挫しそうである。特に現在一番課題に思っている、ユーザーインターフェース構成が、泥沼ないし熱狂に入り込み、肝心のコンテンツが製作できなくなる。
(2)ニフティーのTypePad改良を待つ
これが一番気楽だが、限界はある。
(3)blog用のアプリケイションを組み合わせる
これが自然な道だが、作成者の多くはなんとなく若者や、オタクが多いので、その世界に入り込むのがすでに無理がある。十分深呼吸して対峙したなら、すばらしい機能や発想が多くて豊かなのだが、システムにも文化がある。異文化に接し吸収し自分のものにしていくには、加齢。
(*)旧来手法でこつこつと
で、そうするつもりである。
めちゃくちゃ古い手法だが、メンテナンスが楽で、あらたに勉強することが少ない(なんか、退嬰的じゃね)。
私の方法は古来、手堅い手法が多い。つまりアクロバットはなくて、愚直。
おお。自分のでやるのが一番気楽。
新たな発想はない。
ただ、その分、コンテンツや記録管理に全力を注げる。
そうしよう。
MuBlogのための検索システムならびにデータメンテナンス:システム概略
1.定期的にMuBlogデータのダウンロード
差分処理などは当面放念する。
2.KT2にモジュールを一つ追加
XML表記からタイトルやカテゴリーを切り出し、別の正規化をほどこす。
テキスト全体に、位置情報としてタグ付きで、語の切り出しをする。
この際、BSH4などの主題ツールを辞書にしてもよかろう。
3.RDBに本文と切り出し語を格納
ファイルメーカーを使うのが一番気楽である。
必要とするリスト書式なども簡便に何種類もすぐにできる。
なによりもWeb発信が気楽
4.ファイルメーカでの情報検索&リスト作成。
Webでパスワード付き、作業をできるようにする。
ただし、検索についてはフリーにし、MuBlogのツールリストからリンクする。
*これくらいなら、その気になれば短時間で可能
MuBlogデータを手動で定期的にダウンロードするのがまことにヘボイが、あとは一連の手続きだから、あっという間に運用できる。
まあ。よいか。
この程度にしておこう。
あっつ、写真はどうしよう。うむ。
(ファイルメーカーでは写真も扱ってきたが。うむむ)
(注意しないと本末転倒。MuBlogは簡便さ、保守の容易さ、双方向リンク、カテゴリ構成、ネット上での相互関係、標準化などの意図で使い出した。なんでもかんでもファイルメーカでやり出すと、コンテンツが少なくなり、複雑さがまし、MuBlogの意味を喪う。これらの、分岐点をちゃんと心得ておこう)
| 固定リンク
「Blogメモ」カテゴリの記事
- 小説木幡記:2009/12/05(土)静かなubuntu狂乱(2009.12.05)
- 小説木幡記:2009/02/05(木)Google Earthで火星を見たり、最中を食べたり、忙しい(2009.02.05)
- 小説葛野記:2009/02/04(水)朝霧の宇治からNetbook 28800円(2009.02.04)
- 小説木幡記:2009/01/06(火)年頭の失念事項(2009.01.06)
- 小説木幡記:2008/10/20(月)インターネットが消えた日:タイムマシンに乗って(2008.10.20)
この記事へのコメントは終了しました。
コメント
せんせ、私のお笑いBlogもついでに、整理してくれませんか? ほんま感心するな~~、あなたの本職は何ですか?
投稿: jo | 2004年4月30日 (金) 13時25分
JOさん
私の旧式blog検索システムができたら、JOさんのも毎回ダウンロードして、システムにいれといたげます。JO さんや利用者は、リンクで知らぬ魔に葛野研サイトに取りこまれ、検索し、再び、JO-blogに帰るという段取りです。
私の本業ですか?
私は日本パソコン史上、黎明期に、MDB11という疑似リレーショナルDBを造って、FM8やFM7やPC8000やらで都合五千本走らせました。なんちゅうか笑けますね。
BASICインタープリータで、32KB程度のメモリーで、256KB程度のFDで、動くのですよ。FM8は漢字ロム搭載が早かったので、1文字入力だったけど、DBのレコードとして日本語文字格納可能。
その上・・・ははは。簡単な画像ファイルも格納して、検索スピードは一瞬、一息で完了。
・・・
嘘に聞こえるだろうね。
でも、本当です。
要するにファイル処理を巧妙に巧妙に組み合わせて、やった。(アクセス手法として、ダイレクトとシーケンシャルとを、実に、ふふふ、巧妙に組み合わせて記録管理したんだよね)
ある程度自由度のあるレポートライター付きだと言ったら、死にたくなるでしょうね。
あのころの私が単に夢見がちな30中年だったなら、梅翁があれこれ、便宜を図るわけがない。ちゃんと、スキルあったんよ。
(つまりな、大型計算機がPL1やCOBOL使って世間一般にやってたのを一挙に32KB(メガじゃないよ、キロバイト)メモリーで出来るようにしたわけ)
MDB11って、当時のソフト年鑑捜せば、ちゃんと載っております。そうやね、20数年ほど大昔のことやね。
あ、しまった過去の自慢話になってしもうた。
ゆるせ。現在を、誇るなにものも無きゆえに、ついつい過去逃避をはかる。加齢じゃのう。
投稿: Mu | 2004年4月30日 (金) 16時12分
驚き桃の木山椒の木やな~~。梅安さんより先生のソフト技術者としての力量と才能とヘビーユーザの話は聴いていた。恐るべきソフト技術者なんですね。尚且つ、幻の古代王朝のゲームソフトも創作されるし、作家としも本を書かれるし、本職もあるし、日本の(関西の)レオナルド・ダ・ビンチおじさんなのね。他に隠している事無い?? 何か有りそうやな、そうそう写真家でもありましたな、失礼、特に美女の巫女はんとるの名人でしたな。私も、昔(34年前やけど)F230-15という計算機は32Kbでな~割り出すとメモリ消えるボロでしたけど、それのオンライン版OS(M15)を作りました。IPLから、割り込み制御、タスク管理、入出力管理(BLCPと呼んでいたな)、メッセージハンドラー・・・・・・懐かしい32Kbのメモリで256Byte単位でオーバレーを無茶苦茶繰り返していたな~~。メモリが未だコアメモリと違ったかな~~。やめとこ!
投稿: jo | 2004年4月30日 (金) 16時55分
JOさん、ジジイ同士が過ぎ去った過去に陶酔するのはホンマにみぐるしもんやと、かねがねおもうてきたけどな。
そやけど、そやけど、ぐすん。
いま、F230-15って、でましたね。これ、私にとってなんちゅうか、先輩の大学図書館にあってな、夜中高速とばして、そこ行って、最小コボルでシステム触る練習してた。
あのな、ディスクが5MB(以前のパソコン時代とは違う話)で、ケチでカードリーダがなくって、おお、紙テープやったで。ハサミで切り張りしてなぁ。COBOLって大時代的言語を駆使しておりましたねぇ。
あの、OSでしたんか。ほたら、MDB11時代より約さらに10年前。古王国時代や。わたしがパソコンDBでMDB11ひっさげて講演してたのは、それから1000年後、ラムセス2世時代(なんか、授業と混乱してきた!)
すると、・・・やめときまひょ。
ほんま十年先が怖いわ。
寄り集まると、F230-15がどうした、TOWNSが8MBものメモリー載せたとか、MDB11がどうした、SMC70とTOWNSとどっちが名機やったか・・・怖いな。
・・・
素面でこんなこと話せるのはblogのおかげや。
酒席だと、みんなてんでばらばら独り言言って、陶酔し寝てまう。
投稿: Mu | 2004年4月30日 (金) 17時10分
レオナルドのおじさんもF230-15御存じでしたか? 世の中狭いもんですな~~。あのハードは薬師はんという御仁が設計したんやけど、OSがスパイラルというバッチ処理でチョロチョロしか動かん代物やった。オンラインで回線繋いで都市銀行のメインコンピュータを結合して為替交換するには、ハードを120%使い切るOSの設計が必要でした。ハードで色々と設計ミスがあったな~、タイマーと外部記憶の割り込み、回線の割り込みが起こると、どれかの割り込みが消えるんや~~2晩徹夜して見つけたな~~けど、あの頃も無我夢中やったな。やめとこ終わらん!
投稿: jo | 2004年4月30日 (金) 17時35分
JOさん
古墳少年→ナンパ青年?(この時期不明)→経済学徒→メカじみたSE(ハードディスク外して油さしてたような雰囲気)→ソフト行商人→プロヂューサー→だんだんほら吹き男爵→社長→?
人の世の、流転ですなぁ。
投稿: Mu | 2004年5月 1日 (土) 05時54分