固定リンク(アドレス)生成規則
さきほど詳細記事を書いていたら、飛んでしまった(悔しい)
この記事はカテゴリ「Blogメモ」の一連である。
手短に。
記事固定アドレスは、まとめてはダウンロードされない。XML出力がWebで15単位得られるだけ。と、判定した。
よって記事の固定アドレス生成規則をメモしておく。
自製データベースに記事とコメントを振り分けて、検索やソートリストを造る目処はすでにたった。実験開始している。
あとは、各記録の固定アドレスを、ダウンロードデータから再構築するだけである。
こうすれば、ココログMuBlogと自製データベース間をWeb上で往還できる。
なお、当然だが以下、生成規則のすべて推理推測。こういうルールを艱難辛苦、胃を痛めて作るのが醍醐味なり(マゾかいね)
記事自体からの固定アドレスの作り方。
1.一般には、月内の順番であり、先頭は「post.html」が末尾にくるが、以降は数が付加されていく。
http://asajihara.air-nifty.com/mu/2004/05/post.html
http://asajihara.air-nifty.com/mu/2004/05/post_1.html
2.タイトル中に半角文字があると、最大15文字まで使って生成している。ブランクは_としている。
「MuBlogの検索についてのメモ」
http://asajihara.air-nifty.com/mu/2004/04/mublog.html
「Cathay House・San Francisco:サンフランシスコの華園酒家」
http://asajihara.air-nifty.com/mu/2004/05/cathay_housesan.html
問題A:タイトルを変更したあとでダウンロードしたとき、ココログ固定アドレスは変化しないから、ダウンロードデータから固定アドレスを再現するのは不可能。そのデータだけを、再構築記録としてアップロードする機能は利用者に開かれないだろう。これは、別の曖昧マッチングみたいなのを考えるか、無視する。
問題B:タイトルからの生成固定アドレスが同一となったときは、多分テーブルで管理して、規則的に2番目を変えていくのだろうが、この規則は読めない。実験するまでもなく、無視しよう。
3.固定リンクアドレスが2の手法で造られた場合、1の連続性は欠番とはならない。
4.不明アドレスが一件でてきた。この規則はまだ分からぬ。月末データか、と推測したが、わからん。
http://asajihara.air-nifty.com/mu/2004/04/_.html
*.以上、非常にけったいな生成規則をもっている。2の方法が米国では本流なのだろう。つまりは、ハッシュ方式。しかし、月内を日内シーケンスにすりゃ、簡単なのにね。blogの特質は、日付管理がしっかりしているのだから、初めから、日付時間分秒で固定アドレスを造ればよかったのに。じゃまくさい。
なお、いま残っているのは別のことだが、記事内のhttpアドレスに”がある。だから、正規化したダウンロードデータを時々ファイルメーカが誤飲して喉をつまらせる。これは、適当に変なマークに変えて、一旦データベースを騙し、あとはファイルメーカの文字列処理関数で、元に戻すしかない。
うむ。うふふふ、とおもわずほくそえむほどに、現実システム開発はおもろい。
マニュアル抜きの推理推測の醍醐味なり。
| 固定リンク
「Blogメモ」カテゴリの記事
- 小説木幡記:2009/12/05(土)静かなubuntu狂乱(2009.12.05)
- 小説木幡記:2009/02/05(木)Google Earthで火星を見たり、最中を食べたり、忙しい(2009.02.05)
- 小説葛野記:2009/02/04(水)朝霧の宇治からNetbook 28800円(2009.02.04)
- 小説木幡記:2009/01/06(火)年頭の失念事項(2009.01.06)
- 小説木幡記:2008/10/20(月)インターネットが消えた日:タイムマシンに乗って(2008.10.20)
この記事へのコメントは終了しました。
コメント