2009年5月28日木曜日

さて、全文検索

3Mbytes位のテキストなので、grepで検索してもたいした時間はかからないのだけれど...
CPUやハードディスクへの負担がかなり高いのでもう少しスマートにやりたいな、ということ。

postgresqlが全文検索エンジンを積んでいるということなので、その説明書きをつらつら読んでいるのだけれど、読んだ印象は全文検索というよりは、キーワード検索なのかな? というところ。
例えば、「東京都」が文に含まれていたとして、これを分かち書き処理で、「東京|都」と分割して処理されていたとすると、「京都」で検索したときにこれが検索で呼び出されるのだろうか?

検索にかかった方がいい、という立場と、かからない方がいい、という立場の両方共有り得るので、どちらがいいという訳ではないのだけれど。

もう一つの問題は、新旧漢字の混在の問題。
たとえば、教 と 敎、絶 と 絕 のように、必ずしも本文の中で統一されていない漢字は、一方の漢字で検索したときに、もう一方の漢字も見つけて欲しい。
( 旧漢字に統一されている場合ですら、検索するときに、いちいち旧漢字で入力しなくてはいけない となると、これはとても憂鬱な話だ。)

まあ、実験してみるしかないね。

2009年5月24日日曜日

熱暴走 (その5)

う~ん、、メモリーが512MB以下のPCにXPを載せてはいけない、というのが今までの持論だったけれど、512MBでもまだ足りないね。何でこんなに重たいんだろう。

2009年5月23日土曜日

熱暴走 (その4)

結局、ハードディスクの内容は無事だったことが確認されたので、この際だからバックアップを作成する。

さて、本体の修復なのだが...
とりあえずサブに使っていたPCにディスクを付け替えて、、、ということなのだけれど、サブ機はシリアルATAに対応していないし、Windows2000もそのままではBigDriveに対応していないし、CPUのアーキテクチャが違うのでハードディスクをそのままもっていっても起動しない、という三重苦にはまるはめに。

こういう時のために、予備のパーティションを8GBほど残してあったので、そこに XPをインストールすることで、当座はしのぐことにする。
もともと システムドライブにはあまり重要なデータは置かないようにしているので、新しいパーティションから起動してもそちらに移動するべきデータはあまりないのだけれども、WindowsというOSはなかなかそうはすっきりとデータを分離することができないようにできているので、どうしてもいくらかの作業が残ってしまう。

まあ、おかげで、どんなデータが失われると苦労するか、というのが体感できたかな。
意外だったのがブックマーク。あまりバックアップの必要性を感じていなかったのだけれど、これが復元するとやっと自分の環境になったという気分になる。外部に保存しておいた方がいいのかもしれない。

ハードの修復はどうするかなぁ。予算との絡みもあるし、まあぼちぼちとパーツを集めながらということになりそう。

2009年5月22日金曜日

熱暴走 (その3)

どうも、今回はCPUでなくて、マザーの方だったみたい。
CPUを交換して数分の間は動作するのだがそのまま止まってしまう。
症状としては 去年の12月23日に電源交換の記事を書いたときとほぼ同じ。
たぶん、CPU周りの温度センサーが誤動作して、CPU保護のために自動シャットダウンしているような感じ。

さて、暮れの時は「冬なので熱暴走の可能性はない」といってこの保護機能を切っていたのだが、30度近くまで気温の上がることもあるこの時期となっては熱暴走の可能性がないとも言っていられない。

この旧式のマザーの代わりを見つけるか、それともこの際だから全取替するか。
交換するとなると、CPUもメモリも使い回せないのがつらいところだが...
(まあ、メモリは他の機械に回すという手もあるけれど)

2009年5月21日木曜日

玄箱HG (その2)

いろいろ細かい違いに戸惑いながらも、サーバーの置換を完了。
一応将来を見込んで40GBのハードディスクを組み込んだけれど、メールサーバーとWebサーバーだけなので10Gバイトもあれば十分だったかも。ちなみに、今は2GB位しか使用していない。

メモリの128MBというのは、やっぱりちょっときついかも。mySQLを動かしているせいもあるけれど、swapこそしないものの110MB位は使用中なので、これにspam checkなどを加えるとメールサーバーとしてもかなり苦しい。( いまのところ この種のチェックは別の中継サーバーで行っているので、玄箱では敢えて何も行っていない )

熱暴走 (その2)

どうも CPUが逝ってしまったらしい。
ハードディスクではなさそうなのが幸いというべきか。

とはいえ、マイナーなCPUなので近所では入手できず。明日、出かけたときに探してみることに...

2009年5月20日水曜日

Cyrus Imap 2.2 (その2)

Debianのpop3は、デフォールトで1分以内の再接続を許可していないのね。
その方が都合のいいことも多いけれど、小さな親切大きなお世話 だな。

熱暴走

陽気になってきたおかげで、メインに使っているPCが勝手にリブートを起こした。
ハードディスクがかなり熱くなっているので、少し冷やさないとね。

壊れていなければいいけれど。

2009年5月19日火曜日

Cyrus Imap 2.2

玄箱のDebianを2段階でアップデートしたおかげで、いろいろゴミが残ってしまった。
特に問題なのが cyrus-imapd で、1.5->2.1->2.2 で DBの形式が変化したせいで、DBを変換しないことには起動もしない。

全削除で再インストールするのも手だが、今回移行したいサーバーが 2.1形式なので、練習も兼ねてコンバートしてみようかと思う。( 2.2になって、メールの二重化という魅力的な機能が追加されているのでね... )

さて、コンバートだけれど、スクリプトは用意されておらず、ドキュメントに(丁寧な)手順が記載されているだけ。作者曰く「私はドキュメントを読まないユーザーは嫌い」とな。

2009年5月18日月曜日

玄箱HG

玄箱HG がジャンクで売られていたので入手。電源スイッチが紛失していたので格安ということで...
昨日と今日とこれをDebian化する作業にかかりきり。
woody->sarge->etchと二段階のアップデートで、sarge化の記事は結構見つかったのだけれど、apt-getのサイトでは既にsarge関連のファイルがアーカイブ入りしていて記事が書かれた当時とは違っているところあたりで少し嵌る。etchへのアップグレードも終ったところで、etch用のイメージファイルが置かれているサイトを見つけたので、もし次回繰り返すことがあるならもっと手際よくできることだろう。

ま、今動かしているサーバーの一台を置き換えるのが目標で、消費電力の軽減ができれば、ということなんだけれどね。

2009年5月9日土曜日

pageをめくるflash

本のページをめくるように読める flash を、試してみたのだけれど、見た目の軽快さとはうらはらに、CPUの使用率が滅茶苦茶高い。少し前の(つまり Pen4 2~3GHzクラスの)PCだと、普段はファンも静かでほとんど気にならないのだが、ページをめくって遊んでいたらファンがうるさいこと甚だしい。
ファンの回転が元に戻るまで数分かかるので、オフィスではちょっと使えないなぁ。

2009年5月4日月曜日

postgresql のバージョンアップ (その2)

ログを見て気がついたのだけれど。
postgresql7系に附属の jdbc ドライバって、preparedStatement の実装って、中身は普通の Statement に変換しているだけ???
で、String 内の ' を '' でなく、\' でエスケープしているものだから、postgresql8.3 だとエラーになる。

2009年5月2日土曜日

というわけで、こちらに引越してきたのだけれど。

古いデータをimportするときに文字化けだらけになったせいか、spamと間違えられてブロックされちゃったよ。
google提供のconverterのバグなんだから、勘弁して欲しいよな...

(おかげで、慣れないpythonプログラムの虫取りをする羽目になっちゃうし。)

---
importした記事の時刻が、ずれているみたい。GMTで計算したのかな。
ま、細かいことなので、直さずにこのままにしておきます。

FC2にも変な広告が挿入されるようになった

なんだかなぁ。
始めた頃は、『最下行に一行のテキスト広告が入るだけ』という触れ込みだったのに、いつのまにか、広告が無闇に挿入されているページが増えた。

近いうちに別の場所に引っ越すかも。

というか、引越し先が見つかり次第、引っ越します。どうして、こういう無料系のサービスというのは、契約を守らないのだろう。これじゃspam業者と一緒だ。