3Mbytes位のテキストなので、grepで検索してもたいした時間はかからないのだけれど...
CPUやハードディスクへの負担がかなり高いのでもう少しスマートにやりたいな、ということ。
postgresqlが全文検索エンジンを積んでいるということなので、その説明書きをつらつら読んでいるのだけれど、読んだ印象は全文検索というよりは、キーワード検索なのかな? というところ。
例えば、「東京都」が文に含まれていたとして、これを分かち書き処理で、「東京|都」と分割して処理されていたとすると、「京都」で検索したときにこれが検索で呼び出されるのだろうか?
検索にかかった方がいい、という立場と、かからない方がいい、という立場の両方共有り得るので、どちらがいいという訳ではないのだけれど。
もう一つの問題は、新旧漢字の混在の問題。
たとえば、教 と 敎、絶 と 絕 のように、必ずしも本文の中で統一されていない漢字は、一方の漢字で検索したときに、もう一方の漢字も見つけて欲しい。
( 旧漢字に統一されている場合ですら、検索するときに、いちいち旧漢字で入力しなくてはいけない となると、これはとても憂鬱な話だ。)
まあ、実験してみるしかないね。
2009年5月24日日曜日
2009年5月23日土曜日
熱暴走 (その4)
結局、ハードディスクの内容は無事だったことが確認されたので、この際だからバックアップを作成する。
さて、本体の修復なのだが...
とりあえずサブに使っていたPCにディスクを付け替えて、、、ということなのだけれど、サブ機はシリアルATAに対応していないし、Windows2000もそのままではBigDriveに対応していないし、CPUのアーキテクチャが違うのでハードディスクをそのままもっていっても起動しない、という三重苦にはまるはめに。
こういう時のために、予備のパーティションを8GBほど残してあったので、そこに XPをインストールすることで、当座はしのぐことにする。
もともと システムドライブにはあまり重要なデータは置かないようにしているので、新しいパーティションから起動してもそちらに移動するべきデータはあまりないのだけれども、WindowsというOSはなかなかそうはすっきりとデータを分離することができないようにできているので、どうしてもいくらかの作業が残ってしまう。
まあ、おかげで、どんなデータが失われると苦労するか、というのが体感できたかな。
意外だったのがブックマーク。あまりバックアップの必要性を感じていなかったのだけれど、これが復元するとやっと自分の環境になったという気分になる。外部に保存しておいた方がいいのかもしれない。
ハードの修復はどうするかなぁ。予算との絡みもあるし、まあぼちぼちとパーツを集めながらということになりそう。
さて、本体の修復なのだが...
とりあえずサブに使っていたPCにディスクを付け替えて、、、ということなのだけれど、サブ機はシリアルATAに対応していないし、Windows2000もそのままではBigDriveに対応していないし、CPUのアーキテクチャが違うのでハードディスクをそのままもっていっても起動しない、という三重苦にはまるはめに。
こういう時のために、予備のパーティションを8GBほど残してあったので、そこに XPをインストールすることで、当座はしのぐことにする。
もともと システムドライブにはあまり重要なデータは置かないようにしているので、新しいパーティションから起動してもそちらに移動するべきデータはあまりないのだけれども、WindowsというOSはなかなかそうはすっきりとデータを分離することができないようにできているので、どうしてもいくらかの作業が残ってしまう。
まあ、おかげで、どんなデータが失われると苦労するか、というのが体感できたかな。
意外だったのがブックマーク。あまりバックアップの必要性を感じていなかったのだけれど、これが復元するとやっと自分の環境になったという気分になる。外部に保存しておいた方がいいのかもしれない。
ハードの修復はどうするかなぁ。予算との絡みもあるし、まあぼちぼちとパーツを集めながらということになりそう。
2009年5月22日金曜日
熱暴走 (その3)
どうも、今回はCPUでなくて、マザーの方だったみたい。
CPUを交換して数分の間は動作するのだがそのまま止まってしまう。
症状としては 去年の12月23日に電源交換の記事を書いたときとほぼ同じ。
たぶん、CPU周りの温度センサーが誤動作して、CPU保護のために自動シャットダウンしているような感じ。
さて、暮れの時は「冬なので熱暴走の可能性はない」といってこの保護機能を切っていたのだが、30度近くまで気温の上がることもあるこの時期となっては熱暴走の可能性がないとも言っていられない。
この旧式のマザーの代わりを見つけるか、それともこの際だから全取替するか。
交換するとなると、CPUもメモリも使い回せないのがつらいところだが...
(まあ、メモリは他の機械に回すという手もあるけれど)
CPUを交換して数分の間は動作するのだがそのまま止まってしまう。
症状としては 去年の12月23日に電源交換の記事を書いたときとほぼ同じ。
たぶん、CPU周りの温度センサーが誤動作して、CPU保護のために自動シャットダウンしているような感じ。
さて、暮れの時は「冬なので熱暴走の可能性はない」といってこの保護機能を切っていたのだが、30度近くまで気温の上がることもあるこの時期となっては熱暴走の可能性がないとも言っていられない。
この旧式のマザーの代わりを見つけるか、それともこの際だから全取替するか。
交換するとなると、CPUもメモリも使い回せないのがつらいところだが...
(まあ、メモリは他の機械に回すという手もあるけれど)
2009年5月21日木曜日
玄箱HG (その2)
いろいろ細かい違いに戸惑いながらも、サーバーの置換を完了。
一応将来を見込んで40GBのハードディスクを組み込んだけれど、メールサーバーとWebサーバーだけなので10Gバイトもあれば十分だったかも。ちなみに、今は2GB位しか使用していない。
メモリの128MBというのは、やっぱりちょっときついかも。mySQLを動かしているせいもあるけれど、swapこそしないものの110MB位は使用中なので、これにspam checkなどを加えるとメールサーバーとしてもかなり苦しい。( いまのところ この種のチェックは別の中継サーバーで行っているので、玄箱では敢えて何も行っていない )
一応将来を見込んで40GBのハードディスクを組み込んだけれど、メールサーバーとWebサーバーだけなので10Gバイトもあれば十分だったかも。ちなみに、今は2GB位しか使用していない。
メモリの128MBというのは、やっぱりちょっときついかも。mySQLを動かしているせいもあるけれど、swapこそしないものの110MB位は使用中なので、これにspam checkなどを加えるとメールサーバーとしてもかなり苦しい。( いまのところ この種のチェックは別の中継サーバーで行っているので、玄箱では敢えて何も行っていない )
2009年5月20日水曜日
2009年5月19日火曜日
Cyrus Imap 2.2
玄箱のDebianを2段階でアップデートしたおかげで、いろいろゴミが残ってしまった。
特に問題なのが cyrus-imapd で、1.5->2.1->2.2 で DBの形式が変化したせいで、DBを変換しないことには起動もしない。
全削除で再インストールするのも手だが、今回移行したいサーバーが 2.1形式なので、練習も兼ねてコンバートしてみようかと思う。( 2.2になって、メールの二重化という魅力的な機能が追加されているのでね... )
さて、コンバートだけれど、スクリプトは用意されておらず、ドキュメントに(丁寧な)手順が記載されているだけ。作者曰く「私はドキュメントを読まないユーザーは嫌い」とな。
特に問題なのが cyrus-imapd で、1.5->2.1->2.2 で DBの形式が変化したせいで、DBを変換しないことには起動もしない。
全削除で再インストールするのも手だが、今回移行したいサーバーが 2.1形式なので、練習も兼ねてコンバートしてみようかと思う。( 2.2になって、メールの二重化という魅力的な機能が追加されているのでね... )
さて、コンバートだけれど、スクリプトは用意されておらず、ドキュメントに(丁寧な)手順が記載されているだけ。作者曰く「私はドキュメントを読まないユーザーは嫌い」とな。
2009年5月18日月曜日
玄箱HG
玄箱HG がジャンクで売られていたので入手。電源スイッチが紛失していたので格安ということで...
昨日と今日とこれをDebian化する作業にかかりきり。
woody->sarge->etchと二段階のアップデートで、sarge化の記事は結構見つかったのだけれど、apt-getのサイトでは既にsarge関連のファイルがアーカイブ入りしていて記事が書かれた当時とは違っているところあたりで少し嵌る。etchへのアップグレードも終ったところで、etch用のイメージファイルが置かれているサイトを見つけたので、もし次回繰り返すことがあるならもっと手際よくできることだろう。
ま、今動かしているサーバーの一台を置き換えるのが目標で、消費電力の軽減ができれば、ということなんだけれどね。
昨日と今日とこれをDebian化する作業にかかりきり。
woody->sarge->etchと二段階のアップデートで、sarge化の記事は結構見つかったのだけれど、apt-getのサイトでは既にsarge関連のファイルがアーカイブ入りしていて記事が書かれた当時とは違っているところあたりで少し嵌る。etchへのアップグレードも終ったところで、etch用のイメージファイルが置かれているサイトを見つけたので、もし次回繰り返すことがあるならもっと手際よくできることだろう。
ま、今動かしているサーバーの一台を置き換えるのが目標で、消費電力の軽減ができれば、ということなんだけれどね。
2009年5月9日土曜日
pageをめくるflash
本のページをめくるように読める flash を、試してみたのだけれど、見た目の軽快さとはうらはらに、CPUの使用率が滅茶苦茶高い。少し前の(つまり Pen4 2~3GHzクラスの)PCだと、普段はファンも静かでほとんど気にならないのだが、ページをめくって遊んでいたらファンがうるさいこと甚だしい。
ファンの回転が元に戻るまで数分かかるので、オフィスではちょっと使えないなぁ。
ファンの回転が元に戻るまで数分かかるので、オフィスではちょっと使えないなぁ。
2009年5月4日月曜日
postgresql のバージョンアップ (その2)
ログを見て気がついたのだけれど。
postgresql7系に附属の jdbc ドライバって、preparedStatement の実装って、中身は普通の Statement に変換しているだけ???
で、String 内の ' を '' でなく、\' でエスケープしているものだから、postgresql8.3 だとエラーになる。
postgresql7系に附属の jdbc ドライバって、preparedStatement の実装って、中身は普通の Statement に変換しているだけ???
で、String 内の ' を '' でなく、\' でエスケープしているものだから、postgresql8.3 だとエラーになる。
2009年5月2日土曜日
というわけで、こちらに引越してきたのだけれど。
古いデータをimportするときに文字化けだらけになったせいか、spamと間違えられてブロックされちゃったよ。
google提供のconverterのバグなんだから、勘弁して欲しいよな...
(おかげで、慣れないpythonプログラムの虫取りをする羽目になっちゃうし。)
---
importした記事の時刻が、ずれているみたい。GMTで計算したのかな。
ま、細かいことなので、直さずにこのままにしておきます。
google提供のconverterのバグなんだから、勘弁して欲しいよな...
(おかげで、慣れないpythonプログラムの虫取りをする羽目になっちゃうし。)
---
importした記事の時刻が、ずれているみたい。GMTで計算したのかな。
ま、細かいことなので、直さずにこのままにしておきます。
FC2にも変な広告が挿入されるようになった
なんだかなぁ。
始めた頃は、『最下行に一行のテキスト広告が入るだけ』という触れ込みだったのに、いつのまにか、広告が無闇に挿入されているページが増えた。
近いうちに別の場所に引っ越すかも。
というか、引越し先が見つかり次第、引っ越します。どうして、こういう無料系のサービスというのは、契約を守らないのだろう。これじゃspam業者と一緒だ。
始めた頃は、『最下行に一行のテキスト広告が入るだけ』という触れ込みだったのに、いつのまにか、広告が無闇に挿入されているページが増えた。
近いうちに別の場所に引っ越すかも。
というか、引越し先が見つかり次第、引っ越します。どうして、こういう無料系のサービスというのは、契約を守らないのだろう。これじゃspam業者と一緒だ。
登録:
投稿 (Atom)