2006年12月13日水曜日

JIS0213

文語訳(大正改訳)のPDF化が、予想以上にすんなりとことが運んで、さて次はどうしようということに。
問題点がないわけでもない。今は PDFJというPDF化ツールを使っているのだが、これの縦書き処理部分は未完成のように見える。とりあえず関係部分に手を加えて(quick and dirty hack というやつ)必要な処理だけは行なえる状態にしているのだが、あまり綺麗な状態とはいえない。一旦、XML風の中間形式に落とすという手法は正統的な方法だと思うが、その次のステップはむしろ、TeXのソースに落とすべきなのだと思う。
で、日本語 p(La)TeXの状況を調べてみると、どうも、JIS-X-0213対応はまだまだ開発途上というのが現実らしい。いくつかのパッチはあるようだけれども、これが決定版というものはないようだ。第三水準漢字はサポートしていても、第四水準漢字までは手が回っていないようにも見える。
もともと8bit文字用の処理系のTeXを EUCなりSJISに対応させることにすらいろいろ混乱があったので、すんなりコード拡張できない理由も理解しているのだが、もう TeX全体を 16bit化するべき時期なのだと思う。関連するツールをすべてアップデートしなければいけないというデメリットは
あるが、いつまでも8bitコードでもあるまい。

0 件のコメント:

コメントを投稿