2010年8月5日木曜日

epub (その4)

OSIS が、TEI(Text Encoding Initiative) の簡略版だし、真面目に電子書籍のフォーマットを考えるなら、ベースとしては TEIもしくはそれの拡張・縮小版を使うのが 王道なのだろう。
TEItoEPub のような形式で、ターゲットを生成する(直接 epub を、基本形式とするのは、失われる情報が多すぎる)。

TEIには、日本語に関する処理に不足している部分(縦書きや、ルビ)があるので、そこを何らかの形で補わないといけない。
作業手順としては、○○文庫の(無秩序ともいえる)ひどいテキスト形式から、TEIへのコンバータか... ( 元のテキスト形式がダメダメなので、完全自動化は到底無理。ある程度変換・修正が終った時点で、変換後の形式を正本とする... しかないだろう。)

0 件のコメント:

コメントを投稿