2007年3月14日水曜日

unidic-1.2

galatea talk で、振り仮名のついたテキストを入力することができるのだが、これの出来があまりよくない。いろいろ試行錯誤をしてみると、どうも前段階の chasen が使っている unidic にその原因があるようだ。(註:chasenの標準の辞書は ipadic だが、galatea talk では、専用の辞書 unidic を使う)
動詞の語幹に振り仮名をつけると(!これは、ごく普通の振り仮名のつけ方だと思う)活用語尾が活用語尾として認識してくれない。つまり、「食べる」にルビを振るとき、「食(た)べる」ではだめで、「食べ(たべ)る」と振らないと、「べ」が未定義語となってしまう。しかも、『ひらかなの標準の読みが定義されていない』。結局辞書に定義されていない言葉が無音扱いとなって「食(た)べる」とルビを振ると、「タ(pause)ル」となてしまう。

文語の辞書もあまりよくない。「給ふ」が辞書になくて、「給う」で登録されている。他のハ行四段活用動詞が登録されていない訳ではなく、なぜか「給ふ」だけが、ア行に登録されている。

まあ、オープンソースだから、いやなら自分で直せ、ということか。。。

0 件のコメント:

コメントを投稿