離島で貧乏暮らし

貧乏ネタでいろいろ書こうかなと……

日本語入力をMozcからAnthyに切り替える

今までずっと切り替えよう切り替えようと思っていたのだけれど、色々面倒そうなので後回しにしてきた「日本語入力システムの切り替え」をようやく実施できた。

今まではlinux標準の様になっているMozcをずっと使ってきていたのだけれど、これが本当に自分の好みに合わないソフトウェアで、日本語入力が本当に嫌になる代物だった。

何が気に入らないかと言うと、誤変換があった時に変換候補を出すと、本当にどうしようもない変換リストを出してくるものだから、正しい変換候補にたどり着くまでに変換キーを何十回も押すハメになる所だ。

どういう内部処理だかが分からないのだけれど、使えば使うほどロクでもない場所で文節を切ってめちゃくちゃな候補を出す様になる。 自分に言わせれば「使えば使うほど馬鹿になる」という入力システムなのだ。

これほどひどい日本語変換システムは単文節変換だったOASYS lite-K*1以来一つもない。

自分の文字変換の仕方が「細かく文節を切りがち」なので、それを学習して何でもかんでも文節を短く切ってめちゃくちゃな変換候補を出す、と云う死のサイクルにハマってるんじゃないかと思っている。 なので、フリーのユーザ辞書ファイル(何千語も登録してあるやつ。7MB以上あるバカでかいユーザ辞書)を入れても、文節を短く切りたがる癖は変わらないので、変換候補は滅茶苦茶なまま、ってコースだ。 せめてユーザー辞書に登録してある候補は優先表示して欲しいが、一回変換をして学習しないと相当後の方に候補が出るので、もうどうしようもない。

で、Anthyの方は設計もまあまあ古くて、自分の受ける感じとしては「windows2000の頃のMSーIME」って感じの変換をしてくる。 よくある「貴社の記者は汽車で帰社した」みたいな入力だと、一発では変換できずに逐一修正が必要なんだけれど、学習すればするほどめちゃくちゃな変換候補を出してくる、という事はない。 と言うか、そういう学習結果になるのはMozcだけだと思うんだが、windows用のgoogle日本語変換でもそうなんだろうか?

そういうことはwindows7からxubuntuに切り替えたときに分かっていたので、さっさとanthyか、もっと思い切って単文節変換のSKKに切り替えれば良かったのだけれど、windows上でwx3やwxgで育ててきたユーザ辞書の引越しが面倒そうで、そこが楽なMozcを使っていたのである。

で、本日我慢が限界を越え、anthyをaptでインストールして、ユーザ辞書の変換→マージにも踏みきったのである。

MozcはAtokMS-IMEのユーザ辞書からのインポートが簡単で、windowsIMEでテキスト形式の辞書ファイルを吐かせて、それをインポートすればOKという簡単さだが、anthyはそうは行かないし、情報も結構限られてる。

辞書の変換にあたって参考にしたのはこのブログ。 ただし、perlスクリプトで変換するのがちょっと不安だったので、gnumericで読み込んでからカラムを入れ替え、品詞分類は手作業で変換し、区切り記号をスペースに指定してtxt出力という、ダサい方法で変換した。

まあそういう訳で手間はかかったのだけれど、とにかく日本語入力システムの変更は終了して、今この文章はanthyで書いている。 賢くないがMozcを使っている時の苛立ちは消えた。 変換候補は確かに少なくなったが、でたらめな候補が山ほど出てくるよりはずっと快適なのである。

とは言え、今まで入力していて一番ストレスが少なかったのはwndows7上で使っていたAtokで、止めてしまったlinux版が復活しないかなと思ってるのだが、まあ無理だろうなあw

*1:(40年以上前の専用ワープロ機で自分が最初に触ったワードプロセッサ