Unicode において,濁音の表現方法は2つあります.一つが濁点のついた文字のコードを使用する方法です. もう一つが濁点のついていない文字と濁点を組み合わせる方法です.
後者の方法だと,本来は濁点のついていない文字に濁点をつけることができるのでおもしろかったりします.
uconv コマンドを使うとこれを相互に変換できます. uconv は (Debian 系のディストロでは) icu-devtools パッケージの一部として APT で入れられます.
以下が 2番目の表現方法から 1 番目の表現方法に変換する例です.
$ echo -n が | uconv -x NFD が 分解されたものを再度合わせるのは以下です.
$ echo -n が |n uconv -x NFC が と例をあげましたが,たいていの環境ではその違いを目視で確認できないと思います. xxd を使いましょう.
まず,キーボードで入力した「が」です.
たしか Ubuntu だと libgnutls28-dev を入れても configure スクリプトで認識されなかった。 その場合、 pkg-config を明示的にインストールしてやるとそれらのライブラリが認識されて ビルドが通る。
これは。 configure スクリプトで pkg-config の結果がデフォルト値に設定されていて、 コマンドライン引数でそれを上書きできるという作りになっているからっぽい (だからオプションで指定しても いいはず。面倒臭いけど)。
トップページでも述べているように、このサイトは Emacs Lisp で書かれた CMS が Emacs の上で動いているというふうになっています。Emacs を知らない人がいたらいけないので 一応説明しておくと、Emacs は LISP というプログラミング言語の方言である Emacs Lisp という 言語で拡張できるというテキストエディタです。最近は CoffeeScript で拡張できる某エディタだったり JavaScript で拡張できるなんとかかんとかコードだったり拡張可能なテキストエディタがあふれているので 機能を拡張できるからといって何ということもありませんが、その昔はテキストエディタを 何らかの機能で拡張できるってのは革新的だったとかいうのはどうでもいい話なのでここには書きません。
一応ソースコードは ここ に。
まだ開発中なので不満なところが多々ありますが、今後直していけたらな、と。