ビルマ語(ミャンマー語)のUNICODEはUNICODEじゃなかった?

IT, ビルマ語(ミャンマー語), ミャンマー絡み

以前ビルマ語(ミャンマー語)についてブログに書いたのは2009年2月の「ビルマ語をWindowsで~Unicode以前」だった。その後すぐに続編を書く予定だったのが、結局今日になってしまった。3年越しの恋ならぬ、3年越しの ユニコードだ。

Unicode(ユニコード)とは、コンピュータで文字を扱うための世界標準の規格だ。Unicodeにはビルマ語も含めて世界中の文字が規定されている。このおかげで、コンピュータで簡単に世界各国の文字を見たり書いたりすることができる。ちなみに、ビルマ語はUnicodeの1000番~109F番とAA60番~AA7B番までのエリアを割り当てられている。ちょうど1000番で覚えやすいが、1000といっても16進の1000だから10進で数えると4096番目だ。

Unicodeの1000番〜109F番はビルマ語の範囲
AA60番〜AA7B番もビルマ語の範囲

Unicodeに完全対応したWIndows2000が発売されたのが2000年、すぐには広まらなかったが、2005年あたりから世界で本格化的に普及しはじめた。最近のWindowsもMacもiPhoneもAndroidもすべてUnicodeに対応している。一般の人たちはほとんど意識しなくてもいいが、時々メールやWEBサイトで文字化けが起きたときにShift-JISやらUTF-8やらの言葉が出てくる。UTF-8というのがUnicodeのひとつの規格名だ。世界中のみんながUnicodeを使えば文字化けなどはほとんどなくなるのだが、今は過渡期なので、古いShift-JIS(日本語の場合)なども併用されている。

Unicode以前は、世界中の文字を統一した規格はなかった。ascii(アスキー)と呼ばれる英語を中心とした文字規格が世界中で使われていたが、その他の言語は各国で独自に標準を決めていただけだ。日本語の場合はShift-JISやEUC-JPなどいくつかあった。中国語やタイ語やヒンディー語などオリジナルの文字を持つ言語も同じように各国が標準を決めていた。

ところが、ビルマ語は国による標準がなかったため、フォント作成者が文字の配置を自由に決めていたのだ。これが、ビルマ語フォントの最初の混乱だった。日本語ではゴシック体で書いた文字をフォントだけ明朝体に変えてもおかしくはならない。しかし、ビルマ語はフォント毎に規格が違うので一度そのフォントで文章を入力したら他のフォントに変えられないという、奇妙な状況になっていた。この頃一番強かったのがWin Innwaというフォントで、他にAcademy とか CEとかMetrixとかいろんなフォントがそれぞれのキー配置で競っていた。

2000年を迎え、Unicodeが少しずつ世界に浸透するようになった。Unicode以前はコンピュータで多言語の文書を読み書きするのは面倒なことだったが、WindowsもMacもUnicodeをサポートするようになると簡単に多言語化することができるようになった。WIndowsやMacのOSの中に世界各地の言語のフォントが用意されるようになったのだ。インターネットのWEBサイトで世界各地の文字がそのまま表示されるようになったのもUnicodeのおかげだ。しかし、ビルマ語はなかなかサポートされなかった。

Windows7の言語設定を見てみる。ミャンマーの隣の国で人口がミャンマーの1/9しかいないラオスのラオス語の設定はできるが、ビルマ語のビの字もミャンマー語のミの字もない。他にももっとマイナーな言語がWindows7に含まれている。ビルマ語がないのは政治的な理由だとしか考えられない。

ラオス語はあっても、ビルマ語もミャンマー語もない

ビルマ語がOSに入ってなくても、Unicodeのビルマ語フォントを自分でインストールすればビルマ語のWEBサイトを見ることはできる。でも、何かおかしい。正しく表示できるサイトと文字化けするサイトがあるのだ。調べると、ガガガガガーン!! ビルマ語Unicodeには、UnicodeじゃないUnicodeがあったんだ。そんなの普通Unicodeなんて言わないだろう。 そもそも、ビルマ語「Unicode」で一番ポピュラーなZawgyi-Oneというのが偽Unicodeだった。

Zawgyi-Oneを使ったWEBサイトの一例
 正しいUnicodeフォントで見ると文字化け   Zawgyi-Oneフォントで見ると正常

ビルマ語Wikipediaを見ても、ミャンマーのIT関係のサイトを見てもこの問題を憂慮しているミャンマー人のIT専門家が多い。正しいUnicodeのフォントを使うべきだとちゃんと書いている。でも、一般の人たちはこの問題を全然知らないでZawgyi-Oneを使っている。友人のミャンマー人に聞いても、みんなZawgyi-One使いだった。

問題はZawgyiだけでなかった。Ayarというビルマ語フォントがある。Ayarは最近勢力を伸ばしていて、世界で最も有力なブログシステムWordPressのビルマ語版を出したりして。Ayarのサイトのトップにはこなことが書いていた。

Unicode is a computing industry standard for the consistent encoding, representation and handling of text expressed in most of the world’s writing systems including those used in Myanmar (Burma). Unicode’s success at unifying various character sets in a standard Universal Character Set has led to its widespread and predominant use in the internationalization and localization of computer software.

コンピュータ技術でUnicodeがどれだけ大切かを書いている。もっともだ。しかし驚くなかれ、Ayarフォントも偽Unicodeだ。この問題をめぐって時々掲示板などでバトルが繰り広げられているが、Ayarは自分たちのほうが正しいUnicodeだと1mmも引かない。ここまで開き直れるというのもすごい。

といった具合で、Unicodeでビルマ語も統一されたかと思っていたが、ぐちゃぐちゃ状態だった。でも、世界はミャンマーのローカルな状況とは関係なく動いている。Mac OS X の最新版LIONがビルマ語を正式にサポートした。もちろん正しいUnicodeのビルマ語だ。来年には発売されるというWindows8もビルマ語Unicodeがサポートされる。たとえ今みんながZawgyiやAyarを使っていても、2年後3年後には確実にZawgyi-OneやAyarはすたれてしまう。できるだけ早いうちにZawgyi-OneやAyarをやめて正しいUnicodeに変えたほうがいい。でないと、せっかく自分が書いたビルマ語の文章が2〜3年後には文字化けで読めないという事態になってしまう。

では、正しいビルマ語Unicodeを使う具体的な方法です。Macを使っている人はOSをLIONに変えて言語設定でビルマ語を設定するのが一番簡単だ。Windowsを使っている人はWindows8が発売されるまで、正しいビルマ語Unicodeフォントを今のPCにインストールしなければいけない。私が知っている限りでは、Unicode5.1に準拠したフォントとして、Myanmar3, Padauk, Parabaikなどのフリーのフォントがある。特に、Myanmar3がビルマ語Unicodeのスタンダード的な扱いを受けているようだ。Wikipediaビルマ語版やBBCのビルマ語サイトなどでもこのMyanmar3を推奨している。でもインストールには注意が必要だ。前回の「ビルマ語(ミャンマー語)の入力方法」でも書いたように、入力システムはインストールせずにフォントのみ(mm3.ttfなどの、TTFファイル)をインストールをしたほうがいい。 こちらのページでMyanmar3のフォントだけをダウンロードできる。

なお、入力方法については前回のブログに書いたように、BurglishKeyMagicを推奨します。