|
やっかいなことに、ベトナム語の文字コードは、私の知っている範囲で3種類あります。(詳しく調べた訳では、ありませんので、あしからず。VN.NETにくわしい記述があります)
- Windwows code set 1258
たぶん、Windows(ベトナム語)で、使われているコードセットです。ベト電単 for Windows版(廃版)で使用しています。
- Unicode(2ワード)
ベトナム文字+音調記号の、2ワードでベトナム文字にします(合成文字)。Windwows code set 1258と互換性があります。(ベト電単 for .NETで使用しています)。
- Unicode(1ワード)
1ワードでベトナム文字にします。Unikeyは、このコードのようです。(ベトナム語のWebサイトで、使われているようです)。
ベト電単 for .NETでは、2ワードUnicodeを使用します。これは、IMEの共通性を考慮したためです。1ワードUnicodeと、2ワードUnicodeは、見た目には同じで、区別できません。したがって、文字コードの違いで検索しても引っかかってこないというパタ-ンもありえます。ベト電単では、1ワードUnicodeを、2ワードUnicodeに変換して、登録や検索する機能があります。
IMEで入力すると該当しないが、目的の語句をコピーペーストすると該当する場合は、複数のコードが混ざっている可能性があります。ベト電単では、Windows Xp/Vistaに付属している、ベトナム語IMEを基準しています。良くわからない方は、他のIMEで入力しないように、ご注意ください。
(参照FAQ「Webサイトから、ベトナム語をコピーして貼り付けても、あるはずの単語が検索されません」 |