ベト電協会

会員募集 ダウンロード Web辞書 サイトマップ  

言語

FAQ

ID 66
カテゴリー .NET
テーマ Unicode
質問 ベトナム語の文字コードについて教えてください
回答

やっかいなことに、ベトナム語の文字コードは、私の知っている範囲で3種類あります。(詳しく調べた訳では、ありませんので、あしからず。VN.NETにくわしい記述があります)

  • Windwows code set 1258
    たぶん、Windows(ベトナム語)で、使われているコードセットです。ベト電単 for Windows版(廃版)で使用しています。
  • Unicode(2ワード)
    ベトナム文字+音調記号の、2ワードでベトナム文字にします(合成文字)。Windwows code set 1258と互換性があります。(ベト電単 for .NETで使用しています)。
  • Unicode(1ワード) 
    1ワードでベトナム文字にします。Unikeyは、このコードのようです。(ベトナム語のWebサイトで、使われているようです)。

ベト電単 for .NETでは、2ワードUnicodeを使用します。これは、IMEの共通性を考慮したためです。1ワードUnicodeと、2ワードUnicodeは、見た目には同じで、区別できません。したがって、文字コードの違いで検索しても引っかかってこないというパタ-ンもありえます。ベト電単では、1ワードUnicodeを、2ワードUnicodeに変換して、登録や検索する機能があります。

IMEで入力すると該当しないが、目的の語句をコピーペーストすると該当する場合は、複数のコードが混ざっている可能性があります。ベト電単では、Windows Xp/Vistaに付属している、ベトナム語IMEを基準しています。良くわからない方は、他のIMEで入力しないように、ご注意ください。

(参照FAQ「Webサイトから、ベトナム語をコピーして貼り付けても、あるはずの単語が検索されません」