ネイティブコード (Latin 1 および Unicode 以外) のファイルを Unicode コードに変換します。
native2ascii [options] [inputfile [outputfile]]
Java コンパイラおよび Java ツールは、Latin-1 または Unicode コード (¥udddd 表記法) のファイルだけを処理することができます。native2ascii
は、その他の文字コードのファイルを Latin-1 または Unicode コードのファイルに変換します。
outputfile
を省略した場合、標準出力に出力されます。さらに、inputfile
を省略した場合、標準入力から入力されます。
-reverse
- 逆の処理を行います。つまり、Latin-1 または Unicode コードのファイルをネイティブコードに変換します。
-encoding encoding_name
- 変換処理で使用するコードの名前を指定します。デフォルトのコードは、システムプロパティの
file.encoding
から取得されます。encoding_name
の文字列は、下の表の最初の列から取得される文字列でなければなりません。
------------------------------------------------------------- コンバータ 説明 クラス ------------------------------------------------------------- 8859_1 ISO 8859-1 8859_2 ISO 8859-2 8859_3 ISO 8859-3 8859_4 ISO 8859-4 8859_5 ISO 8859-5 8859_6 ISO 8859-6 8859_7 ISO 8859-7 8859_8 ISO 8859-8 8859_9 ISO 8859-9 Big5 Big5、中国語 (繁体字) CNS11643 CNS 11643、中国語 (繁体字) Cp037 米国、カナダ (2 か国語、フランス語)、オランダ、 ポルトガル、ブラジル、オーストラリア Cp1006 IBM AIX パキスタン (ウルドゥー語) Cp1025 IBM 多言語キリル文字: ブルガリア、ボスニア、 ヘルツェゴビナ、マケドニア (FYR) Cp1026 IBM ラテン文字-5、トルコ Cp1046 IBM オープン版米国 EBCDIC Cp1097 IBM イラン (現代ペルシア語)/ペルシア語 Cp1098 IBM イラン (現代ペルシア語)/ペルシア語 (PC) Cp1112 IBM ラトビア、リトアニア Cp1122 IBM エストニア Cp1123 IBM ウクライナ Cp1124 IBM AIX ウクライナ Cp1125 IBM AIX ウクライナ (PC) Cp1250 Windows 東欧 Cp1251 Windows キリル文字 Cp1252 Windows ラテン文字-1 Cp1253 Windows ギリシア文字 Cp1254 Windows トルコ語 Cp1255 Windows ヘブライ語 Cp1256 Windows アラビア語 Cp1257 Windows バルト諸語 Cp1258 Windows ベトナム語 Cp1381 IBM OS/2、DOS 中国 (中華人民共和国) Cp1383 IBM AIX 中国 (中華人民共和国) Cp273 IBM オーストリア、ドイツ Cp277 IBM デンマーク、ノルウェー Cp278 IBM フィンランド、スウェーデン Cp280 IBM イタリア Cp284 IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ Cp285 IBM 英国、アイルランド Cp297 IBM フランス Cp33722 IBM-eucJP - 日本語 (5050 のスーパーセット) Cp420 IBM アラビア語 Cp424 IBM ヘブライ語 Cp437 MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ Cp500 EBCDIC 500V1 Cp737 PC ギリシア文字 Cp775 PC バルト諸語 Cp838 IBM タイ拡張 SBCS Cp850 MS-DOS ラテン文字-1 Cp852 MS-DOS ラテン文字-2 Cp855 IBM キリル文字 Cp857 IBM トルコ語 Cp860 MS-DOS ポルトガル語 Cp861 MS-DOS アイスランド語 Cp862 PC ヘブライ語 Cp863 MS-DOS カナダ系フランス語 Cp864 PC アラビア語 Cp865 MS-DOS 北欧 Cp866 MS-DOS ロシア語 Cp868 MS-DOS パキスタン Cp869 IBM 近代ギリシア語 Cp870 IBM 多言語ラテン文字-2 Cp871 IBM アイスランド Cp874 IBM タイ Cp875 IBM ギリシア語 Cp918 IBM パキスタン (ウルドゥー語) Cp921 IBM ラトビア、リトアニア (AIX、DOS) Cp922 IBM エストニア (AIX、DOS) Cp930 UDC 4370 文字を含む日本語かたかな漢字、5026 のスーパーセット Cp933 UDC 1880 文字を含む韓国語、5029 のスーパーセット Cp935 UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット Cp937 UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット Cp939 UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット Cp942 日本語 (OS/2)、932 のスーパーセット Cp948 OS/2 中国語 (台湾)、938 のスーパーセット Cp949 PC 韓国語 Cp950 PC 中国語 (香港、台湾) Cp964 AIX 中国語 (台湾) Cp970 AIX 韓国語 EUCJIS JIS、EUC エンコーディング、日本語 GB2312 GB2312、EUC エンコーディング、中国語 (簡体字) GBK GBK、中国語 (簡体字) ISO2022CN ISO 2022 CN、中国語 ISO2022CN_CNS ISO-2022-CN 形式の CNS 11643、T. 中国語 ISO2022CN_GB ISO-2022-CN 形式の GB 2312、S. 中国語 ISO2022KR ISO 2022 KR、韓国語 JIS JIS、日本語 JIS0208 JIS 0208、日本語 KOI8_R KOI8-R、ロシア語 KSC5601 KS C 5601、韓国語 MS874 Windows タイ語 MacArabic Macintosh アラビア語 MacCentralEurope Macintosh ラテン文字-2 MacCroatian Macintosh クロアチア語 MacCyrillic Macintosh キリル文字 MacDingbat Macintosh Dingbat MacGreek Macintosh ギリシア語 MacHebrew Macintosh ヘブライ語 MacIceland Macintosh アイスランド語 MacRoman Macintosh Roman MacRomania Macintosh ルーマニア MacSymbol Macintosh シンボル MacThai Macintosh タイ MacTurkish Macintosh トルコ語 MacUkraine Macintosh ウクライナ SJIS Shift-JIS、日本語 UTF8 UTF-8