native2ascii - ネイティブ - ASCII コンバータ

ネイティブコード (Latin 1 および Unicode 以外) のファイルを Unicode コードに変換します。

形式

native2ascii [options] [inputfile [outputfile]]

解説

Java コンパイラおよび Java ツールは、Latin-1 または Unicode コード (¥udddd 表記法) のファイルだけを処理することができます。native2ascii は、その他の文字コードのファイルを Latin-1 または Unicode コードのファイルに変換します。

outputfile を省略した場合、標準出力に出力されます。さらに、inputfile を省略した場合、標準入力から入力されます。

オプション

-reverse
逆の処理を行います。つまり、Latin-1 または Unicode コードのファイルをネイティブコードに変換します。

-encoding encoding_name
変換処理で使用するコードの名前を指定します。デフォルトのコードは、システムプロパティの file.encoding から取得されます。encoding_name の文字列は、下の表の最初の列から取得される文字列でなければなりません。

-------------------------------------------------------------

コンバータ       説明
クラス 
-------------------------------------------------------------

8859_1           ISO 8859-1          
8859_2           ISO 8859-2                             
8859_3           ISO 8859-3                                 
8859_4           ISO 8859-4                         
8859_5           ISO 8859-5                                    
8859_6           ISO 8859-6                                 
8859_7           ISO 8859-7                                     
8859_8           ISO 8859-8                                   
8859_9           ISO 8859-9                                     
Big5             Big5、中国語 (繁体字)
CNS11643         CNS 11643、中国語 (繁体字)
Cp037            米国、カナダ (2 か国語、フランス語)、オランダ、
                 ポルトガル、ブラジル、オーストラリア
Cp1006           IBM AIX パキスタン (ウルドゥー語)
Cp1025           IBM 多言語キリル文字: ブルガリア、ボスニア、
                 ヘルツェゴビナ、マケドニア (FYR)
Cp1026           IBM ラテン文字-5、トルコ
Cp1046           IBM オープン版米国 EBCDIC
Cp1097           IBM イラン (現代ペルシア語)/ペルシア語
Cp1098           IBM イラン (現代ペルシア語)/ペルシア語 (PC)
Cp1112           IBM ラトビア、リトアニア
Cp1122           IBM エストニア
Cp1123           IBM ウクライナ
Cp1124           IBM AIX ウクライナ
Cp1125           IBM AIX ウクライナ (PC)
Cp1250           Windows 東欧
Cp1251           Windows キリル文字
Cp1252           Windows ラテン文字-1
Cp1253           Windows ギリシア文字
Cp1254           Windows トルコ語
Cp1255           Windows ヘブライ語
Cp1256           Windows アラビア語
Cp1257           Windows バルト諸語
Cp1258           Windows ベトナム語
Cp1381           IBM OS/2、DOS 中国 (中華人民共和国)
Cp1383           IBM AIX 中国 (中華人民共和国)
Cp273            IBM オーストリア、ドイツ
Cp277            IBM デンマーク、ノルウェー
Cp278            IBM フィンランド、スウェーデン
Cp280            IBM イタリア
Cp284            IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ
Cp285            IBM 英国、アイルランド
Cp297            IBM フランス
Cp33722          IBM-eucJP - 日本語 (5050 のスーパーセット)
Cp420            IBM アラビア語
Cp424            IBM ヘブライ語
Cp437            MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ
Cp500            EBCDIC 500V1                                 
Cp737            PC ギリシア文字
Cp775            PC バルト諸語
Cp838            IBM タイ拡張 SBCS
Cp850            MS-DOS ラテン文字-1
Cp852            MS-DOS ラテン文字-2
Cp855            IBM キリル文字
Cp857            IBM トルコ語
Cp860            MS-DOS ポルトガル語
Cp861            MS-DOS アイスランド語
Cp862            PC ヘブライ語
Cp863            MS-DOS カナダ系フランス語
Cp864            PC アラビア語
Cp865            MS-DOS 北欧
Cp866            MS-DOS ロシア語
Cp868            MS-DOS パキスタン
Cp869            IBM 近代ギリシア語
Cp870            IBM 多言語ラテン文字-2
Cp871            IBM アイスランド
Cp874            IBM タイ
Cp875            IBM ギリシア語
Cp918            IBM パキスタン (ウルドゥー語)
Cp921            IBM ラトビア、リトアニア (AIX、DOS)
Cp922            IBM エストニア (AIX、DOS)
Cp930            UDC 4370 文字を含む日本語かたかな漢字、5026 のスーパーセット
Cp933            UDC 1880 文字を含む韓国語、5029 のスーパーセット
Cp935            UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット
Cp937            UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット
Cp939            UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット
Cp942            日本語 (OS/2)、932 のスーパーセット
Cp948            OS/2 中国語 (台湾)、938 のスーパーセット
Cp949            PC 韓国語
Cp950            PC 中国語 (香港、台湾)
Cp964            AIX 中国語 (台湾)
Cp970            AIX 韓国語
EUCJIS           JIS、EUC エンコーディング、日本語
GB2312           GB2312、EUC エンコーディング、中国語 (簡体字)
GBK              GBK、中国語 (簡体字)
ISO2022CN        ISO 2022 CN、中国語
ISO2022CN_CNS    ISO-2022-CN 形式の CNS 11643、T. 中国語
ISO2022CN_GB     ISO-2022-CN 形式の GB 2312、S. 中国語
ISO2022KR        ISO 2022 KR、韓国語
JIS              JIS、日本語
JIS0208          JIS 0208、日本語
KOI8_R           KOI8-R、ロシア語
KSC5601          KS C 5601、韓国語
MS874            Windows タイ語
MacArabic        Macintosh アラビア語
MacCentralEurope Macintosh ラテン文字-2
MacCroatian      Macintosh クロアチア語
MacCyrillic      Macintosh キリル文字
MacDingbat       Macintosh Dingbat      
MacGreek         Macintosh ギリシア語
MacHebrew        Macintosh ヘブライ語
MacIceland       Macintosh アイスランド語
MacRoman         Macintosh Roman     
MacRomania       Macintosh ルーマニア
MacSymbol        Macintosh シンボル
MacThai          Macintosh タイ
MacTurkish       Macintosh トルコ語
MacUkraine       Macintosh ウクライナ
SJIS             Shift-JIS、日本語
UTF8             UTF-8