EUC
日本語 | 拡張ユニックス符号 |
英語 | extended UNIX code |
ふりがな | いーゆーしー |
フリガナ | イーユーシー |
日本語用文字コードのひとつ。
UNIX系OSにて使用される文字コード。
1バイトもしくは2バイトを使用して1文字を表現する。
半角英数字はASCIIをそのまま使用し、この場合は1バイトである。
ひらがな、カタカナ、漢字は1バイト2つを使用する。
両バイトともに0xA1~0xFEの間の整数値が割り当てられている。
これはASCIIと被らないため、どの位置の文字を拾っても半角英数字か日本語かが判別できるため便利である。
EUCのIANAでの登録名は"EUC-JP"であり、Stringクラスのコンストラクタで渡す場合やgetBytes()メソッドに渡す場合には"EUC-JP"を使用する。
UNIX系OSにて使用される文字コード。
1バイトもしくは2バイトを使用して1文字を表現する。
半角英数字はASCIIをそのまま使用し、この場合は1バイトである。
ひらがな、カタカナ、漢字は1バイト2つを使用する。
両バイトともに0xA1~0xFEの間の整数値が割り当てられている。
これはASCIIと被らないため、どの位置の文字を拾っても半角英数字か日本語かが判別できるため便利である。
EUCのIANAでの登録名は"EUC-JP"であり、Stringクラスのコンストラクタで渡す場合やgetBytes()メソッドに渡す場合には"EUC-JP"を使用する。
参考サイト
// Sample.java
import java.io.UnsupportedEncodingException;
// Sample.java
public class Sample
{
public static void main( String[] args )
{
try
{
// 文字コード「EUC」(IANAに登録している名前は"EUC-JP")
// での「あいう」をStringクラスに渡します。
byte[] source = new byte[] { (byte)0xA4, (byte)0xA2, (byte)0xA4, (byte)0xA4, (byte)0xA4, (byte)0xA6 };
// 文字コードの変換はStringクラスのコンストラクタで行います。
// 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。
// 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。
// そうするとUnicodeに変換されて格納されます。
String string = new String( source, "EUC-JP" );
System.out.println( string );
// あいう
}
catch( UnsupportedEncodingException e )
{
// StringクラスのコンストラクタがUnsupportedEncodingException例外を
// 投げるので拾います。第2引数で渡された文字コード
// (上記の例では「EUC-JP」)が、Javaではサポート
// されていない文字コードの場合にエラーとなります。
e.printStackTrace();
}
}
}
import java.io.UnsupportedEncodingException;
// Sample.java
public class Sample
{
public static void main( String[] args )
{
try
{
// 文字コード「EUC」(IANAに登録している名前は"EUC-JP")
// での「あいう」をStringクラスに渡します。
byte[] source = new byte[] { (byte)0xA4, (byte)0xA2, (byte)0xA4, (byte)0xA4, (byte)0xA4, (byte)0xA6 };
// 文字コードの変換はStringクラスのコンストラクタで行います。
// 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。
// 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。
// そうするとUnicodeに変換されて格納されます。
String string = new String( source, "EUC-JP" );
System.out.println( string );
// あいう
}
catch( UnsupportedEncodingException e )
{
// StringクラスのコンストラクタがUnsupportedEncodingException例外を
// 投げるので拾います。第2引数で渡された文字コード
// (上記の例では「EUC-JP」)が、Javaではサポート
// されていない文字コードの場合にエラーとなります。
e.printStackTrace();
}
}
}
// Sample.java import java.io.UnsupportedEncodingException; // Sample.java public class Sample { public static void main( String[] args ) { try { // 文字コード「EUC」(IANAに登録している名前は"EUC-JP") // での「あいう」をStringクラスに渡します。 byte[] source = new byte[] { (byte)0xA4, (byte)0xA2, (byte)0xA4, (byte)0xA4, (byte)0xA4, (byte)0xA6 }; // 文字コードの変換はStringクラスのコンストラクタで行います。 // 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。 // 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。 // そうするとUnicodeに変換されて格納されます。 String string = new String( source, "EUC-JP" ); System.out.println( string ); // あいう } catch( UnsupportedEncodingException e ) { // StringクラスのコンストラクタがUnsupportedEncodingException例外を // 投げるので拾います。第2引数で渡された文字コード // (上記の例では「EUC-JP」)が、Javaではサポート // されていない文字コードの場合にエラーとなります。 e.printStackTrace(); } } }