JavaA2Z

KAB-studio > プログラミング > JavaA2Z > EUCとは

EUC

日本語 拡張ユニックス符号
英語 extended UNIX code
ふりがな いーゆーしー
フリガナ イーユーシー

解説

日本語用文字コードのひとつ。
UNIX系OSにて使用される文字コード
 
1バイトもしくは2バイトを使用して1文字を表現する。
半角英数字ASCIIをそのまま使用し、この場合は1バイトである。
ひらがな、カタカナ、漢字は1バイト2つを使用する。
バイトともに0xA1~0xFEの間の整数値が割り当てられている。
これはASCIIと被らないため、どの位置の文字を拾っても半角英数字か日本語かが判別できるため便利である。
 
EUCのIANAでの登録名は"EUC-JP"であり、Stringクラスコンストラクタで渡す場合やgetBytes()メソッドに渡す場合には"EUC-JP"を使用する。

参考サイト


(KAB-studioからのおしらせです)

サンプルプログラム(とか)サンプルを別ウィンドウで表示サンプルをクリップボードへコピー(WindowsでIEの場合のみ)

// Sample.java
import java.io.UnsupportedEncodingException;

// Sample.java
public class Sample
{
    public static void main( String[] args )
    {
        try
        {
            // 文字コード「EUC」(IANAに登録している名前は"EUC-JP")
            // での「あいう」をStringクラスに渡します。
            byte[] source = new byte[] { (byte)0xA4, (byte)0xA2, (byte)0xA4, (byte)0xA4, (byte)0xA4, (byte)0xA6 };
            // 文字コードの変換はStringクラスのコンストラクタで行います。
            // 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。
            // 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。
            // そうするとUnicodeに変換されて格納されます。
            String string = new String( source, "EUC-JP" );
            System.out.println( string );
            // あいう
        }
        catch( UnsupportedEncodingException e )
        {
            // StringクラスのコンストラクタがUnsupportedEncodingException例外を
            // 投げるので拾います。第2引数で渡された文字コード
            // (上記の例では「EUC-JP」)が、Javaではサポート
            // されていない文字コードの場合にエラーとなります。
            e.printStackTrace();
        }

    }
}
// Sample.java
import java.io.UnsupportedEncodingException;

// Sample.java
public class Sample
{
    public static void main( String[] args )
    {
        try
        {
            // 文字コード「EUC」(IANAに登録している名前は"EUC-JP")
            // での「あいう」をStringクラスに渡します。
            byte[] source = new byte[] { (byte)0xA4, (byte)0xA2, (byte)0xA4, (byte)0xA4, (byte)0xA4, (byte)0xA6 };
            // 文字コードの変換はStringクラスのコンストラクタで行います。
            // 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。
            // 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。
            // そうするとUnicodeに変換されて格納されます。
            String string = new String( source, "EUC-JP" );
            System.out.println( string );
            // あいう
        }
        catch( UnsupportedEncodingException e )
        {
            // StringクラスのコンストラクタがUnsupportedEncodingException例外を
            // 投げるので拾います。第2引数で渡された文字コード
            // (上記の例では「EUC-JP」)が、Javaではサポート
            // されていない文字コードの場合にエラーとなります。
            e.printStackTrace();
        }

    }
}

この単語を含むページ

「みだし」に含まれているページ

「解説」に含まれているページ

はてなブックマーク 詳細を表示 はてなブックマーク ブックマーク数
livedoorクリップ 詳細を表示 livedoorクリップ ブックマーク数
Yahoo!ブックマーク 詳細を表示 users
del.icio.us 登録する RSSに登録
サンプルを別ウィンドウで表示
サンプルをクリップボードへコピー(WindowsでIEの場合のみ)
update:2006/01/24
このページは、Javaプログラミング言語についての用語を網羅した辞書「JavaA2Z」の一ページです。
詳しくは「JavaA2Z」表紙の説明をご覧ください。