JavaA2Z

KAB-studio > プログラミング > JavaA2Z > 文字とは

文字

日本語 文字
英語 character
ふりがな もじ
フリガナ モジ

解説

文字列要素ひとつひとつ。「A」「あ」等。
いわゆる一般的な文字のこと。
Javaでは、文字ひとつひとつはcharの値であり、2バイト符号なし整数値である。
この整数値の、「どの文字がどの値か」は文字コードのひとつ「Unicode」という形式で決められている。たとえば「あ」という文字は16進数では「0x3042」という値である。また、この数値そのものを「文字コード」と呼ぶ場合もある。
 
文字1文字はchar変数として格納できる。また、プログラム上で直接リテラルで表現する場合には、「''」のように''を用いて文字を囲む事で文字リテラルとして表現できる。
この文字を連続して並べたものが文字列であり、Stringクラスに格納することができる。Stringクラスの1文字を取得する場合にはcharAt()メソッドを使用する。
 
文字は、内部データとしては2バイト符号なし整数値である。
この値が画面に出力される際には、まずUnicodeからOS標準の文字コードに変換され、その変換された値でフォントから該当する文字を取得し、そのフォントを用いて画面上に表示する。
また、Webブラウザ上に表示する場合には、Unicodeから表示用HTML文字コードへと変換し、ブラウザがその文字コードからOS標準の文字コードへと変換して、後は同様に出力される。

参考サイト


(KAB-studioからのおしらせです)

サンプルプログラム(とか)サンプルを別ウィンドウで表示サンプルをクリップボードへコピー(WindowsでIEの場合のみ)

// Sample.java
public class Sample
{
    public static void main( String[] args )
    {
        // 文字1文字。
        // char型変数を作り、文字リテラル「あ」を格納します。
        char ch = 'あ';
        System.out.println( ch );
        // あ

        // 内部的には、文字は2バイトサイズの符号なし整数値です。
        // 先ほどの文字を16進数で表示してみます。
        System.out.println( Integer.toHexString( ch ) );
        // 3042

        // この整数値を「文字コード」といいます。
        // 文字コードを直接セットして文字を出力します。
        ch = 0x3044;
        System.out.println( ch );
        // い

        // Stringクラスの1文字ずつも、この文字です。
        String string = "あいうえお";
        // 文字の取得はcharAt()メソッドで行います。
        ch = string.charAt( 2 );
        System.out.println( ch );
        System.out.println( Integer.toHexString( ch ) );
        // う
        // 3046

        // この「3044」という整数値を「文字コード」という「変換表」を
        // 用いて「い」に読み替えて、フォント中の該当文字を取得して
        // 画面出力することで「い」と出力されるわけです。

        // 同じ「1」でも、整数の「1」と、文字の「1」では全く異なります。
        // 整数の1。
        System.out.println( Integer.toHexString( 1 ) );
        // 1

        // 文字の'1'。
        System.out.println( Integer.toHexString( '1' ) );
        // 31
        // つまり、Unicodeでの'1'は、内部的には16進数で31という数と
        // いうことです。
    }
}
// Sample.java
public class Sample
{
    public static void main( String[] args )
    {
        // 文字1文字。
        // char型変数を作り、文字リテラル「あ」を格納します。
        char ch = 'あ';
        System.out.println( ch );
        // あ

        // 内部的には、文字は2バイトサイズの符号なし整数値です。
        // 先ほどの文字を16進数で表示してみます。
        System.out.println( Integer.toHexString( ch ) );
        // 3042

        // この整数値を「文字コード」といいます。
        // 文字コードを直接セットして文字を出力します。
        ch = 0x3044;
        System.out.println( ch );
        // い

        // Stringクラスの1文字ずつも、この文字です。
        String string = "あいうえお";
        // 文字の取得はcharAt()メソッドで行います。
        ch = string.charAt( 2 );
        System.out.println( ch );
        System.out.println( Integer.toHexString( ch ) );
        // う
        // 3046

        // この「3044」という整数値を「文字コード」という「変換表」を
        // 用いて「い」に読み替えて、フォント中の該当文字を取得して
        // 画面出力することで「い」と出力されるわけです。

        // 同じ「1」でも、整数の「1」と、文字の「1」では全く異なります。
        // 整数の1。
        System.out.println( Integer.toHexString( 1 ) );
        // 1

        // 文字の'1'。
        System.out.println( Integer.toHexString( '1' ) );
        // 31
        // つまり、Unicodeでの'1'は、内部的には16進数で31という数と
        // いうことです。
    }
}

この単語を含むページ

「解説」に含まれているページ

「サンプルプログラムとか」に含まれているページ

はてなブックマーク 詳細を表示 はてなブックマーク ブックマーク数
livedoorクリップ 詳細を表示 livedoorクリップ ブックマーク数
Yahoo!ブックマーク 詳細を表示 users
del.icio.us 登録する RSSに登録
サンプルを別ウィンドウで表示
サンプルをクリップボードへコピー(WindowsでIEの場合のみ)
update:2005/10/11
このページは、Javaプログラミング言語についての用語を網羅した辞書「JavaA2Z」の一ページです。
詳しくは「JavaA2Z」表紙の説明をご覧ください。