文字
日本語 | 文字 |
英語 | character |
ふりがな | もじ |
フリガナ | モジ |
文字列の要素ひとつひとつ。「A」「あ」等。
いわゆる一般的な文字のこと。
Javaでは、文字ひとつひとつはchar型の値であり、2バイトの符号なし整数値である。
この整数値の、「どの文字がどの値か」は文字コードのひとつ「Unicode」という形式で決められている。たとえば「あ」という文字は16進数では「0x3042」という値である。また、この数値そのものを「文字コード」と呼ぶ場合もある。
文字1文字はchar型変数として格納できる。また、プログラム上で直接リテラルで表現する場合には、「'あ'」のように''を用いて文字を囲む事で文字リテラルとして表現できる。
この文字を連続して並べたものが文字列であり、Stringクラスに格納することができる。Stringクラスの1文字を取得する場合にはcharAt()メソッドを使用する。
文字は、内部データとしては2バイトの符号なし整数値である。
この値が画面に出力される際には、まずUnicodeからOS標準の文字コードに変換され、その変換された値でフォントから該当する文字を取得し、そのフォントを用いて画面上に表示する。
また、Webブラウザ上に表示する場合には、Unicodeから表示用HTMLの文字コードへと変換し、ブラウザがその文字コードからOS標準の文字コードへと変換して、後は同様に出力される。
いわゆる一般的な文字のこと。
Javaでは、文字ひとつひとつはchar型の値であり、2バイトの符号なし整数値である。
この整数値の、「どの文字がどの値か」は文字コードのひとつ「Unicode」という形式で決められている。たとえば「あ」という文字は16進数では「0x3042」という値である。また、この数値そのものを「文字コード」と呼ぶ場合もある。
文字1文字はchar型変数として格納できる。また、プログラム上で直接リテラルで表現する場合には、「'あ'」のように''を用いて文字を囲む事で文字リテラルとして表現できる。
この文字を連続して並べたものが文字列であり、Stringクラスに格納することができる。Stringクラスの1文字を取得する場合にはcharAt()メソッドを使用する。
文字は、内部データとしては2バイトの符号なし整数値である。
この値が画面に出力される際には、まずUnicodeからOS標準の文字コードに変換され、その変換された値でフォントから該当する文字を取得し、そのフォントを用いて画面上に表示する。
また、Webブラウザ上に表示する場合には、Unicodeから表示用HTMLの文字コードへと変換し、ブラウザがその文字コードからOS標準の文字コードへと変換して、後は同様に出力される。
参考サイト
// Sample.java
public class Sample
{
public static void main( String[] args )
{
// 文字1文字。
// char型変数を作り、文字リテラル「あ」を格納します。
char ch = 'あ';
System.out.println( ch );
// あ
// 内部的には、文字は2バイトサイズの符号なし整数値です。
// 先ほどの文字を16進数で表示してみます。
System.out.println( Integer.toHexString( ch ) );
// 3042
// この整数値を「文字コード」といいます。
// 文字コードを直接セットして文字を出力します。
ch = 0x3044;
System.out.println( ch );
// い
// Stringクラスの1文字ずつも、この文字です。
String string = "あいうえお";
// 文字の取得はcharAt()メソッドで行います。
ch = string.charAt( 2 );
System.out.println( ch );
System.out.println( Integer.toHexString( ch ) );
// う
// 3046
// この「3044」という整数値を「文字コード」という「変換表」を
// 用いて「い」に読み替えて、フォント中の該当文字を取得して
// 画面出力することで「い」と出力されるわけです。
// 同じ「1」でも、整数の「1」と、文字の「1」では全く異なります。
// 整数の1。
System.out.println( Integer.toHexString( 1 ) );
// 1
// 文字の'1'。
System.out.println( Integer.toHexString( '1' ) );
// 31
// つまり、Unicodeでの'1'は、内部的には16進数で31という数と
// いうことです。
}
}
public class Sample
{
public static void main( String[] args )
{
// 文字1文字。
// char型変数を作り、文字リテラル「あ」を格納します。
char ch = 'あ';
System.out.println( ch );
// あ
// 内部的には、文字は2バイトサイズの符号なし整数値です。
// 先ほどの文字を16進数で表示してみます。
System.out.println( Integer.toHexString( ch ) );
// 3042
// この整数値を「文字コード」といいます。
// 文字コードを直接セットして文字を出力します。
ch = 0x3044;
System.out.println( ch );
// い
// Stringクラスの1文字ずつも、この文字です。
String string = "あいうえお";
// 文字の取得はcharAt()メソッドで行います。
ch = string.charAt( 2 );
System.out.println( ch );
System.out.println( Integer.toHexString( ch ) );
// う
// 3046
// この「3044」という整数値を「文字コード」という「変換表」を
// 用いて「い」に読み替えて、フォント中の該当文字を取得して
// 画面出力することで「い」と出力されるわけです。
// 同じ「1」でも、整数の「1」と、文字の「1」では全く異なります。
// 整数の1。
System.out.println( Integer.toHexString( 1 ) );
// 1
// 文字の'1'。
System.out.println( Integer.toHexString( '1' ) );
// 31
// つまり、Unicodeでの'1'は、内部的には16進数で31という数と
// いうことです。
}
}
// Sample.java public class Sample { public static void main( String[] args ) { // 文字1文字。 // char型変数を作り、文字リテラル「あ」を格納します。 char ch = 'あ'; System.out.println( ch ); // あ // 内部的には、文字は2バイトサイズの符号なし整数値です。 // 先ほどの文字を16進数で表示してみます。 System.out.println( Integer.toHexString( ch ) ); // 3042 // この整数値を「文字コード」といいます。 // 文字コードを直接セットして文字を出力します。 ch = 0x3044; System.out.println( ch ); // い // Stringクラスの1文字ずつも、この文字です。 String string = "あいうえお"; // 文字の取得はcharAt()メソッドで行います。 ch = string.charAt( 2 ); System.out.println( ch ); System.out.println( Integer.toHexString( ch ) ); // う // 3046 // この「3044」という整数値を「文字コード」という「変換表」を // 用いて「い」に読み替えて、フォント中の該当文字を取得して // 画面出力することで「い」と出力されるわけです。 // 同じ「1」でも、整数の「1」と、文字の「1」では全く異なります。 // 整数の1。 System.out.println( Integer.toHexString( 1 ) ); // 1 // 文字の'1'。 System.out.println( Integer.toHexString( '1' ) ); // 31 // つまり、Unicodeでの'1'は、内部的には16進数で31という数と // いうことです。 } }
「みだし」に含まれているページ
- \n
- \r
- \t
- \u
- char
- Character
- CharArrayReader
- CharArrayWriter
- CharSequence
- CUI
- ISO-10646-UCS-2
- String
- StringBuffer
- StringBufferInputStream
- StringIndexOutOfBoundsException
- StringReader
- StringTokenizer
- StringWriter
- substring
- toString
- UCS-2
- Unicode
- UTF-8
- エスケープシーケンス
- キャラクターセット
- キャラセット
- タブ文字
- バックスラッシュコード
- バッファアンダーフロー
- バッファアンダーラン
- バッファオーバーフロー
- バッファオーバーラン
- ファイル区切り文字
- 大文字
- 小文字
- 改行文字
- 文字
- 文字エンコーディング
- 文字エンコード
- 文字コード
- 文字ストリーム
- 文字セット
- 文字リテラル
- 文字入力ストリーム
- 文字出力ストリーム
- 文字列
- 文字列リテラル
- 文字化け
- 文字集合
- 正規表現
「解説」に含まれているページ
- "
- $
- '
- *演算子
- +演算子
- -演算子
- .
- ..
- /
- /演算子
- 0x
- 0X
- 16進数
- 2進数
- 8進数
- <%@ page contentType
- <%@ page pageEncoding
- <T>
- ?
- [L
- \
- \"
- \'
- \\
- \n
- \r
- \t
- \u
- _
- args
- ASCII
- BigDecimal
- BigInteger
- boolean
- BufferedReader
- BufferedWriter
- byte
- Byte
- ByteArrayInputStream
- ByteArrayOutputStream
- C++言語
- char
- Character
- CharArrayReader
- CharArrayWriter
- CharSequence
- Class
- Commons
- concat
- Content-Type
- Cookie
- CP932
- CSV
- CUI
- DataInputStream
- DataOutputStream
- DecimalFormat
- doGet
- DOM
- Double
- DTD
- EOF
- EUC
- Exception
- File
- FileInputStream
- FileOutputStream
- FileReader
- FileWriter
- FilterReader
- FilterWriter
- Float
- getBytes
- getter
- getter/setter
- Graphics
- HEAD
- HTML
- HTTP
- HttpServletRequest
- HttpServletResponse
- IANA
- InputStreamReader
- Integer
- IPアドレス
- ISO
- ISO-2022-JP
- ISO-8859-1
- JAVA
- JAVA_HOME
- JavaBeans
- JIS
- length
- LineNumberInputStream
- LineNumberReader
- localhost
- long
- Long
- main
- matches
- MIME
- MS932
- NumberFormatException
- OutputStreamWriter
- PipedReader
- PipedWriter
- POST
- PreparedStatement
- println
- printStackTrace
- PrintStream
- PrintWriter
- PushbackReader
- Reader
- Rss4j
- setter
- Shift_JIS
- short
- Short
- SimpleDateFormat
- size
- SQL
- SQLインジェクション
- static final
- String
- StringBuffer
- StringBufferInputStream
- StringIndexOutOfBoundsException
- StringReader
- StringTokenizer
- StringWriter
- substring
- TCP
- Throwable
- toString
- UCS-2
- UDP
- Unicode
- URL
- URLDecoder
- URLEncoder
- US-ASCII
- UTF-8
- valueOf
- Writer
- Xerces
- XML
- 「D」
- 「d」
- 「F」
- 「f」
- 「L」
- 「l」
- 「-」
- 「~」
- 〓
- アンダーフロー
- インスタンスは不変
- インデント
- エイリアス
- エスケープシーケンス
- エラー
- エンコーディング
- エンコード
- エンティティコード
- オーバーフロー
- オーバーロード
- キャラクターセット
- キャラセット
- クッキー
- クライアントサーバーシステム
- クロスサイトスクリプティング
- コメント
- コンソール
- コード
- サニタイジング
- システムプロパティ
- シフトJIS
- シーケンス
- ストリーム
- スペース
- セキュリティホール
- セッション
- セッションID
- ソースファイル
- タブ
- タブ文字
- ダンプ
- テキストファイル
- トークン
- ドメイン名
- ハッシュコード
- ハッシュ値
- バイト
- バイトストリーム
- バイト入力ストリーム
- バイト出力ストリーム
- バイナリーファイル
- バックスラッシュコード
- バッファ
- バッファアンダーフロー
- バッファアンダーラン
- バッファオーバーフロー
- バッファオーバーラン
- パス
- パラメーター
- パース
- ファイル
- ファイル区切り文字
- フォント
- フォーマット
- フラッシュ
- プリミティブ型
- プロトコル
- プロパティファイル
- メソッド
- ラベル
- リクエストパラメーター
- リクエストヘッダー
- リテラル
- ログ
- ログファイル
- ロケール
- 丸数字
- 予約語
- 全角
- 全角スペース
- 全角ハイフン
- 再描画
- 制御コード
- 半角
- 半角カタカナ
- 半角英数字
- 型
- 大文字
- 契約による設計
- 実体参照
- 小文字
- 拡張子
- 描画
- 改行
- 改行文字
- 文字
- 文字エンコーディング
- 文字エンコード
- 文字コード
- 文字ストリーム
- 文字セット
- 文字リテラル
- 文字入力ストリーム
- 文字出力ストリーム
- 文字列
- 文字列リテラル
- 文字化け
- 文字集合
- 検索
- 標準エラー出力
- 標準入出力
- 標準出力
- 正規表現
- 浮動小数点リテラル
- 添え字
- 環境変数
- 符号
- 絶対パス
- 置換
- 識別子
「サンプルプログラムとか」に含まれているページ
- !=
- "
- $
- &=演算子
- &演算子
- '
- */
- +演算子
- /*
- /**
- //
- 0x
- 10進数
- 127.0.0.1
- 16進数
- 2の補数
- 2進数
- 8進数
- <% %>
- <%! %>
- <%-- --%>
- <%= %>
- <%@ %>
- <%@ page
- <%@ page contentType
- <%@ page errorPage
- <%@ page import
- <%@ page isErrorPage
- <%@ page pageEncoding
- <%@ taglib
- <<=演算子
- <<演算子
- <jsp:useBean>
- >>=演算子
- >>>=演算子
- >>>演算子
- >>演算子
- @return
- \
- \"
- \'
- \\
- \n
- \u
- ^=演算子
- ^演算子
- _
- args
- ArrayList
- ASCII
- assert
- BigDecimal
- boolean
- BufferedReader
- BufferedWriter
- char
- Character
- CharArrayReader
- CharArrayWriter
- compareTo
- concat
- Content-Type
- Cookie
- CP932
- DecimalFormat
- DOM
- doPost
- double
- Double
- DTD
- Enumeration
- EUC
- EUC-JP
- Exception
- exception
- FileInputStream
- FileReader
- FileWriter
- FilterReader
- FilterWriter
- float
- Float
- GET
- getBytes
- getter
- HashMap
- HEAD
- HTTP
- HttpServletRequest
- HttpURLConnection
- IANA
- InputStreamReader
- INSERT
- int
- Integer
- IPアドレス
- ISO-10646-UCS-2
- ISO-2022-JP
- ISO-8859-1
- J2SE
- Jasper
- JasperException
- JAVA
- java.net.URL
- JavaBeans
- Javadoc
- javadoc
- JSP
- JspWriter
- JSPコメント
- JSPディレクティブ
- JSP宣言
- JSP式
- JSP指示子
- JSP暗黙オブジェクト
- JSP暗黙オブジェクト「application」
- JSP暗黙オブジェクト「config」
- JSP暗黙オブジェクト「exception」
- JSP暗黙オブジェクト「out」
- JSP暗黙オブジェクト「pageContext」
- JSP暗黙オブジェクト「request」
- JSP暗黙オブジェクト「response」
- JSP暗黙オブジェクト「session」
- JSTL
- length
- libディレクトリ
- LineNumberInputStream
- LineNumberReader
- localhost
- Log4j
- Long
- main
- Map
- MS932
- NaN
- Node
- NumberFormatException
- OutputStreamWriter
- PageContext
- PipedReader
- PipedWriter
- POST
- println
- printStackTrace
- PrintStream
- PrintWriter
- PushbackReader
- Reader
- regex
- regexp
- RequestDispatcher
- ResourceBundle
- ResultSet
- SELECT
- ServletContext
- setter
- Shift_JIS
- Short
- SimpleDateFormat
- SQLインジェクション
- Statement
- strictfp
- String
- StringBuffer
- StringBufferInputStream
- StringReader
- StringTokenizer
- StringWriter
- substring
- System.err
- TCP
- toString
- UCS-2
- UDP
- Unicode
- URI
- URL
- URLDecoder
- URLEncoder
- US-ASCII
- UTF-8
- valueOf
- Webアプリケーション
- Windows-31J
- Writer
- Xerces
- XML
- XMLスキーマ
- XMLスキーマ言語
- |=演算子
- |演算子
- ~演算子
- 「E」
- 「e」
- 「-」
- 「~」
- アクセサー
- アサーション
- アドレス
- エイリアス
- エンコーディング
- エンコード
- オブジェクト指向
- オーバーライド
- カスタムタグライブラリ
- キャラクターセット
- クエリー
- クッキー
- クライアント
- クライアントサーバーシステム
- クロスサイトスクリプティング
- コマンドライン引数
- コンソール
- コンパイル
- コンパイルタイムエラー
- コンポジション
- コード
- サニタイジング
- サーバー
- シフトJIS
- シーケンス
- ジェネリッククラス
- スクリプトレット
- ステートレス
- スペース
- セッションスコープ
- ソケット
- タグライブラリ
- タグリブ
- タブ
- タブ文字
- ダイアログ
- ダンプ
- テキストファイル
- デコード
- トークン
- ドキュメンテーションコメント
- ドメイン名
- バイアス
- バイト
- バイナリーファイル
- バッファ
- バッファアンダーフロー
- バッファアンダーラン
- バッファオーバーフロー
- バッファオーバーラン
- パス
- パース
- ビットシフト演算子
- ビットフラグ
- ファイル区切り文字
- フォント
- フラッシュ
- プリミティブ型
- ホスト
- ポリモーフィズム
- ポート番号
- マニフェストファイル
- モーダルダイアログ
- モードレスダイアログ
- ラベル
- リクエスト
- リクエストスコープ
- リクエストパラメーター
- リクエストヘッダー
- リソースバンドル
- リテラル
- レスポンス
- レスポンスヘッダー
- 丸数字
- 予約語
- 仮数部
- 入力フォーム
- 全角
- 列
- 半角
- 半角カタカナ
- 半角英数字
- 単項+演算子
- 大文字
- 契約による設計
- 委譲
- 実体参照
- 実数
- 引数
- 指数部
- 改行
- 改行文字
- 整数
- 文字
- 文字エンコーディング
- 文字エンコード
- 文字コード
- 文字セット
- 文字リテラル
- 文字入力ストリーム
- 文字出力ストリーム
- 文字列
- 文字列リテラル
- 文字化け
- 木構造
- 桁溢れ
- 桁落ち
- 標準入出力
- 正規表現
- 浮動小数点
- 無理数
- 無限大
- 環境変数
- 空ステートメント
- 算術右シフト
- 置換
- 行
- 論理右シフト
- 識別子
- 集約