UCS-2
日本語 | 単一文字コード文字集合 |
英語 | Universal Character Set-2 |
ふりがな | ゆーしーえすつー、ゆーしーえすに |
フリガナ | ユーシーエスツー、ユーシーエスニ |
Javaの標準文字コードである「Unicode」のこと。
Unicodeの正式名称。「広義のUnicode」は、「様々な言語の文字を表現できる文字コード」という意味のため、「UTF-8」等の文字コードも含んでしまう。そういった場合に、「狭義のUnicode」を示すのが「UCS-2」である。
IANAで登録されている名称は"ISO-10646-UCS-2"であり、Stringクラスのコンストラクタで渡す場合やgetBytes()メソッドに渡す場合には"ISO-10646-UCS-2"を使用する。
Unicodeの正式名称。「広義のUnicode」は、「様々な言語の文字を表現できる文字コード」という意味のため、「UTF-8」等の文字コードも含んでしまう。そういった場合に、「狭義のUnicode」を示すのが「UCS-2」である。
IANAで登録されている名称は"ISO-10646-UCS-2"であり、Stringクラスのコンストラクタで渡す場合やgetBytes()メソッドに渡す場合には"ISO-10646-UCS-2"を使用する。
参考サイト
// Sample.java
import java.io.UnsupportedEncodingException;
// Sample.java
public class Sample
{
public static void main( String[] args )
{
try
{
// 文字コード「UCS-2」(Unicodeの正式名称)での
// 「あいう」をStringクラスに渡します。
byte[] source = new byte[] { (byte)0x30, (byte)0x42, (byte)0x30, (byte)0x44, (byte)0x30, (byte)0x46 };
// 文字コードの変換はStringクラスのコンストラクタで行います。
// 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。
// 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。
// そうするとUnicodeに変換されて格納されます。
String string = new String( source, "ISO-10646-UCS-2" );
System.out.println( string );
// あいう
}
catch( UnsupportedEncodingException e )
{
// StringクラスのコンストラクタがUnsupportedEncodingException例外を
// 投げるので拾います。第2引数で渡された文字コード
// (上記の例では「ISO-10646-UCS-2」)が、Javaではサポート
// されていない文字コードの場合にエラーとなります。
e.printStackTrace();
}
}
}
import java.io.UnsupportedEncodingException;
// Sample.java
public class Sample
{
public static void main( String[] args )
{
try
{
// 文字コード「UCS-2」(Unicodeの正式名称)での
// 「あいう」をStringクラスに渡します。
byte[] source = new byte[] { (byte)0x30, (byte)0x42, (byte)0x30, (byte)0x44, (byte)0x30, (byte)0x46 };
// 文字コードの変換はStringクラスのコンストラクタで行います。
// 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。
// 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。
// そうするとUnicodeに変換されて格納されます。
String string = new String( source, "ISO-10646-UCS-2" );
System.out.println( string );
// あいう
}
catch( UnsupportedEncodingException e )
{
// StringクラスのコンストラクタがUnsupportedEncodingException例外を
// 投げるので拾います。第2引数で渡された文字コード
// (上記の例では「ISO-10646-UCS-2」)が、Javaではサポート
// されていない文字コードの場合にエラーとなります。
e.printStackTrace();
}
}
}
// Sample.java import java.io.UnsupportedEncodingException; // Sample.java public class Sample { public static void main( String[] args ) { try { // 文字コード「UCS-2」(Unicodeの正式名称)での // 「あいう」をStringクラスに渡します。 byte[] source = new byte[] { (byte)0x30, (byte)0x42, (byte)0x30, (byte)0x44, (byte)0x30, (byte)0x46 }; // 文字コードの変換はStringクラスのコンストラクタで行います。 // 第1引数には他文字コードの文字列が格納されたbyte型配列を渡します。 // 第2引数には、そのbyte型配列に格納されている文字列の文字コードを渡します。 // そうするとUnicodeに変換されて格納されます。 String string = new String( source, "ISO-10646-UCS-2" ); System.out.println( string ); // あいう } catch( UnsupportedEncodingException e ) { // StringクラスのコンストラクタがUnsupportedEncodingException例外を // 投げるので拾います。第2引数で渡された文字コード // (上記の例では「ISO-10646-UCS-2」)が、Javaではサポート // されていない文字コードの場合にエラーとなります。 e.printStackTrace(); } } }