文字セット
日本語 | 文字集合 |
英語 | character set |
ふりがな | もじせっと |
フリガナ | モジセット |
文字の集まり。
プログラミングにおいて、文字はそれぞれ整数値と結び付けられている。その「文字」と「整数値」を一組として、それを多くの文字で構成したものが「文字セット」である。
文字セットは複数存在する。文字セットが異なると、「文字」と「整数値」の組み合わせも異なる。たとえば「あ」という文字は、「シフトJIS」という文字セットでは「0x82A0」だが、「Unicode」という文字セットでは「0x3042」である。
「文字セット」は、「文字コード」とほぼ同意である。
ただし、「文字コード」はやや曖昧な用語である。「文字コード」は「文字の集まり」としての意味も、「変換表」としての意味も持ち、また「文字に対する整数値そのもの」を意味することもある。
それに対して「文字セット」は「文字の集まり」としての意味が強く、「変換表」としての意味は弱い。また「文字に対する整数値そのもの」という意味は持たない。
「文字セット」は「文字エンコーディング」とほぼ同意である。
ただし、「文字エンコーディング」が「変換表」としての意味を強く持つのに対して、「文字セット」は「変換表」としての意味はあまり持たない。
ここまでの説明を無駄にすることになるが、「文字セット」と「文字エンコーディング」は、同意でありながら、場面によって切り替えられる場合もある。
「文字セット」という用語は、HTTPやMIMEにおいて特に強調されて使用されていることに注意。
これは、HTTPやMIMEにおいて「文字エンコーディング」という用語は使われにくい傾向にある、ということである。
プログラミングにおいて、文字はそれぞれ整数値と結び付けられている。その「文字」と「整数値」を一組として、それを多くの文字で構成したものが「文字セット」である。
文字セットは複数存在する。文字セットが異なると、「文字」と「整数値」の組み合わせも異なる。たとえば「あ」という文字は、「シフトJIS」という文字セットでは「0x82A0」だが、「Unicode」という文字セットでは「0x3042」である。
「文字セット」は、「文字コード」とほぼ同意である。
ただし、「文字コード」はやや曖昧な用語である。「文字コード」は「文字の集まり」としての意味も、「変換表」としての意味も持ち、また「文字に対する整数値そのもの」を意味することもある。
それに対して「文字セット」は「文字の集まり」としての意味が強く、「変換表」としての意味は弱い。また「文字に対する整数値そのもの」という意味は持たない。
「文字セット」は「文字エンコーディング」とほぼ同意である。
ただし、「文字エンコーディング」が「変換表」としての意味を強く持つのに対して、「文字セット」は「変換表」としての意味はあまり持たない。
ここまでの説明を無駄にすることになるが、「文字セット」と「文字エンコーディング」は、同意でありながら、場面によって切り替えられる場合もある。
「文字セット」という用語は、HTTPやMIMEにおいて特に強調されて使用されていることに注意。
これは、HTTPやMIMEにおいて「文字エンコーディング」という用語は使われにくい傾向にある、ということである。
参考サイト
- (参考サイトはありません)
「あーっややこしい!! 結局どういうこと?」
「それが言えたら苦労しねぇって……場面毎に意味が異なったり、ドキュメント毎に定義が違うんだよ」
「C++言語の時は文字コードだけで良かったのにねぇ……」
「ま、そういう時代じゃなくなったってこった」
「おばさん言うな!!」
「言ってない!!」
「それが言えたら苦労しねぇって……場面毎に意味が異なったり、ドキュメント毎に定義が違うんだよ」
「C++言語の時は文字コードだけで良かったのにねぇ……」
「ま、そういう時代じゃなくなったってこった」
「おばさん言うな!!」
「言ってない!!」
「あーっややこしい!! 結局どういうこと?」 「それが言えたら苦労しねぇって……場面毎に意味が異なったり、ドキュメント毎に定義が違うんだよ」 「C++言語の時は文字コードだけで良かったのにねぇ……」 「ま、そういう時代じゃなくなったってこった」 「おばさん言うな!!」 「言ってない!!」