テキストデータ

コンピュータと文字

コンピュータなどの情報機器では、文字に数字を割り振ることで文字を扱っている。

文字集合(文字セット)
例) JIS第一水準・ユニコード2.0,常用漢字表・諸橋大漢和の見出し漢字…
エンコード(符号化方式)
例) Shift JIS・ISO 2022-JP・日本語EUC・UTF-8…

符号化方式別の文字番号の例

文字JIS区点番号Shift JISISO 2022-JP日本語EUCユニコード(UTF16)
27区68点16進数8E843B64BBE48E84
2進数10001110100001001110110110010010111011111001001000111010000100
10進数36484152044810036484
4区47点16進数82CD244FA4CF306F
2進数10000010110011011001000100111110100100110011110011000001101111
10進数3348592954219112399

コンピュータと16進数

そもそもコンピュータで扱う情報はすべて1と0の組み合わせ

2進数と16進数
36484(10進数)=1000111010000100(2進数)=8E84(16進数)
2進数は4桁ごとに16進数0~Fに対応する(2^4=16だから)
1000111010000100
8E84
情報の最小単位 ビット
0か1か=1ビット

文字化け

  1. 異なる文字コード
    1. 文字集合の違い →外字・機種依存文字
    2. 符号化方式の違い
  2. 異なるフォント

JIS漢字コード

1969年 JIS X 0201(JISローマ字カナ) ASCII+カタカナ
1978年 JIS X 0208(JIS基本漢字) 〈ISO2022系〉非漢字453字・漢字6349字(第1水準・第2水準)
    78JIS 旧JIS 
    83JIS 非漢字71字・漢字4字追加。字体の変更、第1水準・第2水準間の字体の入れ替え。これ以降を新JIS
    90JIS 漢字2字追加
    97JIS 「包摂規準」
1990年 JIS X 0212(JIS補助漢字) 〈ISO2022系〉非漢字245字・漢字5801字
2000年 JIS X 0213(JIS拡張漢字) 〈ISO2022系〉非漢字659字・漢字3685字(第3水準・第4水準)
    JIS X 0213:2004年 改正
2012年 JIS X 0213:2012 2010年改訂の常用漢字表改定に対応

〈ISO 10646(Unicode)系〉

1995年 [[JIS X 0221>https://ja.wikipedia.org/wiki/JIS_X_0221]]
 :
2014年 JIS X 0221:2014 絵文字追加(Unicode6.1)
2020年 JIS X 0221:2020 戸籍統一文字・変体仮名など(Unicode10.0)

Counter: 10065, today: 1, yesterday: 2

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2021-04-16 (金) 12:57:03