用戶:Mrhso2014/普及區

本頁面有關 Wikipedia:Unicode擴展漢字

在 ISO 10646,一個字符集,裏面有 CJKV 統一表意文字,收錄了喃字、簡化字、繁體字等。Unicode 與其保持同步。

中日韓越統一表意文字也有擴展區,一些生僻字、類推簡化在擴展區是有的,例如擴展 E 區就有「𬎆」。截至 2017 年,正式發佈的擴展區就有兼容擴展、擴展 A 區、擴展 B 區、擴展 C 區、擴展 D 區、擴展 E 區、擴展 F 區。

目前仍然有很多漢字沒有被收錄進 Unicode,關於漢字的收錄其實和 IRG 有關。

GB 18030 是一種特殊的 UTF,為了兼容 GB 2312 形成了詭異的排序。根據 Ishisashi 製作的 GB 18030Unicode Code Point 的對應表,可以看出 GB 18030 的基本結構。

GB 18030 完全兼容 GB 2312,多數兼容 GBKGB 18030 除了相對 GBK 映射到 PUA 的漢字映射有改變以及歐元的調整外,基本是兼容的。

GB 18030 的報批稿中同時有單字節和雙字節歐元,在正式版刪去。