User:Mrhso2014/普及區

本页面有关 Wikipedia:Unicode扩展汉字

在 ISO 10646,一個字符集,裏面有 CJKV 统一表意文字,收錄了喃字、簡化字、繁體字等。Unicode 與其保持同步。

中日韓越統一表意文字也有擴展區,一些生僻字、類推簡化在擴展區是有的,例如擴展 E 區就有「𬎆」。截至 2017 年,正式發佈的擴展區就有兼容擴展、擴展 A 區、擴展 B 區、擴展 C 區、擴展 D 區、擴展 E 區、擴展 F 區。

目前仍然有很多汉字没有被收录进 Unicode,关于汉字的收录其实和 IRG 有关。

GB 18030 是一种特殊的 UTF,为了兼容 GB 2312 形成了诡异的排序。根据 Ishisashi 制作的 GB 18030Unicode Code Point 的对应表,可以看出 GB 18030 的基本结构。

GB 18030 完全兼容 GB 2312,多数兼容 GBKGB 18030 除了相对 GBK 映射到 PUA 的汉字映射有改变以及欧元的调整外,基本是兼容的。

GB 18030 的报批稿中同时有单字节和双字节欧元,在正式版删去。