私人使用区

Unicode中,私人使用区(英語:Private Use Areas,PUA)指其解释未在Unicode标准中指定,而是由合作用户之间的私人协议决定其用途的一系列码位。[4] 目前定义了三个私人使用区:一个在基本多语言平面(U+E000-U+F8FF)中,另外两个几乎包含了整个第15和第16平面(分别为U+F0000-U+FFFFD,U+100000-U+10FFFD)。[5]

私人使用区
Private Use Area
範圍U+E000..U+F8FF
(6,400個碼位)
平面基本多文種平面BMP
文字
已分配6,400個碼位
未分配0個保留碼位
統一碼版本歷史
1.0.05,632 (+5,632)
1.0.16,400 (+768)
註釋:Unicode 1.0.1 版移动并扩展了私人使用区。 (1.0.0 版中曾位于 U+E800-U+FDFF。)[1][2][3]
补充私人使用区-A
範圍U+F0000..U+FFFFD
(65,534個碼位)
平面私人使用區-A
文字未知
已分配65,534個碼位
未分配−2個保留碼位
2個非字符
統一碼版本歷史
2.065,534 (+65,534)
註釋[2][3]
补充私人使用区-B
範圍U+100000..U+10FFFD
(65,534個碼位)
平面私人使用區-B
文字未知
已分配65,534個碼位
未分配−2個保留碼位
2個非字符
統一碼版本歷史
2.065,534 (+65,534)
註釋[2][3]

私人使用区字符的分配,可以不由字面意义上的“私人”决定。一些组织已经发布了一些分配计划。但根据其定义,私人使用区相同的代码点可分配为不同的字符,因此使用某种字体的用户看到其显示为一种形态,但使用其它字体的用户看到的字符可能完全不同。

使用实例

  • 中国国家标准 GB/T 20542-2006(“藏文编码字符集扩展A”)和 GB/T 22238-2008(“藏文编码字符集扩展B”)使用私人使用区存放藏文连字。
  • GB 18030GBK使用私人使用区临时编码Unicode标准之外的字符。
  • 爱沙尼亚语言研究院使用私人使用区编码Unicode标准未收录的拉丁字母和西里尔字母。[6]
  • 機讀編目格式標準MARC 21使用私人使用区编码未被Unicode收录的东亚字符。
  • 美国國際语言暑期学院使用私人使用区编码Unicode标准未收录的语言中的字符。

分配

Unicode 私人使用区
按字符属性定义: General Category=Co[a][b]
范围 平面 区块名 码位总数 注释
U+E000..U+F8FF 基本多语言平面 私人使用區
Private Use Area
6,400
U+F0000..U+FFFFD[c] 第15平面[d] 補充私人使用區-A
Supplementary Private Use Area-A
65,534 UTF-16使用在基本多文種平面中的高半私人代用区(U+DB80..U+DBFF)编码这些字符。
U+100000..U+10FFFD[c] 第16平面[d] 補充私人使用區-B
Supplementary Private Use Area-B
65,534
注释
  1. ^ Unicode 10.0 Data
  2. ^ The Unicode Standard, Section 23.5: Private-Use Characters
  3. ^ 码位 U+FFFFE, U+FFFFF, U+10FFFE, U+10FFFF 是 非字符 ,而非私人使用区字符。
  4. ^ Unicode 未公布第15平面与第16平面的识别名。根据 Chapter 2.8 ,補充私人使用區-A与補充私人使用區-B是两个私人使用區区块的名字,而非平面的名字。

參見

Unicode輔助平面一覽表
基本平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

参考

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2022-07-09]. (原始内容 (PDF)存档于2022-07-02). 
  2. ^ 2.0 2.1 2.2 Unicode character database. The Unicode Standard. [2022-07-09]. (原始内容存档于2016-03-12). 
  3. ^ 3.0 3.1 3.2 Enumerated Versions of The Unicode Standard. The Unicode Standard. [2021-07-09]. (原始内容存档于2022-12-25). 
  4. ^ Unicode Consortium. Glossary of Unicode Terms: "Private Use Area (PUA)"页面存档备份,存于互联网档案馆
  5. ^ Chapter 16: Special Areas and Format Characters (PDF). The Unicode Standard. Unicode Consortium. [2021-03-19]. (原始内容 (PDF)存档于2022-01-17). 
  6. ^ Letter Database. Eki.ee. [2013-04-11]. (原始内容存档于2018-05-21).