连词字符

连词字符(英语:Word joiner,简称“WJ”)是一个在Unicode中的格式字符,于部分不使用显式间距(explicit spacing)的语言中用作表达一个不应出现分字的地方。该字符自Unicode 3.2版本(2002年发布)起,以U+2060 WORD JOINER ,HTML:⁠收录。连词字符不会产生任何空格,故可防止相关位置出现自动换行的情况。[1]

连词字符取代了零宽不换行空格(zero width no-break space,ZWNBSP)字符(一个不建议采用的Unicode字符,其编码为U+FEFF)。U+FEFF字符原拟用于文件开首的字节顺序记号(Byte Order Mark,BOM),但根据Unicode标准,若该字符非在上述情况下使用,则应视为“零宽不换行空格”般使用。在Unicode 3.2版本起,Unicode联盟不再建议这种故意采用U+FEFF的方式,并强烈建议采用连词字符。[1][2]

参见

参考资料

  1. ^ 1.0 1.1 Layout Controls (PDF). The Unicode Standard, Version 12.0.0 (The Unicode Consortium). : 871 [2021-06-19]. (原始内容存档 (PDF)于2022-01-19). 
  2. ^ FAQ - UTF-8, UTF-16, UTF-32 & BOM, "What should I do with U+FEFF in the middle of a file?". The Unicode Consortium. [2021-06-19]. (原始内容存档于2021-05-02) (英语).