組合字元

組合字元Combining character)在字體排印學中是用來改變其它字元所用的字元。在拉丁字母中,最常見的組合字元為附加符號(包含重音號)。 [1]

西里爾字母У短音符組合成Ў.

統一碼也包含許多預組字元(Precomposed character),即事先將字元組好並賦予碼位。所以有可能同時使用組合字元和預組字元。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先執行Unicode正規化[2]

在統一碼中,用於歐洲語言和國際音標的組合用附加符號為〈U+0300–U+036F〉。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字元之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟件能正確顯示此類組合。

OpenType

OpenType則有ccmp功能標籤,以定義字形是由其它組合字元所組合出來或可分解之,另有mark標籤用以將組合字元疊加於基本字元,以及mkmk標籤用以組合字元彼此之間的組合。

統一碼範圍

組合附加符號
Combining Diacritical Marks
[1]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x ◌̀ ◌́ ◌̂ ◌̃ ◌̄ ◌̅ ◌̆ ◌̇ ◌̈ ◌̉ ◌̊ ◌̋ ◌̌ ◌̍ ◌̎ ◌̏
U+031x ◌̐ ◌̑ ◌̒ ◌̓ ◌̔ ◌̕ ◌̖ ◌̗ ◌̘ ◌̙ ◌̚ ◌̛ ◌̜ ◌̝ ◌̞ ◌̟
U+032x ◌̠ ◌̡ ◌̢ ◌̣ ◌̤ ◌̥ ◌̦ ◌̧ ◌̨ ◌̩ ◌̪ ◌̫ ◌̬ ◌̭ ◌̮ ◌̯
U+033x ◌̰ ◌̱ ◌̲ ◌̳ ◌̴ ◌̵ ◌̶ ◌̷ ◌̸ ◌̹ ◌̺ ◌̻ ◌̼ ◌̽ ◌̾ ◌̿
U+034x ◌̀ ◌́ ◌͂ ◌̓ ◌̈́ ◌ͅ ◌͆ ◌͇ ◌͈ ◌͉ ◌͊ ◌͋ ◌͌ ◌͍ ◌͎  CGJ 
U+035x ◌͐ ◌͑ ◌͒ ◌͓ ◌͔ ◌͕ ◌͖ ◌͗ ◌͘ ◌͙ ◌͚ ◌͛ ◌͜◌ ◌͝◌ ◌͞◌ ◌͟◌
U+036x ◌͠◌ ◌͡◌ ◌͢◌ ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ
註釋
1.^ 依據 Unicode 14.0

碼點U+0346–034A為國際音標符號:

  • U+0346  ͆唇齒化
  • U+0347  ͇齒齦音
  • U+0348  ͈強音
  • U+0349  ͉ :弱音
  • U+034A  ͊去鼻音化

碼點U+034B–034E用於言語障礙國際音標附加符號

  • U+034B  ͋ :鼻腔洩氣
  • U+034C  ͌ :齶咽擦音
  • U+034D  ͍ :唇部伸展
  • U+034E  ͎ :哨音
組合附加符號擴充
Combining Diacritical Marks Extended
[1][2]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1ABx ◌᪰ ◌᪱ ◌᪲ ◌᪳ ◌᪴ ◌᪵ ◌᪶ ◌᪷ ◌᪸ ◌᪹ ◌᪺ ◌᪻ ◌᪼ ◌᪽ ◌᪾ ◌ᪿ
U+1ACx ◌ᫀ
U+1ADx
U+1AEx
U+1AFx
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域為未分配碼位
組合附加符號補充
Combining Diacritical Marks Supplement
[1][2]
Unicode Consortium 官方碼表(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCx ◌᷀ ◌᷁ ◌᷂ ◌᷃ ◌᷄ ◌᷅ ◌᷆ ◌᷇ ◌᷈ ◌᷉ ◌᷊ ◌᷋ ◌᷌ ◌᷍ ◌᷎ ◌᷏
U+1DDx ◌᷐ ◌᷑ ◌᷒ ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ
U+1DEx ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ
U+1DFx ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ ◌᷵ ◌᷶ ◌᷷ ◌᷸ ◌᷹ ◌᷻ ◌᷼ ◌᷽ ◌᷾ ◌᷿
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域為未分配碼位
符號用組合附加符號
Combining Diacritical Marks for Symbols[1][2]
Unicode Consortium 官方碼表 (PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20Dx ◌⃐ ◌⃑ ◌⃒ ◌⃓ ◌⃔ ◌⃕ ◌⃖ ◌⃗ ◌⃘ ◌⃙ ◌⃚ ◌⃛ ◌⃜ ◌⃝ ◌⃞ ◌⃟
U+20Ex ◌⃠ ◌⃡ ◌⃢ ◌⃣ ◌⃤ ◌⃥ ◌⃦ ◌⃧ ◌⃨ ◌⃩ ◌⃪ ◌⃫ ◌⃬ ◌⃭ ◌⃮ ◌⃯
U+20Fx ◌⃰
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域為未分配碼位
組合半符號
Combining Half Marks[1]
Unicode Consortium 官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FE2x ◌︠ ◌︡ ◌︢ ◌︣ ◌︤ ◌︥ ◌︦ ◌︧ ◌︨ ◌︩ ◌︪ ◌︫ ◌︬ ◌︭ ◌︮ ◌︯
註釋
1.^ 依據 Unicode 13.0

註釋

  1. ^ Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  2. ^ 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字元而後者使用大量預組字元。轉換器若只是單純地與統一碼做轉換,則會導致混亂。
  3. ^ Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  4. ^ Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  5. ^ 5.0 5.1 5.2 5.3 Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.

參見

外部連結