合字

一般表示將多於一個字母的合成一個字形

合字连字链接字合体字(英语:Ligature),在西方字体排印学中一般表示将多于一个字母的合成一个字形。如印刷品中常常将拉丁字母两个字母fii上一点常与f的一钩合并,而德语字母ß原为ss等等。汉字的合字在不同情况下也称作合文合体字

12pt Garamond字模:长s与i的连字

合字经过演变、长时间流行后,可能被视为直接的符号文字而非合字。如W源自VV或UU,Æ源自AE,而表示“与”的意思的“&”,原是e和t的合字。

历史

印刷合字单纯源于手写本中连写的字符。以发现的最早的楔形文字手写本中就已经含有很多连写字符。中世纪的拉丁文手写本中,誊写僧人为加快速度将字符连写,诞生了很多手写缩合字,如在哥特体中,带右圈的字母(b, o,和p)和带左圈的字母(c, e, o, d, gq)的圈部都被重叠书写。很多手写本字符如h, mn的竖划都被重叠,而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。

活字印刷诞生后,很多合字直接被制造成了铅字。但是在1950年代无衬线字体广泛使用,以及1970年代照相排版技术之后,合字就逐渐很少被使用。最早能进行合字电脑排版(之后雷射打印机)之一的是高德纳TeX程序(详见下文)。这一潮流也影响到了1985年之后的桌面排版技术。早期电脑软件无法进行合字替换(但TeX可以),大部分新制作的电脑字体里也没有合字。早期的个人电脑多使用英文,而英文中并不是必须使用合字,所以也没有实际需要。

随着现代电脑处理的多语言化和现代电子排版技术(如OpenType)的流行,合字开始逐渐恢复被使用。

拉丁文字

 
拉丁文本中的典型合字

书法合字

 
fi和fl

许多合字都把字母f和其后的字符组合起来,最常用的就是(或f‌i,显示为两个独立字符)。很多字体的这两个字母并排在一起后,字母i上的点会抵挡到字母f的弧形勾,无法正确排印,所以干脆就制造一个合字铅字,把i的点融入f的勾来直接使用。其他f合字包括fj[1]f‌l(fl)、f‌f(ff)、f‌f‌i(ffi)、和f‌f‌l(ffl)。其他合字包括fafefofrfsftfbfhfufy,以及f后加句号逗号连字符,还有不太常用的双写fffft

使用这些合字是因为通常的小写字母f中弧形勾影响字符间距调整。

有时,跨词合字(如shelfful[2]ff)是不希望出现的,电脑程序(如TeX)提供手动方式将它们分开。一些字体带有fff合字(如Requiem体甚至包括一个 fffl合字)用于德语的复合词,如Sauerstoffflasche(氧气罐)和Schifffahrt(游艇)(仅在遵循1996年拼写改革法的前提下才写作fff)。正式的德文正写法,如杜登词典所述,不赞成跨词合字,由于fff组合在德文中只会在组合词出现如(Schiff-fahrtSauerstoff-flasche),所以这样跨词合字在德文中使用会被认为是不正确的。[3]英语中类似的例子则是Shelfful

土耳其语中有带点和不带点的字母I,如单词fırın(烤箱)和fikir(主意)。fi合字容易混淆,所以在土耳其文排印中一般不使用该合字。像fl合字一般也不用,土耳其语本来就没有这样的拼写。

 
“ß”写作“ſʒ”合字的例子。柏林街头的标识(Petersburger Straße)。右边的标识(Bersarinplatz)最后一个字是tʒ合字。

合字ſʒ(sz)和(tz)来自德语哥特体,现在街头、城市广场的标识中带Platz或者以-platz结尾时仍常被使用。

有时st(st)、ſt(ſt)、chctQu以及Th的合字也被使用(如字体Linux Libertine)。

德文ß

德语eszett合字(亦称scharfes S“清S”)ß,其名称es-zett(意为“S-Z”)表示其源自“长S加Z”或“长S在圆S之上”。尽管“长s”ſ已经在现代德文正写法消失了,ß仍被保留并被视为合字,传统上在大写的时候以及字母排序的时候改写为“SS”。2008年其大写字母“ẞ”加入Unicode并出现更多字形。ß仅在德国和奥地利使用,瑞士德文不用这个合字。

起源于合字的字母

 
Adobe Caslon Pro中的合字

字母W7世纪左右才被加入拉丁字母表的,其发音不尽相同。古英语使用卢恩字母Ƿ(Wynn),但受到诺曼人影响后废弃不用。14世纪,这个起源于双写的VU的“新”字母W诞生并在字母表中占有一席。由于它相对于其他字母比较年轻,只有很少欧洲语言(英语、荷兰语、德语、波兰语、威尔士语马耳他语瓦龙语)使用它来拼写本土词汇。

字符Æ(小写æ,中世纪时称为aesc)作为一个字符在丹麦语挪威语冰岛语以及古英语中使用,并不是一个印刷用的合字。它是一个实在的字母——代表一个元音,且在字母表中有位置。现代英文正写法中Æ不作为一个单独字母,而只是一种拼写异形,如百科全书的英文单词encyclopædia也可拼写成encyclopaedia或encyclopedia。

Æ源自中世纪拉丁文,当时只是一些词汇的随意合字如Æneas。它还可以在英文和法文中出现,但是现在已经倾向把AE分开印刷。[4]同样,Œœ在法文中虽然通常印刷成合字,但在技术限制情况下仍可以拆开书写。

德文正写法中,带两点的字母元音äöü来自历史上的aeoeue合字(严格的说是标在顶端的e,即)。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母ae、oe、ue。字母排序中它们不等价于aeoeue,而是被简单看成aou。而北欧语言则不同:带两点的字母被视为独立字母,并排在字母表最后。

一些元音中的圈形附加符号,如å起源于一个o合字[5]。现在把旧式aa改写为å已经称为不成文习惯,但在此之前也可写成a上再加一个小a(),如Johannes Bureus、Runa ABC boken[6]

uo合字ů的使用实例也在早期现代高地德语里找到,但其后来混同到u中(如中期高地德语fuosz、早期现代高地德语fuͦß、现代德语Fuß)。它仍存在于捷克语中,被称为kroužek

西班牙语葡萄牙语中的上波浪线,分别用于字母ñ表示元音鼻音化,起源于一个nn合字[7](Espanna = España、anno = año)。同样法语中的抑扬符也源自不发音s。[8]法语、葡萄牙语、西班牙语等中的字母ç其实是一个字母c盖在一个z上面的形式。

字母ƕ(Hwair)仅用于转写哥特语,代表hw合字。最早在1900年左右心理学者使用这个字用于代替二合字母hv用于表示有问题的现象,如Jacques Paul Migne在其1860年代的著作(Patrologia Latina,第18卷)。

拜占庭帝国有一个独特的合字Ȣ(o-u合字),它源于希腊字母的ο-υ两个字母的合字,并被加入到了字母表中。

ƣ(Gha)是一个罕见的字母,起源于Q和G,但在ISO的文件中误注成O-I合字(参见Unicode注解)。

国际音标使用合字来表示塞擦音,其中6个有Unicode编码:ʣ、ʤ、ʥ、ʦ、ʧ、ʨ。一个擦音仍使用合字:ɮ,而国际音标扩展里加入了另外三个:ʩ、ʪ、ʫ

还有一些罕见合字,如Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ

起源于合字的符号

 
Et合字(Insular Minuscule的写法)

最常用的合字符号当属&。它起源于Et的合字,即拉丁文的单词“和”(et)。它在法文中保持原音原意而在英文中也使用。由于其使用广泛,一般已经不认为它是一个合字而是一个普通符号。

和其他合字一样,它被仍当作一个字母来使用(如早期现代英语),英语中它念作and而不是et,而&c念作et cetera(等等)。大多数字体中的字形和两字直接组合不一样,但仍有一些字体(如Trebuchet MS)就把&设计为合字。

同样,美元符号$可能也起源于合字(“pesos”,但有也有其他不同说法),但现在实际上已经被当成一个普通符号。[9]西班牙比塞塔(peseta)也有时被写作合字₧(源自Pts)。

二合字母

 
大写IJ字形看起来像“断臂的U”合字(Helvetica字体,由Omega TeX渲染)

二合字母,如西班牙语威尔士语中的ll,一般不被看成是合字,因为印刷上两个字母通常是分开的。正如上讨论的合字一样,一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时,二合字母chll已经被考虑为分开的两个字母。

法文的情况也一样,œu被看成为合字œ与字母u的组合。

尽管如此,荷兰语中“ij”的定位比较模糊。根据不同的使用标准,它可看成是一个二合字母,或合字,或者一个独立字母。它有独立的大小写形式,而在一些专业字体中,通常是有一个独立字形也有合字(如Zapfino)。无衬线字体大写字母的IJ流行于荷兰,通常形状像是一个断左臂的U。更令人混淆的是,手写时可以把小写字母y写作没有点的ij,和大写字母IJ(同样没有点)看起来只是大小差异而已。而Y在本土荷兰语词汇中不被使用。

含有合字的拉丁语文

非拉丁字符

合字不仅出现在拉丁文本中:

  • 婆罗米系文字元音附标文字频繁使用合字标注辅音。合字的数量依据语言而不同,如同样的天城文,用于梵文的合字就要比印地文多。总数为37的辅音中,在天城文两个字母组成的合字总数为1369,很少字体能全部显示这些合字。微软Windows系统附带的Mangal等字体带有印地语支持,但不能正确处理在द, ट, ठ, ड,和ढ右边的辅音合字,而只是加怛达点画后按照一般形式显示在辅音之后。
  • 希腊字母中使用一些合字,特别是在Ο(Omicron)和Υ(Upsilon)连写并派生出一个西里尔字母。参见Ȣ字母。
  • 西里尔合字:ЉЊЫѾIotified西里尔字母是早期西里尔字母І和其他元音的合字:Я的前身)、ѤѨѬЮ(源自另外一个合字ѸУ的早期形式)。塞尔维亚语字母表中的两个字母 ЉЊ 在19世纪曾分别是ЛН软音符号ь)的合字。还有一个ЯЕ的合字:Ԙԙ,其他合字包括Ꚅ、ꚅ 和 Ꚉ、ꚉ
  • 格拉哥里字母的一些手写形式:用于中世纪到19世纪书写的斯拉夫人语言,多为方形且常用合字。
  • 希伯来语中字母א‎(Aleph)和ל‎(Lamed)在一些前现代文本中(主要是宗教或“犹太-阿拉伯”文本)可组合为合字。该组合很常用,因为[ʔ][a]l-(在希伯来文中写作alephlamed)是阿拉伯语中的定冠词
  • 阿拉伯文:各个字母在词头,词中,词尾均有不同形式。如阿拉伯文的mīm,单独书写为م‎,三个连写(mmm,显示为词头,词中,词尾形)就变为ممم‎。注意lām + ʼalif的情况是特殊的:‎,lām + ʼalif在词中、词尾形式是‎。在Unicode有几个特殊的合字,如安拉位于U+FDF2:‎;太斯米位于U+FDFD:‎ 等。
  • 乌尔都语使用阿拉伯文字纳斯塔里格体的手写体,在电子排印中有大量合字。乌尔都语最常用的排版工具InPage使用纳斯塔里格体字体产生多达20,000个合字。
  • 藏文在Unicode有一个特殊的合字U+0F00:)。
  • 日文自江户时代起便有以把文字组合在一起形成文字绘的游戏,例子有へのへのもへじ
  • 汉字中如孔孟好学 )、招财进宝 [10][11]日进斗金双喜传统上经常会合为一字书写,称为合文,另外还有大量叠字流传至今。近年,也有网民将“草泥马”“成龙”等字编成合文。

电脑排版

TeX是电脑排版系统中能使用合字的典型程序。它能提供五个常用合字:fffiflffiffl。当TeX遇到这些组合时会自动替换成合字。当然操作者可以手动切换。

OpenType字体格式可以针对一个字符提供多个字形,因此用来作为合字替换,但需要软件支持。XǝTeX就是一个可以运用这一优势的TeX排版引擎。这种替换原先主要用于阿拉伯文排版,但现在已经广泛用于西文OpenType字体。OpenType中,这些是标准liga、历史性hlig、上下文clig、需求性rlig和任意性dlig合字。这些在CSS3中可用font-feature-settings启用或禁用。[12]

CSS还支持font-variant-ligatures特效。common-ligaturesdiscretionary-ligatureshistorical-ligaturescontextual特效也被支持。[13]

下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的操作系统浏览器并调用正确的Unicode 电脑字体

Unicode中对合字的处理不是一个字符定义,而是一种绘制形式。即Unicode不把合字当作一个字符,而是把合字处理为字符序列,由字形绘制系统去处理是否用合字的字形在屏幕上显示或者打印。比如,如果一个现代字体需要显示h后加r,且该字体确实有hr合字,这个合字才会被显示出来。因此,使用特殊Unicode合字字符是“不鼓励”且“在任何环境下不会被再度编码”的。[14]注意,合字æ和œ不能随意替代ae和oe,比如does不能写作dœs。

Unicode中的合字列表(拉丁字母)

这是一个不完整列表。U+A732到U+A73D区域及其临近区域的一些字符没有列出。
非合字 合字 Unicode HTML
et & U+0026 &
ſs、ſz ß U+1E9E、U+00DF ẞ、ß
AE、ae Æ、æ U+00C6、U+00E6 Æ æ
OE、oe Œ、œ U+0152、U+0153 Œ œ
IJ、ij IJij U+0132、U+0133 IJ ij
ue U+1D6B ᵫ
TZ、tz U+A728、U+A729 Ꜩ ꜩ
AA、aa U+A732、U+A733 Ꜳ ꜳ
AO、ao U+A734、U+A735 Ꜵ ꜵ
AU、au U+A736、U+A737 Ꜷ ꜷ
AV、av U+A738、U+A739 Ꜹ ꜹ
AY、ay U+A73C、U+A73D Ꜽ ꜽ
OO、oo U+A74E、U+A74F Ꝏ ꝏ
ui U+AB50 ꭐ
f‌f U+FB00 ff
f‌i U+FB01 fi
f‌l U+FB02 fl
f‌f‌i U+FB03 ffi
f‌f‌l U+FB04 ffl
ſt U+FB05 ſt
st U+FB06 st
eT 🙰 U+1F670 🙰

另外,Dz克罗地亚语和波斯尼亚语字母DŽ、LJ和NJ都有单独的码位。它们不是合字而是二合字母

仅在标音时使用的合字
非合字 合字 Unicode HTML
db ȸ U+0238 ȸ
qp (cp) ȹ U+0239 ȹ
(或lezh) ɮ U+026E ɮ
dz ʣ U+02A3 ʣ
(或dezh) ʤ U+02A4 ʤ
(或dz curl) ʥ U+02A5 ʥ
ts ʦ U+02A6 ʦ
(或tesh) ʧ U+02A7 ʧ
(或tc curl) ʨ U+02A8 ʨ
ʩ U+02A9 ʩ
ls ʪ U+02AA ʪ
lz ʫ U+02AB ʫ

U+0238和U+0239是二合字母,但实际上是合字。[15]

计量单位的合字
除个别符号外绝大多数编成合字形式的计量单位的符号收录于CJK Compatibility(U+3300到U+33FF)区域中
非合字 合字 Unicode HTML
°C U+2103 ℃
°F U+2109 ℉
fm U+3399 ㎙
nm U+339A ㎚
μm U+339B ㎛
mm U+339C ㎜
cm U+339D ㎝
dm U+3377 ㍷
km、KM U+339E、U+33CE ㎞ ㏎
μg U+338D ㎍
mg U+338E ㎎
kg U+338F ㎏
cal U+3388 ㎈
kcal U+3389 ㎉
μl U+3395 ㎕
ml U+3396 ㎖
dl U+3397 ㎗
kl U+3398 ㎘
Pa U+33A9 ㎩
kPa U+33AA ㎪
mPa U+33AB ㎫
GPa U+33AC ㎬
pA U+3380 ㎀
nA U+3381 ㎁
μA U+3382 ㎂
mA U+3383 ㎃
kA U+3384 ㎄
pV U+33B4 ㎴
nV U+33B5 ㎵
μV U+33B6 ㎶
mV、MV U+33B7、U+33B9 ㎷ ㎹
kV U+33B8 ㎸
pW U+33BA ㎺
nW U+33BB ㎻
μW U+33BC ㎼
mW、MW U+33BD、U+33BF ㎽ ㎿
kW U+33BE ㎾
U+33C0 ㏁
U+33C1 ㏂
Hz U+3390 ㎏
kHz U+3391 ㎐
MHz U+3392 ㎑
GHz U+3393 ㎒
THz U+3394 ㎓
KB U+3385 ㎅
MB U+3386 ㎆
GB U+3387 ㎇
lm U+33D0 ㏐
ln U+33D1 ㏑
lx U+33D3 ㏓
mol U+33D6 ㏖
rad U+33AD ㎭
rad/s U+33AE ㎮
ps U+33B0 ㎰
ns U+33B1 ㎱
μs U+33B2 ㎲
ms U+33B3 ㎳

注释

  1. ^ 字母组合fj英语中仅有fjordfjeld中出现,但加上世界语挪威语和其他j代表半元音[j]的语言
  2. ^ Helmut Kopka; Patrick W. Daly. A Guide to LaTeX, 3rd Ed.. Addison-Wesley. 1999: 22. ISBN 0201398257. 
  3. ^ Duden 1, Mannheim 1996, p. 69.
  4. ^ The Chicago Manual of Style、14th Ed. Chicago: The University of Chicago Press. 1993: 6.61. 
  5. ^ 905-906 (Nordisk familjebok / Uggleupplagan. 33. Väderlek - Äänekoski). runeberg.org. 2017-09-12 [2010-03-19]. (原始内容存档于2012-10-24). 
  6. ^ 存档副本. [2010-02-05]. (原始内容存档于2010-01-24). 
  7. ^ AulaHispanica.com. [2010-03-19]. (原始内容存档于2010-07-02). 
  8. ^ Teach Yourself French. Collier's Cyclopedia、1901.
  9. ^ Cajori, Florian. A History of Mathematical Notations. New York: Dover (reprint). 1993. ISBN 0-486-67766-4.  - contains section on the history of the dollar sign, with much documentary evidence supporting the theory $ began as a ligature for "pesos".
  10. ^ 搜查線:招財進寶合體字 由溥儀創造?. 东方日报. 2016年10月11日 [2019年5月20日]. (原始内容存档于2019年6月12日). 
  11. ^ 蛤?!這些「組合字」春聯竟然還有讀音 「招財進寶」唸…. 三立新闻网. 2016年2月8日 [2019年5月20日]. (原始内容存档于2018年2月20日). 
  12. ^ font-feature-settings property. MSDN. MSDN. [24 November 2014]. (原始内容存档于2015-01-10). 
  13. ^ CSS font-variant-ligatures Property. CSS Portal. [2014-11-29]. (原始内容存档于2015-02-22). 
  14. ^ Ligatures, Digraphs and Presentation Forms页面存档备份,存于互联网档案馆), Unicode FAQ
  15. ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken. Known Anomalies in Unicode Character Names. Unicode Technical Note #27. Unicode Inc. 2006-05-08 [2009-05-29]. (原始内容存档于2009-04-21). 

参阅

外部链接