羅馬化
羅馬化(英語:Romanization,法語:Romanisation),又稱拉丁化(Latinization,latinisation),是語言學中將不是拉丁字母(又稱羅馬字母)形式的文字系統,轉換成拉丁字母的過程。主要是將被轉換系統裏的非拉丁文字,按照轉寫系統的規則和轉寫表,忠實地將字符(也包括字符的附加符號及單音素雙字符)對號入座地轉寫成轉換系統裏的拉丁字符。被轉換系統與轉換系統的字符也可以逆向轉寫。
羅馬化的方案有很多,包括用以表達書面語的音譯、和用以表達口語的轉錄。後者可以再被分為兩類:音位轉錄,用以記錄音素或者一段說話裏的語義數量。和更嚴格的標音轉錄來記錄說話聲音。而每一個羅馬化方案均有一套獨立的規則,規定了每一個已羅馬化字元的發音。除了拼音文字之外,現今唯一徹底採用語素文字系統的漢字也從近代起出現羅馬化方案,但並未完全取代漢字原有的功能。
羅馬化方案
字母轉寫
如果使用羅馬化方案去把原來的字詞去音譯的話,最基本的原則就是把本來語言裏的字母,逐一音譯到目標語言之中。這個方法的特色,就是過程中並不着重在目標語言裏的實際發音。例如,使用日語的訓令式羅馬字的話,就容許讀者可以百分之百地,憑拼音去重組成日語的片假名音節。但這個方案需要事前對日語有一定的知識。
轉錄
音位轉錄
但是,大部份的羅馬化方案都以一般讀者為主。就是說讀者事前並不需要對本來語言有認識,反而應該提起讀者對本來語言如何發音的興趣。這樣的羅馬化方案大多根據音位轉錄原則,嘗試把在本來語言裏,每一個音位的發音,盡量準確地轉錄,使到操目標語言的人都能發到貼近的發音。日語裏的平文式羅馬字(或稱黑本式羅馬字)就是一個很好的例子,這個羅馬化方案是為英語使用者而設的。
語音轉錄
語音轉錄方案則更進一步,這個方案嘗試把本來語言裏所有的音位描繪出來。有時可能會犧牲目標語言裏的閱讀性,使用在目標語言裏沒有的字母。國際音標字母就是一個在標音轉錄裏最常用的系統。
取捨
對於大部份的語言來說,建立一套可用性的羅馬化方案都會涉及需要在兩個極端裏進行取捨。純正的轉錄被普遍認為是不可能的,因為多會發生諸如在本來語言裏的發音和區別,不可能在目標語言裏表現出來。但如果硬要表現出來的話,就會使羅馬化後的字眼變得複雜。
一般來說,除了一部份學者之外,羅馬化方案都傾向以音位轉錄形式出現。舉個例子,日本武術「柔術」這一詞,使用訓令式羅馬字的話,就會變成「zyūzyutu」。這樣一來可以讓本身懂日語的人去重組成假名的「じゅうじゅつ」。但使用平文式羅馬字的話就會變成「jūjutsu」,人們會較易猜到這個詞語本來的日語發音。
不同書寫系統的羅馬化方案
阿拉伯字母是用來書寫阿拉伯語、波斯語和烏爾都語。其羅馬化方案如下:
- 德國摩爾根蘭學會[1](1936年):被羅馬的國際東方學者會議所使用,是以漢斯-威海辭典(ISBN 0879500034)為基礎所發展的方案。
- BS 4280(1968年):由英國標準協會[2]發展的方案。
- 標準阿拉伯語技術性音譯系統(1970年代):由美國軍隊發展的方案。
- 聯合國地名專家組(1972年)[3]
- DIN-31635(1982年):由德國標準化協會所發展的方案。
- ISO 233(1984年):國際標準化組織的音譯方案。
- 卡拉姆(1985年):一套着重保留字母串法,犧牲了發音的方案。 [4]
- ISO 233-2(1993年):國際標準化組織的簡化音譯方案。
- 畢克華爾特音譯方譯(1990年代):由施樂研究中心的添·畢克華爾特先生所發明的系統。[5]這個系統並不需要一些特別的發音區別符號。[6]
- 美國國會圖書館標準方案(1997年)[7]
- 美國國家標準學會 Z39.25(1975年)
- 聯合國地名專家組(1977年)[8]
- ISO 259(1984年):國際標準化組織的音譯方案。
- ISO 259-2(1994年):國際標準化組織的簡化音譯方案。
- ISO/DIS 259-3:國際標準化組織的音位轉錄方案
- 美國國會圖書館標準方案 [9]
婆羅米字母
婆羅米字母用以書寫印度大陸和東南亞地方語言的書寫系統。長久以來,西方都是透過其羅馬化音譯去研究梵文以及其他印度文字。自英國的東方學者威廉·瓊斯爵士之後,不同的印度文字音譯方案亦隨之推出。[10]
- ISO 15919(2001年):國際標準化組織的音譯方案。這套方案以發音區別符號去標示大量的婆羅米子音及母音。[11]而天城文獨有的部份在學術標準上也被同化。國際梵文音譯字母及美國國會圖書館的標準[12]
- 哈佛-京都轉寫:使用大楷、小楷及雙字母以避免使用發音區別符號,及限制使用範圍至7位元的美國信息互換標準代碼(ASCII)標準。
- 印度語言音譯:由Avinash Chopde發明的一套7位元ASCII標準的音譯方案,常見於Usenet網絡。
- HTML用梵文音譯字母:源自阿根廷,同樣兼容7位元的ASCII標準。[13]
- 印度文字信息互換代碼方案(1988年)
- 加爾各答國家圖書館羅馬化
漢語的羅馬化,在某些層面上被証明是一個困難的問題,因為同時涉及政治考慮。另一個困難之處,就是漢語並非表音文字,而是意音文字。所以大部份的羅馬化方案並非直接把漢字轉換,而是建基於類似漢語拼音之上。[14]
- 美國國會圖書館標準方案:和威妥瑪拼音類似的方案[15], 但在2000年已經被轉換成漢語拼音。 [16]
- 法國遠東學院拼音:由法國遠東學院於19世紀發明,主要於法國使用。
- 拉丁化新文字(1926~1928年):把音調省略,主要於前蘇聯及中共佔領區使用,是漢語拼音的前身。
- 德國式拼音:主要於德國使用。
- 郵政式拼音(1906年):早期的國際地址標準。
- 威妥瑪拼音(1912年):音譯方案,在中國大陸常用於第二次世界大戰之前,在台灣現今仍用於縣市級以上之地名及大多台灣人名。
- 耶魯拼法(1942年):由美國所創,用於戰地通訊。
- 捷克拼音:主要於捷克和斯洛伐克使用。
- 漢語拼音(1958年):在中華人民共和國,這套方案已經被官方確認為羅馬化漢語的標準方案。多數用於教授母語並非普通話的學生,學習普通話時使用的學習工具。這套方案亦被國際社會普遍所接受,作為拼寫中文或名字時的標準。漢語拼音價值在於中國地大物博,人口之多,與其他面積和人口相若的國家一樣,出現了多種漢語方言。所以需要有一套統一的書寫系統和語言去進行溝通。
- ISO 7098(1991年):國際標準化組織的方案,與漢語拼音非常相似。
- 威妥瑪拼音:通用拼音始為官方系統前,多數中華民國地名、路名與中華民國國民姓名多以此一拼音系統拼寫。
- 國語羅馬字(1926年):中華民國教育部於1926年正式公佈後在於全中國地域使用。1949年後則於台灣地區繼續使用,後來才被注音符號第二式所取代。
- 注音符號第二式(1986年):主要於中華民國使用,目前仍普遍用於以兒童為對象的公共場合或機構。
- 通用拼音(2000年):主要於中華民國。[17]
- 教育學院拼音方案:香港教育局、考評局承認的方案
- 廣州話拼音方案:饒秉才在廣東省教育部門方案基礎上的修訂版本
- 香港政府粵語拼音:香港政府拼寫人名、地名的方案
- 香港語言學學會粵語拼音方案(粵拼,1993年):香港語言學學會方案
- 澳門葡式粵語拼音:澳門政府拼寫人名、地名的方案
- Meyer-Wempe
- 劉錫祥拼音
- 耶魯粵語拼音(1942年)
- 黃錫凌羅馬拼音
- 寬式國際音標
傳教士羅馬化語言辦報
- 發端:19世紀末,在中國的歐洲、美國傳教士再次掀起興辦中文報刊的高潮。以美國佐治亞州的傳教士編輯林樂知為首的一批傳教士編輯認識到了非教會報紙具有廣泛傳播的可能性。為了擴大報刊的發行量,就需要使用更加通俗易懂的文字。作為針對文盲讀者的極端方法,他們開始使用羅馬化語言。他們起初曾持懷疑態度,因為這意味着報刊的傳播元素將與漢字方塊字徹底分離。這不僅預示着字母文字的引進,而且暗示了一種基於新文字的文學體系的形成。
- 萊普修斯字母表:德國傳教士傾向於卡爾·理查德·萊普修斯字母表
- 威廉·瓊斯字母表:英國傳教士傾向於推行威廉·瓊斯的字母表
- 成果:在中國東南沿海方言豐富多變的地區,羅馬化語言辦報的計劃取得了些許成功。例如,廈門土話約有800個音節,相比之下,在中國四分之三地區通用的標準官話只有420個音節。雖然不同地區的官話略有變化,但後來還是成為了全國性的標準語言。在香港,崇真會(巴色會)傳教士婁士(G.Reusch)於1882年用羅馬化的客家方言編纂一份插圖月刊,每年訂閱價為20美分。[18]在台灣,英國長老會差會的巴克禮(Thomas Barclay)創辦一份用羅馬拼音化的白話字印刷的教會月刊《台南府城教會報》(後更名台灣教會公報)。在汕頭,英國長老會的傳教士汲約翰(J.C.Gibson)也辦過類似的《潮惠會報》,只是後來都因時局原因而停止,但白話字仍在民間傳承。相反的,官話實行羅馬化或者演變為單純的拼音文字都不適用,因為它具有太多的同音異義字。因此,大多數傳教士報刊不僅使用漢字印刷,而且採用中國傳統的書冊式報刊形制。
羅馬化,在日語裏稱作羅馬字(ローマ字)。
- 平文式羅馬字(1867年):音位轉錄方案。
- 日本式羅馬字(1885年):音譯方案,於1989年成為了ISO 3602嚴謹標準。
- 訓令式羅馬字(1937年):音譯方案,後來成為了ISO 3602標準。
- JSL(1987年)
- 美國國會圖書館標準方案:與平文式羅馬字相似的一套方案。[19]
- 文字處理器式羅馬字
- 馬科恩-賴肖爾轉寫系統(1937年):直至2002年為止,都是南韓官方的韓語羅馬化方案。現時此系統仍於北韓使用。
- 羅馬字標記法修正案(2000年):在2005年,南韓政府正式使用這套已於2000年批准的方案。路牌和教科書已經開始逐步跟隨,政府估計此刻修訂需要花費至少20億美元。但人名拼音仍然可以按照個人意願,但政府會強烈建議使用新方案。
- 耶魯拼法(1942年):這套方案主要應用於學術文學層面。
- 美國國會圖書館標準方案:與McCune-Reischauer式大致上相同。[20]
- ISO/TR 11941(1996年):這套方案其實是由兩個方案所組成,分別為南北韓兩個國家所提出。最初提交上國際標準化組織的方案,是經過雙方努力的成果(方案主要以耶魯方案為基礎)。但在最後階段,雙方出現方歧,導致出現了兩個方案。[21]
吉阿吉阿語原本沒有文字。從2008年開始,當地與韓國訓民正音學會採用諺文字母作為其現代化的文字,但後來廢止了。
泰語主要於泰國使用,有自己的一套文字去書寫。該套書寫系統可能是由古高棉傳過來,屬於婆羅米文字的一種。請參閱泰語字母。
- 皇家泰語轉寫通用系統
- 美國國會圖書館標準方案[22]
- ISO 11940(1998年):國際標準化組織的音譯方案。
在語言學中,西里爾字母和格拉哥里字母都使用了科學音譯。同樣情況亦應用於古教會斯拉夫語,以及現代的各個斯拉夫語族,因為他們同樣使用這些字母。
白俄羅斯語同時使用了西里爾字母和拉丁字母。但時至今日,縱使仍然有使用拉丁字母(正式名稱為Łacinka或Łacinica)的擁護者,但已經幾乎絕跡。但姑勿論本來的拉丁字母存在與否,白俄羅斯語的名字一般按俄語的習慣被翻譯。
例字 | |
---|---|
Łacinka字母 | 羅馬化後 |
Homiel | Homyel' |
Mahiloŭ | Mahilyow |
Viciebsk | Vitsebsk |
Baranavičy | Baranavichy |
Žytkavičy | Zhytkavichy |
文獻 | |
|
現時並沒有一套國際公認把俄語翻譯成羅馬字母的方案—事實上已經有很多套方案存在:有時會稍作調整以迎合某些特定語言(例如德語和法語),而有些則設計為圖書館音譯之用,有些則為翻譯俄羅斯旅客護照之用。有時,有些名字的音譯則是以傳統為主。這樣一來,同一個名字會重複出現很多次。例如,俄國著名作曲家柴可夫斯基可以被譯成以下名字:Tchaykovsky, Tchajkovskij, Tchaikowski, Tschaikowski, Czajkowski, Čajkovskij, Čajkovski, Chajkovskij, Chaykovsky, Chaykovskiy, Chaikovski等等。
- BGN/PCGN(1947年):美國地名委員會的方案[24]
- GOST 16876-71(1983年):前蘇聯的國家標準委員會,測量及地圖繪製部門的方案。[25]
- 聯合國標準(1987年):以GOST方案上作基礎,在俄羅斯國內及國外的繪圖產品都開始被大量廣泛使用。
- ISO 9(1995年):國際標準化組織的音譯方案。
- 美國國會圖書館標準方案(1997年)[26]
- Volapuk編碼(1990年):這是一個人們為了方便在網絡上,使用拉丁字母傳送訊息,而使用的非正統俄語羅馬化方案。(這裏不是指沃拉普克語)
- 維基百科內部標準(2004年):從BGN/PCGN拼法引伸出來,特別於網上實際應用尤為重要。
烏克蘭的人名多以音位轉錄形式翻譯。烏克蘭國家系統主要於翻譯烏克蘭地名時使用。
- ISO 843(1997年):國際標準化組織方案 [31]
- 美國國會圖書館標準方案[32]
ISO 9984是把現代格魯吉亞語羅馬化的系統。
總結
以下的表格列出了把不同字母或書寫系統,作音位轉錄羅馬化後的結果。雖然對大部份使用者來說已經足夠,但是每一個字母始終還有幾個譯法和其他例外例子。詳情請參閱以下各個語言的相關條目。(由於韓語字母數量過於龐大,所以本表格只列出第一個字母)
羅馬化後 | 希臘語 | 俄語 | 希伯來語 | 阿拉伯語 | 日語片假名 | 韓語 |
A | A | А | ַ, ֲ, ָ | دَ, دَ, ﺍ — ﺎ, دَىا | ア | |
AI | י ַ | |||||
B | Б | בּ | ﺏ ﺑ ﺒ ﺐ | ㅂ | ||
CH | Χ | Ч | ㅊ | |||
CHI | チ | |||||
D | Δ | Д | ד | ﺩ — ﺪ, ﺽ ﺿ ﻀ ﺾ | ㄷ | |
DH | ﺫ — ﺬ | |||||
E | Ε | Э | , ֱ, י ֵֶ, ֵ, י ֶ | エ | ||
F | Φ | Ф | פ (final ף ) | ﻑ ﻓ ﻔ ﻒ | ||
FU | フ | |||||
G | Γ | Г | ג | ㄱ | ||
GH | ﻍ ﻏ ﻐ ﻎ | |||||
H | ח, ה | ﻩ ﻫ ﻬ ﻪ, ﺡ ﺣ ﺤ ﺢ | ㅎ | |||
HA | ハ | |||||
HE | ヘ | |||||
HI | ヒ | |||||
HO | ホ | |||||
I | Η, Ι, Υ | И | ִ, י ִ | دِ | イ | |
IY | دِي | |||||
J | Ж | ﺝ ﺟ ﺠ ﺞ | ㅈ | |||
JJ | ㅉ | |||||
K | Κ | К | כּ (final ךּ ), ק | ﻙ ﻛ ﻜ ﻚ | ㅋ | |
KA | カ | |||||
KE | ケ | |||||
KH | Х | כ (final ך ) | ﺥ ﺧ ﺨ ﺦ | |||
KI | キ | |||||
KK | ㄲ | |||||
KO | コ | |||||
KU | ク | |||||
L | Λ | Л | ל | ﻝ ﻟ ﻠ ﻞ | ||
M | Μ | М | מ (final ם ) | ﻡ ﻣ ﻤ ﻢ | ㅁ | |
MA | マ | |||||
ME | メ | |||||
MI | ミ | |||||
MO | モ | |||||
MU | ム | |||||
N | Ν | Н | נ (final ן ) | ﻥ ﻧ ﻨ ﻦ | ㄴ | |
NA | ナ | |||||
NE | ネ | |||||
NI | ニ | |||||
NO | ノ | |||||
NU | ヌ | |||||
O | Ο, Ω | О | , ֳ, וֹֹ | オ | ||
P | Π | П | פּ (final ףּ ) | ㅍ | ||
PP | ㅃ | |||||
PS | Ψ | |||||
Q | ﻕ ﻗ ﻘ ﻖ | |||||
R | Ρ | Р | ר | ﺭ — ﺮ | ㄹ | |
RA | ラ | |||||
RE | レ | |||||
RI | リ | |||||
RO | ロ | |||||
RU | ル | |||||
S | Σ | С | ס, שֹ | ﺱ ﺳ ﺴ ﺲ, ﺹ ﺻ ﺼ ﺺ | ㅅ | |
SA | サ | |||||
SE | セ | |||||
SH | Ш | ש | ﺵ ﺷ ﺸ ﺶ | |||
SHCH | Щ | |||||
SHI | シ | |||||
SO | ソ | |||||
SS | ㅆ | |||||
SU | ス | |||||
T | Τ | Т | ט, תּ, ת | ﺕ ﺗ ﺘ ﺖ, ﻁ ﻃ ﻄ ﻂ | ㅌ | |
TA | タ | |||||
TE | テ | |||||
TH | Θ | ﺙ ﺛ ﺜ ﺚ | ||||
TO | ト | |||||
TS | Ц | צ (final ץ ) | ||||
TSU | ツ | |||||
TT | ㄸ | |||||
U | У | , וֻּ | دُ | ウ | ||
UW | دُو | |||||
V | B | В | ב, ו, וו | |||
W | ﻭ — ﻮ | |||||
WA | ワ | |||||
WE | ヱ | |||||
WI | ヰ | |||||
WO | ヲ | |||||
X | Ξ | |||||
Y | Й, Ы | י | ﻱ ﻳ ﻴ ﻲ | |||
YA | Я | ヤ | ||||
YE | Е | |||||
YO | Ё | ヨ | ||||
YU | Ю | ユ | ||||
Z | Ζ | З | ז | ﺯ — ﺰ, ﻅ ﻇ ﻈ ﻆ | ||
ZH | Ж |
參見
參考文獻
- ^ DMG. [2021-12-31]. (原始內容存檔於2017-08-10).
- ^ BSI Group. [2013-04-25]. (原始內容存檔於2008-10-07).
- ^ EPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAMES (PDF). 2018-06 [2005-08-20]. (原始內容存檔 (PDF)於2021-02-11).
- ^ Qalam: A Convention for Morphological Arabic-Latin-Arabic Transliteration. [2015-07-02]. (原始內容存檔於2009-02-08).
- ^ ARABIC TRANSLITERATION. qamus.org. [2005-08-20]. (原始內容存檔於2021-02-24).
- ^ Xerox Arabic Morphological Analysis and Generation. [2021-12-31]. (原始內容存檔於2002-04-24).
- ^ Arabic (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2017-12-15).
- ^ REPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAME (PDF). 2013-02 [2005-08-20]. (原始內容存檔 (PDF)於2021-01-25).
- ^ Hebrew and Yiddish (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-03-22).
- ^ SANSKRIT 3 COMPARING TRANSLITERATION SYSTEMS. [2005-08-20]. (原始內容存檔於2004-03-15).
- ^ 詳情請參閱:Transliteration of Indic scripts: how to use ISO 15919 (頁面存檔備份,存於互聯網檔案館)
- ^ Hindi (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2020-12-10).
- ^ SANSKRIT 3 LEARNING THE INTERNATIONAL ALPHABET OF SANSKRIT TRANSLITERATION. [2006-11-20]. (原始內容存檔於2007-02-12).
- ^ 拼音转换查询. [2005-08-20]. (原始內容存檔於2004-06-19).
Romanization.com a guide to Taiwan. [2005-08-20]. (原始內容存檔於2021-03-17). - ^ Chinnese (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-03-23).
- ^ New Chinese Romanization Guidelines. www.loc.gov. [2005-08-20]. (原始內容存檔於2021-04-14).
- ^ Zhuyin, Hanyu Pinyin, and Tongyong Pinyin Cross-Reference Table. 2000-10-16 [2005-08-20]. (原始內容存檔於2017-09-17).
- ^ JOHN MURDOCH.Report on Christian Literature in China.Shanghai 1882.pp7-8,12,19-20
- ^ Japanese (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-04-20).
- ^ Korean (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-03-20).
- ^ 兩個方案的分別:Hangul and Other Languages (頁面存檔備份,存於互聯網檔案館)
- ^ The romanization table - thai (PDF). [2005-08-20]. (原始內容存檔 (PDF)於2008-12-11).
- ^ Beloruss (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-01-15).
- ^ Cyrillic Usage. [2013-04-25]. (原始內容存檔於2012-07-16).
- ^ CCL phg-koi8. www.ccl.net. 1992-12-30 [2005-08-20]. (原始內容存檔於2021-03-17).
- ^ Russian (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-04-25).
- ^ Ukrainia (PDF). www.lov.gov. [2005-08-20]. (原始內容存檔 (PDF)於2021-03-22).
- ^ JPEG圖檔,以烏克蘭寫成. [2005-01-25]. (原始內容存檔於2005-03-07).
- ^ REPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAME (PDF). 2003-01 [2021-12-31]. (原始內容 (PDF)存檔於2006-01-03).
- ^ 托馬士.彼得遜先生撰寫的五個系統對比:Transliteration of Ukrainian (頁面存檔備份,存於互聯網檔案館)
- ^ The Greek Vitis Database. [2005-01-25]. (原始內容存檔於2004-12-10).
- ^ Greek (PDF). www.loc.gov. [2005-08-20]. (原始內容存檔 (PDF)於2011-05-13).
外部連結
- 聯合國地名專家組-羅馬化系統工作組 (頁面存檔備份,存於互聯網檔案館)
- 美國國會圖書館-羅馬化列表 (頁面存檔備份,存於互聯網檔案館)(PDF文檔)
- Java羅馬化程式
- 尚有少量書籍附有羅馬化列表《ALA-LC Romanization Tables》Randall Barry (ed.), U.S. Library of Congress, 1997, ISBN 0844409405.
- Thomas T. Pederson's chart (頁面存檔備份,存於互聯網檔案館)