維基百科:地區詞處理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
地區詞處理和繁簡處理是中文維基百科字詞轉換系統的兩大部份,地區詞轉換旨在為中國大陸、香港、澳門、台灣、新加坡、馬來西亞的中文使用者提供貼近其語言習慣的轉換模式。中國大陸(zh-cn)、新加坡(zh-sg)及馬來西亞(zh-my)的地區詞使用簡體中文;台灣(zh-tw)、香港(zh-hk)及澳門(zh-mo)的地區詞使用繁體中文。
修改歷程
- 港澳繁體:原以zh-hk參數涵蓋zh-mo,社群於2013年討論後,正式啟用zh-mo參數,拆分「香港繁體」和「澳門繁體」。
- 馬新簡體:原以zh-sg參數涵蓋zh-my,而在2018年經過社群討論後,正式啟用zh-my參數,拆分「新加坡簡體」和「大馬簡體」。
轉換涵蓋順序
- 中文:zh相容zh-hans、zh-hant
- 簡體:zh-hans ⊃ zh-cn ⊃ zh-sg ⊃ zh-my
- 繁體:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo
因此若順位較低的地區詞與上一順位者相同,擇該上位者涵蓋即可。zh雖相容zh-hans、zh-hant直接取代,但下位區域轉換不影響。
全域轉換
地區詞的全域轉換通過MediaWiki內建轉換表、數頁本地全域轉換表實現。
全域轉換是最方便快速的轉換處理方式,但也較易過度轉換。為了避免過度轉換造成的錯誤,除了穩定和使用廣泛的地區對應詞(判定依據見下方的先決條件),維基百科一般不接受其他情況的全域地區詞轉換。
使用者可按需在Wikipedia:字詞轉換/地區詞候選頁提請希望全域轉換表新增的地區詞,所提的新詞應當符合以下新增全域轉換的先決條件:
- 符合地區轉換詞基本資格;
- 提請需被全域轉換的原詞絕不能只有1個漢字,以免過度轉換(如「宏→巨集」即不可);
- 提請全域轉換的詞至少在100篇條目中出現(可用搜尋引擎判斷)。
此外,對於字數較少(不多於三字)的需被轉換(原)詞,還應考慮其中漢字的字頻,以免過度轉換。(例如「內」字甚爲常用,「内存→記憶體」會引致「体内存在」轉換爲「體記憶體在」,故不應提請加入全域轉換)關於漢字字頻方面的研究,關於漢字字頻方面的研究,可參考漢字單字字頻總表、現代漢語常用字表與其他相關統計。
採納或拒絕全域轉換地區詞的新增請求取決於社群共識。若符合以上全部先決條件而無合理、屬實的異議(包括合理疑點均已消解),並且——
- 不少於5人對此發言,請求提出已滿7天;或
- 不少於3人對此發言,請求提出已滿30天;
則由管理員採納請求並納入相應轉換表。但若在請求提出滿90天後發言人數仍不足3人,管理員可綜合已有合理、屬實的意見及己見,作出決定及處置;本句賦權的「決定」若為「拒絕」,須附上明確理由或指明所依據的意見。注,發言人數計入請求提出者、只作投票而不附理由的自動確認使用者;不計傀儡,不計只作投票而不附理由且非自動確認使用者者。
如有地區詞過度轉換錯誤,甚或需要刪除全域轉換地區詞,請在Wikipedia:字詞轉換/修復請求提報。不過,如果此錯誤屬於罕有個案而只存在於您有權編輯的極個別零星頁面,您若通曉轉換語法,可自行予以適當修補。
全文轉換
全文轉換適用於特定的單篇條目,針對性極強。
「-{A|轉換內容}-」是全文轉換的原始碼實現,但這一方式實現的全文轉換往往會導致轉換代碼與條目正文的代碼混淆不清,不利維護。因此,維基百科推薦內嵌全文轉換的{{NoteTA}}模版來作為實現全文轉換的方式。要使用這一模版實現該功能,只需在特定條目原始碼的頂端插入「{{NoteTA}}
」的模版,並依照該模版頁面的說明輸入轉換內容即可。
由於全文轉換的針對性極強,所以較難出現過度轉換。但有些情況也需要利用單獨轉換來實現。
公共組轉換
對於一些主題、領域相同和相似的條目,其中要轉換的內容大同小異,可以把這些多個條目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共轉換組的方便程度處於全域轉換與全文轉換之間,而過度轉換程度也處於這兩者之間。
建立一組公共轉換組時,要依據這一組大多數詞彙在多篇條目中轉換的可能性,而不應依據轉換詞的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組。
公共組轉換中的轉換內容可由普通使用者控制,而它所影響到的範圍也沒有全域轉換這麼大。公共組轉換甚至可以用來填補在全域轉換中受限制的二字轉換,典型的例子是「數位→数码」的轉換:對於全域轉換來說,與電腦和資訊科技無關的條目中,「數位」後面可能會搭配「人士」組成「數位人士」一詞,這樣就會過度轉換成「数码人士」。然而,在電腦和資訊科技的公共組轉換中,所涉及到的條目大多是技術類條目,其中有許多本來就應該轉換的「數位」詞語,同時,技術性的內容也導致「數位人士」的用法幾乎不會出現。
然而,也正如上述所說,假如真的碰巧出現了「數位人士」,公共組轉換也有其局限。過度的地區轉換可以通過繁簡處理的全域轉換來修復(詳見該頁面),也可以通過後文中提供的其他方式實現。
單獨轉換
「-{轉換內容}-」或「避免過度-{}-轉換內容」是單獨轉換的原始碼實現。單獨轉換可以用於避免特定的過度轉換,或者實現其他的一些特殊功能。
舉例而言,條目艾奧瓦州的單獨轉換:
又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
可以用於別名的展示。其展示的結果便是「又譯作愛阿華州、愛我華州或衣阿華州」。或者用「{{各地中文名}}」等模板,說明之間差異。
又舉例說明避免特定的過度轉換:上文所述的「數位人士」,在存在「數位→数码」轉換的同時可通過「數-{}-位人士」來避免過度轉換。
注意事項
手動轉換書寫格式
- 概括而言:您可以只使用zh-hans與zh-hant便達到目的,也歡迎您按照推薦的格式來書寫
雖然,地區詞處理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六種模式,但出於方便實際操作的原因,並不強制要求按照何種方式填寫,只要填寫的轉換能夠滿足預期的要求,並在各種模式下都不出現錯誤即可。
然而,上述的操作實際上並不完全符合於繁簡轉換與地區詞轉換分立的思想。因此,這裡還推薦另一種做法,即讓zh-hans、zh-hant的名稱保持一致,只填寫繁簡體對應詞,不要填寫對應地區詞。對A轉換採用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。這一做法並不要求所有的編者都要掌握,因此不會對第一種簡便做法填寫造成任何妨礙,了解第二種做法的編者會逐漸地將第一種做法修正。
參考文獻應避免情況
此外,參考文獻中的標題、章節等部分文字不應轉換繁簡(其他部分除外,尤其是外文作者姓名中譯等內容應參與轉換),因此,如果不在參考文獻的部分文字處停用繁簡轉換,則無論是在全域轉換、主題轉換還是全文轉換中,都有可能會影響當中文字。為避免此類現象發生,建議在參照參考文獻時使用可停用標題、章節等參數繁簡轉換的{{cite}}系列模板。
官方中文名稱處理
當一個機構、組織、公司或人物已有官方的漢字或中文名時,社群對應否轉換地區詞出現分歧。臨時解決方案為:條目標題遵從包括「名從主人」慣例在內的命名常規命名;各地中文變體版本對此以「地區詞轉換」方式顯示當地可靠來源的最常用用法。此方案不反對在文中個別地方標明條目所述機構、組織、公司或人物在其他地區的名稱。