拼音輸入法
此條目可能包含原創研究。 |
此條目過於依賴第一手來源。 (2015年12月14日) |
拼音輸入法是指依據漢語拼音進行編碼的輸入法,又稱音碼輸入法[1],包括使用官話(包括普通話或國語)發音的漢語拼音輸入法和注音輸入法,和一些漢語變體(或漢語方言)的輸入法,例如使用粵語發音的各類粵語拼音輸入法等。
分類
拼音輸入法可以按注音符號與漢語拼音兩種漢字拼音方案分成兩大類。還有非官話區自行開發的以當地方言為編碼的拼音輸入法,如粵港澳地區的粵音輸入法和上海等地的吳語注音輸入法。
注音輸入法
注音輸入法是根據注音符號進行編碼的拼音輸入法。一般主流的操作系統都附帶這種輸入法。如微軟的Windows系統中的微軟新注音。第三方的則有新酷音輸入法。
漢語拼音輸入法
漢語拼音輸入法的編碼是依據漢語拼音方案(漢字的讀音)進行輸入的一類中文輸入法。早期只有全拼這種方式,即完全依照漢字的整個音節來輸入。隨著技術的發展,拼音輸入法不僅可以簡拼還出現了一種只需兩鍵就能輸入整個音節的雙拼方案。
和注音輸入法一樣,目前的系統都附帶有漢語拼音輸入法,如微軟Windows系統就包含有全拼輸入法、智能ABC(從Windows Vista開始該輸入方式被整合到微軟拼音中)和微軟拼音。
市場上有許多用拼音作基礎的輸入軟件。首先,大部分的現代操作系統都跟隨着一副漢語拼音輸入法。其他商業拼音輸入產品有:紫光拼音、拼音加加、黑馬神拼、南極星字詞拼音、搜狗拼音輸入法、谷歌拼音輸入法、QQ拼音、智能狂拼、自然輸入法等等,這些都需要用戶自行安裝。
南京官話輸入法
南京官話有入聲、分尖團、分平翹,是傳承中古音最完美的官話,從明初到清末一直是標準官話。南京拼音輸入法是一種對漢字的偏老派南京話讀音進行拉丁化的輸入法[2]。
粵音輸入法
漢字粵音輸入法是一種根據漢字的粵語讀音進行編碼的輸入法。對於母語為粵語的華人來說,粵語拼音輸入法讓他們直接以母語思考和發音,比普通話拼音輸入法易學易用。特別是普通話背景不強的香港和澳門用戶,對粵語拼音輸入法有一定的需求。
上海吳語輸入法
上海吳語注音輸入法是根據現代的上海吳語(俗稱上海話或吳語)讀音進行編碼的一種主要面向說上海話的用戶,並自稱是一個學習上海話的輔助性工具。[3]
閩南語/台語輸入法
主要有中華民國教育部委託行易公司製作的臺灣閩南語漢字輸入法以及教會自行研發的信望愛台語客語輸入法。
臺灣閩南語漢字輸入法
是以教育部官方公佈的臺羅拼音輸入,並且以官方的臺灣閩南語推薦用字及《臺灣閩南語常用詞辭典》之用字為基準,可選擇輸出漢字或臺羅拼音,可算是先前發布的臺羅輸入法的進階版。兩個字以上的詞彙可省略聲調輸入,如:ianhue可得「宴會」及「煙火」;三個字以上的詞彙則可只輸入各音節的第一個音位,如:iath可出得「圓仔湯」。另外也支援「0」代替不確定的聲調,「?」代替不確定的拼音字母,「*」為萬用字元。可自行編輯詞庫。
信望愛台語客語輸入法
可用傳統白話字或臺羅拼音兩種模式輸入,可選擇全羅馬字、漢羅夾雜、全漢字三種方式輸出,羅馬字也有白話字或臺羅拼音兩種輸出模式可選。支援詞組輸入,如:taiuanlang 打出 tâi-uân-lâng;支援三音節以上(含)的首碼縮寫輸入功能。自動檢查網路詞庫更新,能從網路上下載詞庫安裝更新檔,也允許使用者自訂詞庫。
拼音輸入法編碼的特點
拼音輸入法的編碼方式是基於每個使用者從啟蒙教育就學習過的注音符號或漢語拼音,所以上手快速,不需要進行特別的訓練。而因為是基於讀音的輸入法,令用戶不用知道文字寫法也能輸入,讓大陸人對繁體字或台灣人對簡體字的可以方便地輸入,同時也滿足了不會寫漢字的一些海外華人的需要。
由於中文的同音字不少,拼音作為漢字輸入法編碼時,單字重碼率相當高,即使詞組重碼率也是非常高。而形碼或音形碼方面,單字和詞語的重碼率都遠低於拼音輸入法編碼(在GB2312字符集單字重碼率上,像五筆、二筆和鄭碼的重碼率都低於5%,而漢語拼音的編碼重碼率高達94%,即使詞組重碼率上,形碼或音形碼重碼率仍然要比拼音編碼重碼率低得多)。
為了讓拼音能夠較快速的錄入漢字,只有藉助複雜的輸入法軟件來提高拼音輸入能力,比如支持智能排序,以詞定字,整句輸入,雲輸入功能等。在輸入生僻字方面,因為一般人只認識二千到三千個漢字的讀音,所以往往無法使用拼音編碼方法輸入這些漢字。對於不存在讀音的漢字還不存在相應的拼音編碼,更是不能使用拼音輸入。而有時為了輸入這些漢字,就需要藉助其他輸入法編碼或者其他輸入技術,所以在輸入法軟件中通常除了拼音輸入法編碼外,還提供了筆畫輸入法或者手寫輸入方式。
雖然用戶只要知道文字讀音就能輸入漢字,也因此容易令人出現提筆忘字的情況。[4]但提筆忘字並非拼音輸入法造成。早在先秦時代就出現不會寫的字用同音字代替的現象,保留到現在成為通假字。歷代字典都收錄大量訛字,即錯別字,表明了中國歷史上寫錯別字的現象。在近代以前,中國絕大多數民眾屬於文盲,根本不會寫字。提筆忘字的根本原因是進入信息時代後一般人需要手寫的機會越來越少,很多人都是使用電腦辦公,不管用拼音還是使用音形碼或形碼輸入法,都會出現提筆忘字現象。拼音輸入法因為打字時不用想字的形狀所以出現提筆忘字的現象較為明顯,但是像五筆等形碼的輸入法因為到了熟練後只是進行條件反射地輸入漢字,此過程中也不聯想漢字的形狀,所以同樣會出現提筆忘字現象,只不過是五筆初學者對五筆還沒熟練,所以才時時刻刻想字的形狀。
針對拼音輸入法編碼本身的缺點,很多拼音輸入法軟件都提供了複雜的功能,從而提高了拼音輸入文字的效率。而輸入法軟件中提供的拼音外輸入方式,則是讓用戶在拼音無法輸入漢字時的使用:
- 輸入法軟件可以用戶的實際情況設置有模糊音功能,使得許多普通話不標準的使用者能熟悉掌握。許多南方人因為受方言的影響,分不清普通話中的前鼻音後鼻音和捲舌音如z、c、s和zh、ch、sh等,在軟件不支持模糊音之前使用拼音輸入文字經常出現打錯拼音需要修改的現象。
- 拼音輸入法提供大詞庫。漢語拼音輸入法的GB2312字符集單字重碼率高達94%,在過去輸入法軟件不支持詞組輸入,打拼音經常需要翻很多頁才能找到所需要輸入的漢字。但現在拼音輸入法軟件都支持詞組輸入,詞組的重碼率要比單字重碼率低不少。因為音形碼或形碼詞組越多總的重碼率越大(單字重碼率一般低於5%),所以這類輸入法都要要篩選詞組;而拼音詞組越多總的重碼率卻更小(單字重碼率為94%),所以拼音輸入法就儘可能地擴大詞組數量,而且為了進一步降低重碼率還加入了大量短語式的詞組,如「去打籃球」(嚴格上並不是詞語,而且重碼率仍然要高於音形碼或形碼的輸入法詞組重碼率)。而且現今的輸入法軟件都有較強的智能學習能力,可以通過詞頻動態調整詞序,大大增強了拼音編碼的輸入效率。
- 拼音輸入法支持整句輸入能力。2000年代後期出現的智能拼音已經從單字輸入進化到整句輸入,簡拼輸入,再加上智能學習的功能,雖然重碼率並不能發生變化,但軟件通常會將需要輸入的文字調到前面,所以需要選字的情況越來越少,用得越久,輸入法對用戶的習慣越了解,越不容易出現需要選字的情況。即使是使用拼音輸入法,高手也是以打詞組為主,很少用整句輸入,除非是極簡單的常用語句。而對於音形碼或形碼,雖然也可以使用整句輸入,如使用Rime輸入法軟件可以讓五筆或倉頡等輸入法支持整句輸入,但是整句輸入帶來的不確定性反而可能降低輸入效率,因為音形碼或形碼基本是一個編碼對應一個字或詞,輸完編碼後就可直接輸出對應文字,這種輸入方式就類似於英文的輸入,英文是一個編碼一個字母,而音形碼或形碼是幾個字母組合的編碼一個字或一個詞組。
- 只用拼音編碼對於不知道讀音的生僻字無法輸入,所以輸入法軟件提供了非拼音的輸入方式。軟件所提供的這些非拼音輸入方式,如筆畫輸入和手寫輸入,並不是拼音輸入法編碼本身,只不過是軟件帶有的輔助功能。像搜狗拼音、谷歌拼音等輸入法,對生僻字,可以按每個漢字的部件的拼音輸入,輸入法可以智能識別。例如,在谷歌拼音下,如果不會念「禕」這個字,可以把它拆成「示+韋」,鍵入ushiwei,系統就會顯示出「禕」這個字。這種輸入方式,嚴格來說是屬於形碼編碼方法,並非拼音編碼。而輸入法軟件中的筆畫輸入法方式則屬於典型的形碼編碼技術。有些輸入法軟件,如搜狗拼音,有手寫功能,不會念的字,可以手寫輸入,這種輸入方式屬於非鍵盤類的輸入方式。這些輸入方式在很多形碼類輸入法軟件,如QQ五筆輸入法,同樣有這樣的功能,但往往用不上。
簡繁轉換問題
隨著不斷增長的用戶需求,為中國大陸的用戶所開發的各類原先只能錄入簡體中文的輸入法漸漸開始提供繁體輸入模式。此類輸入法的繁體輸入有一大弊病:由於這些輸入法的字庫基於簡化字,而部分簡化字由多個不同的繁體字簡化合併而來,如「皇后」的「后」與「後面」的「後」在繁體中文中本是不同的字,簡化後均合併為「后」,導致一部份拼音輸入法(如老版本谷歌拼音輸入法)在繁體中文輸出模式下的「後面」變成了「后面」。類似錯誤還有「頭髮」的「髮」字成為「發現」的「發」、「穀物」的「穀」成為「峽谷」的「谷」等。
對於此類問題有效的解決辦法則是分詞後按照詞組轉換,而不是按照單字轉換。這樣的解決方案被微軟拼音輸入法、紫光拼音輸入法、搜狗拼音輸入法等較新的漢語拼音輸入法所採用,但是在實際使用中亦存在一些問題。如在搜狗拼音輸入法較早期版本的繁體模式下輸入「下面」時,會被強制轉換為「下麵」,即使用戶單獨選擇「下」和「面」兩個字,最後輸出的依然為「下麵」。另外還有「只」字與「采」字,在簡體字轉繁體字的時候,會被強制轉為「隻」字與「採」字,不管上下文是什麼,原因是這兩個字更常用。但隨着輸入法產商的不斷完善,類似錯誤出現頻率也在縮小當中。
另外,有些為台灣用戶開發的注音輸入法也帶有簡體輸入功能。當一個繁體字可以對應多個簡體字時,也會出現轉換錯誤。如將「乾隆」(正確寫法繁簡相同)轉換為「干隆」,將「瀋陽」(正確簡體寫法為「沈阳」)轉換為「渖阳」,將「參拾」(正確簡體寫法為「叁拾」)轉換為「参拾」。
漢語拼音輸入法與注音輸入法的對比
注音輸入法加上聲調編碼最多只有四碼,相比漢語拼音輸入法(全拼)來說擊鍵次數要少,但是,注音輸入法使用的按鍵範圍比較廣,占用了標點和數字鍵,鍵程更長,打字時手指的運動範圍增大,很不便捷,因此,輸入速度並不一定更快,而且在輸入數字和標點時比較麻煩。
注音輸入法往往需要特別印製的鍵盤,對於沒有印製注音符號的普通鍵盤,很多人就無所適從了。而漢語拼音輸入法編碼只需要26個英文字母(漢語拼音中的ü由鍵盤上的v對應),使用者只要記住鍵盤上26個英文字母的位置,就可以快速上手。早期因為選字排序的原因,造成很多在某一領域流行的實際寫法有誤的詞語。雖然在目前因為拼音輸入法在詞組簡拼、整句輸入等智能選詞方面的努力,使得以假亂真的情況不復存在,卻也因簡拼的關係出現許多聲母相同而讀音和意思完全不同的網絡詞語,這些詞語有的是無心之舉,但有很多諧音詞(部分詞語僅諧開頭輔音),諸如斑竹(版主)、杯具(悲劇)、燒餅(傻逼)等,實際上已成為原詞約定俗成的另一種寫法。
注音輸入法除聲母、韻母外,還需輸入聲調,而主流的漢語拼音輸入法則不需輸入聲調。因此,注音輸入法重碼率低於漢語拼音輸入法,輸入生僻單字時翻頁次數較少。
注釋
- ^ 学者忧虑“音码”输入法葬送汉字文化. 中國新聞網. 北京晚報. 2013-08-26 [2018-07-18]. (原始內容存檔於2018-07-18).
- ^ 南京拼音輸入法. [2019-02-21]. (原始內容存檔於2021-12-16).
- ^ 上海吳注音輸入法. [2009-11-30]. (原始內容存檔於2020-11-23).
- ^ 提笔忘字:电脑时代专家为汉字书写退化担忧. [2012-03-20]. (原始內容存檔於2014-02-22) (中文).
相關資料顯示,在中國長期使用「拼音輸入法」的人士中,有「提筆忘字」體驗者超過 95% 。這是因為許多人長期在電腦、手機上「 打拼音 」,已經習慣了「用拼音代替漢字」,先打「拼音」再找字,絲毫不涉及漢字的筆畫和字形,致使我國越來越多的人「 提筆忘字 」,甚至不會寫字。