拼音输入法

拼音输入法是指依据汉语拼音进行编码的输入法,又称音码输入法[1],包括使用官话(包括普通话或国语)发音的汉语拼音输入法注音输入法,和一些汉语变体(或汉语方言)的输入法,例如使用粤语发音的各类粤语拼音输入法等。

分类

拼音输入法可以按注音符号汉语拼音两种汉字拼音方案分成两大类。还有非官话区自行开发的以当地方言为编码的拼音输入法,如地区的粤音输入法和上海等地的吴语注音输入法。

注音输入法

注音输入法是根据注音符号进行编码的拼音输入法。一般主流的操作系统都附带这种输入法。如微软的Windows系统中的微软新注音。第三方的则有新酷音输入法

汉语拼音输入法

 
Windows自带的微软拼音
 
SCIM的智能拼音

汉语拼音输入法的编码是依据汉语拼音方案汉字读音)进行输入的一类中文输入法。早期只有全拼这种方式,即完全依照汉字的整个音节来输入。随著技术的发展,拼音输入法不仅可以简拼还出现了一种只需两键就能输入整个音节的双拼方案

注音输入法一样,目前的系统都附带有汉语拼音输入法,如微软Windows系统就包含有全拼输入法智能ABC(从Windows Vista开始该输入方式被整合到微软拼音中)和微软拼音

市场上有许多用拼音作基础的输入软件。首先,大部分的现代操作系统都跟随着一副汉语拼音输入法。其他商业拼音输入产品有:紫光拼音拼音加加黑马神拼南极星字词拼音搜狗拼音输入法谷歌拼音输入法QQ拼音智能狂拼自然输入法等等,这些都需要用户自行安装。

南京官话输入法

南京官话有入声、分尖团、分平翘,是传承中古音最完美的官话,从明初到清末一直是标准官话。南京拼音输入法是一种对汉字的偏老派南京话读音进行拉丁化的输入法[2]

粤音输入法

汉字粤音输入法是一种根据汉字的粤语读音进行编码的输入法。对于母语为粤语的华人来说,粤语拼音输入法让他们直接以母语思考和发音,比普通话拼音输入法易学易用。特别是普通话背景不强的香港和澳门用户,对粤语拼音输入法有一定的需求。

上海吴语输入法

上海吴语注音输入法是根据现代的上海吴语(俗称上海话吴语)读音进行编码的一种主要面向说上海话的用户,并自称是一个学习上海话的辅助性工具。[3]

闽南语/台语输入法

主要有中华民国教育部委托行易公司制作的台湾闽南语汉字输入法以及教会自行研发的信望爱台语客语输入法。

台湾闽南语汉字输入法
是以教育部官方公布的台罗拼音输入,并且以官方的台湾闽南语推荐用字及《台湾闽南语常用词辞典》之用字为基准,可选择输出汉字或台罗拼音,可算是先前发布的台罗输入法的进阶版。两个字以上的词汇可省略声调输入,如:ianhue可得“宴会”及“烟火”;三个字以上的词汇则可只输入各音节的第一个音位,如:iath可出得“圆仔汤”。另外也支援“0”代替不确定的声调,“?”代替不确定的拼音字母,“*”为万用字元。可自行编辑词库。

信望爱台语客语输入法
可用传统白话字台罗拼音两种模式输入,可选择全罗马字、汉罗夹杂、全汉字三种方式输出,罗马字也有白话字或台罗拼音两种输出模式可选。支援词组输入,如:taiuanlang 打出 tâi-uân-lâng;支援三音节以上(含)的首码缩写输入功能。自动检查网路词库更新,能从网路上下载词库安装更新档,也允许使用者自订词库。

拼音输入法编码的特点

拼音输入法的编码方式是基于每个使用者从启蒙教育就学习过的注音符号或汉语拼音,所以上手快速,不需要进行特别的训练。而因为是基于读音的输入法,令用户不用知道文字写法也能输入,让大陆人对繁体字或台湾人对简体字的可以方便地输入,同时也满足了不会写汉字的一些海外华人的需要。

由于中文的同音字不少,拼音作为汉字输入法编码时,单字重码率相当高,即使词组重码率也是非常高。而形码或音形码方面,单字和词语的重码率都远低于拼音输入法编码(在GB2312字符集单字重码率上,像五笔二笔郑码的重码率都低于5%,而汉语拼音的编码重码率高达94%,即使词组重码率上,形码或音形码重码率仍然要比拼音编码重码率低得多)。

为了让拼音能够较快速的录入汉字,只有借助复杂的输入法软件来提高拼音输入能力,比如支持智能排序,以词定字,整句输入,云输入功能等。在输入生僻字方面,因为一般人只认识二千到三千个汉字的读音,所以往往无法使用拼音编码方法输入这些汉字。对于不存在读音的汉字还不存在相应的拼音编码,更是不能使用拼音输入。而有时为了输入这些汉字,就需要借助其他输入法编码或者其他输入技术,所以在输入法软件中通常除了拼音输入法编码外,还提供了笔画输入法或者手写输入方式。

虽然用户只要知道文字读音就能输入汉字,也因此容易令人出现提笔忘字的情况。[4]但提笔忘字并非拼音输入法造成。早在先秦时代就出现不会写的字用同音字代替的现象,保留到现在成为通假字。历代字典都收录大量讹字,即错别字,表明了中国历史上写错别字的现象。在近代以前,中国绝大多数民众属于文盲,根本不会写字。提笔忘字的根本原因是进入信息时代后一般人需要手写的机会越来越少,很多人都是使用电脑办公,不管用拼音还是使用音形码或形码输入法,都会出现提笔忘字现象。拼音输入法因为打字时不用想字的形状所以出现提笔忘字的现象较为明显,但是像五笔等形码的输入法因为到了熟练后只是进行条件反射地输入汉字,此过程中也不联想汉字的形状,所以同样会出现提笔忘字现象,只不过是五笔初学者对五笔还没熟练,所以才时时刻刻想字的形状。

针对拼音输入法编码本身的缺点,很多拼音输入法软件都提供了复杂的功能,从而提高了拼音输入文字的效率。而输入法软件中提供的拼音外输入方式,则是让用户在拼音无法输入汉字时的使用:

  • 输入法软件可以用户的实际情况设置有模糊音功能,使得许多普通话不标准的使用者能熟悉掌握。许多南方人因为受方言的影响,分不清普通话中的前鼻音后鼻音和卷舌音如z、c、s和zh、ch、sh等,在软件不支持模糊音之前使用拼音输入文字经常出现打错拼音需要修改的现象。
  • 拼音输入法提供大词库。汉语拼音输入法的GB2312字符集单字重码率高达94%,在过去输入法软件不支持词组输入,打拼音经常需要翻很多页才能找到所需要输入的汉字。但现在拼音输入法软件都支持词组输入,词组的重码率要比单字重码率低不少。因为音形码或形码词组越多总的重码率越大(单字重码率一般低于5%),所以这类输入法都要要筛选词组;而拼音词组越多总的重码率却更小(单字重码率为94%),所以拼音输入法就尽可能地扩大词组数量,而且为了进一步降低重码率还加入了大量短语式的词组,如“去打篮球”(严格上并不是词语,而且重码率仍然要高于音形码或形码的输入法词组重码率)。而且现今的输入法软件都有较强的智能学习能力,可以通过词频动态调整词序,大大增强了拼音编码的输入效率。
  • 拼音输入法支持整句输入能力。2000年代后期出现的智能拼音已经从单字输入进化到整句输入,简拼输入,再加上智能学习的功能,虽然重码率并不能发生变化,但软件通常会将需要输入的文字调到前面,所以需要选字的情况越来越少,用得越久,输入法对用户的习惯越了解,越不容易出现需要选字的情况。即使是使用拼音输入法,高手也是以打词组为主,很少用整句输入,除非是极简单的常用语句。而对于音形码或形码,虽然也可以使用整句输入,如使用Rime输入法软件可以让五笔或仓颉等输入法支持整句输入,但是整句输入带来的不确定性反而可能降低输入效率,因为音形码或形码基本是一个编码对应一个字或词,输完编码后就可直接输出对应文字,这种输入方式就类似于英文的输入,英文是一个编码一个字母,而音形码或形码是几个字母组合的编码一个字或一个词组。
  • 只用拼音编码对于不知道读音的生僻字无法输入,所以输入法软件提供了非拼音的输入方式。软件所提供的这些非拼音输入方式,如笔画输入和手写输入,并不是拼音输入法编码本身,只不过是软件带有的辅助功能。像搜狗拼音、谷歌拼音等输入法,对生僻字,可以按每个汉字的部件的拼音输入,输入法可以智能识别。例如,在谷歌拼音下,如果不会念“祎”这个字,可以把它拆成“示+韦”,键入ushiwei,系统就会显示出“祎”这个字。这种输入方式,严格来说是属于形码编码方法,并非拼音编码。而输入法软件中的笔画输入法方式则属于典型的形码编码技术。有些输入法软件,如搜狗拼音,有手写功能,不会念的字,可以手写输入,这种输入方式属于非键盘类的输入方式。这些输入方式在很多形码类输入法软件,如QQ五笔输入法,同样有这样的功能,但往往用不上。

简繁转换问题

随著不断增长的用户需求,为中国大陆的用户所开发的各类原先只能录入简体中文的输入法渐渐开始提供繁体输入模式。此类输入法的繁体输入有一大弊病:由于这些输入法的字库基于简化字,而部分简化字由多个不同的繁体字简化合并而来,如“皇后”的“后”与“後面”的“後”在繁体中文中本是不同的字,简化后均合并为“后”,导致一部份拼音输入法(如老版本谷歌拼音输入法)在繁体中文输出模式下的“後面”变成了“后面”。类似错误还有“頭髮”的“髮”字成为“發現”的“發”、“穀物”的“穀”成为“峡谷”的“谷”等。

对于此类问题有效的解决办法则是分词后按照词组转换,而不是按照单字转换。这样的解决方案被微软拼音输入法紫光拼音输入法搜狗拼音输入法等较新的汉语拼音输入法所采用,但是在实际使用中亦存在一些问题。如在搜狗拼音输入法较早期版本的繁体模式下输入“下面”时,会被强制转换为“下麵”,即使用户单独选择“下”和“面”两个字,最后输出的依然为“下麵”。另外还有“只”字与“采”字,在简体字转繁体字的时候,会被强制转为“隻”字与“採”字,不管上下文是什么,原因是这两个字更常用。但随着输入法产商的不断完善,类似错误出现频率也在缩小当中。

另外,有些为台湾用户开发的注音输入法也带有简体输入功能。当一个繁体字可以对应多个简体字时,也会出现转换错误。如将“乾隆”(正确写法繁简相同)转换为“干隆”,将“瀋陽”(正确简体写法为“沈阳”)转换为“渖阳”,将“參拾”(正确简体写法为“叁拾”)转换为“参拾”。

汉语拼音输入法与注音输入法的对比

注音输入法加上声调编码最多只有四码,相比汉语拼音输入法(全拼)来说击键次数要少,但是,注音输入法使用的按键范围比较广,占用了标点和数字键,键程更长,打字时手指的运动范围增大,很不便捷,因此,输入速度并不一定更快,而且在输入数字和标点时比较麻烦。

注音输入法往往需要特别印制的键盘,对于没有印制注音符号的普通键盘,很多人就无所适从了。而汉语拼音输入法编码只需要26个英文字母(汉语拼音中的ü由键盘上的v对应),使用者只要记住键盘上26个英文字母的位置,就可以快速上手。早期因为选字排序的原因,造成很多在某一领域流行的实际写法有误的词语。虽然在目前因为拼音输入法在词组简拼、整句输入等智能选词方面的努力,使得以假乱真的情况不复存在,却也因简拼的关系出现许多声母相同而读音和意思完全不同的网络词语,这些词语有的是无心之举,但有很多谐音词(部分词语仅谐开头辅音),诸如斑竹(版主)、杯具(悲剧)、烧饼(傻逼)等,实际上已成为原词约定俗成的另一种写法。

注音输入法除声母、韵母外,还需输入声调,而主流的汉语拼音输入法则不需输入声调。因此,注音输入法重码率低于汉语拼音输入法,输入生僻单字时翻页次数较少。

注释

  1. ^ 学者忧虑“音码”输入法葬送汉字文化. 中国新闻网. 北京晚报. 2013-08-26 [2018-07-18]. (原始内容存档于2018-07-18). 
  2. ^ 南京拼音輸入法. [2019-02-21]. (原始内容存档于2021-12-16). 
  3. ^ 上海吳注音輸入法. [2009-11-30]. (原始内容存档于2020-11-23). 
  4. ^ 提笔忘字:电脑时代专家为汉字书写退化担忧. [2012-03-20]. (原始内容存档于2014-02-22) (中文). 相关资料显示,在中国长期使用“拼音输入法”的人士中,有“提笔忘字”体验者超过 95% 。这是因为许多人长期在电脑、手机上“ 打拼音 ”,已经习惯了“用拼音代替汉字”,先打“拼音”再找字,丝毫不涉及汉字的笔画和字形,致使我国越来越多的人“ 提笔忘字 ”,甚至不会写字。 

参看

外部链接