浅议客观评价输入法的标准

2007-05-13

以搜狗拼音、谷歌拼音为代表的新一代基于互联网词库的、以句子为单位的拼音输入法一经推出,随即受到了广大网民欢迎,网上掀起新一轮更换输入法的热潮。与此同时,经典的五笔字型输入法也在推陈出新,以极点五笔为代表的输入法不断适应新的应用需求,在文秘办公与计算机专业领域发挥着重要的作用。

针对输入法的评论早已不是什么新鲜话题。计算机在中国普遍应用以来,拼音和五笔的“斗争”就没有停息过。早在上世纪九十年代初,五笔字型的发明人王永民先生就发表了《拼音输入:汉字文化的掘墓机》一文,严辞批评拼音输入法;而网上广为流传的一篇署名为“猪八戒”的幽默文章《疯狂批判五笔字型》则用唇枪舌剑直指五笔。传统评价输入法的标准不外乎输入速度与上手的难易程度,这两个标准直接关系到用户使用计算机工作的效率,同时相对易于考察,因此得到了人们的普遍认同。大多数评论输入法的文章都是基于这两点展开讨论的,本文不再赘述。但要客观地评价或对比各类汉字输入法,还涉及很多其它因素,其立足点和标准有待商榷。文本简单讨论一些在评价输入法(特别是智能的拼音输入法与五笔字型)方面值得研究的问题,希望够能起到抛砖引玉的作用。

一、区分汉字编码方案与汉字输入方法。汉字编码方案是指按照一定的规划,对不同的字或词给予相应的代码;而汉字输入方法是指运用某种编码方案,由操作者向计算机输入汉字的方法。汉字编码方案通常具备重码率低、上下文相关度低、可相对独立地表示汉字等特点。区位码、电报码以及各类笔型编码是典型的汉字编码方案,全拼在一定程度上也可以认为是广义的汉字编码方案。而汉字输入方法则在汉字编码方案的基础上加以扩展,使用简化编码、上下文关联、模糊容错、频度分析等智能技术降低学习门槛,减少重码率,提高输入效率。传统的输入法直接接受汉字编码方案,而新一代输入法超越了汉字编码方案的限制。

拼音本身的特性使得它容易利用上述几种技术简化和智能化,以句子为单位的拼音输入法成功的关键就在于智能技术的应用在输入方法与编码方案之间架设了一座自动化的桥梁。但智能技术的核心基于的是上下文分析,在不具备上下文环境的情况下对单字、单词的输入,智能技术难以发挥优势。五笔字型是输入法与编码方案高度耦合的典例,它重码率低,上下文无关,但汉字字型的特性又决定了五笔难以利用上述技术智能化。由于大多数输入工作是上下文相关的,这一点成为当前拼音输入法抨击五笔字型的主要论据。

二、输入法的科学性问题。输入法要求高效还是科学?在辨明汉字编码方案与汉字输入方法的区别后我们可以看到:汉字编码方案的功能是为汉字提供人与计算机都能接受的表示方式,理应强调其规范性和科学性;而汉字输入方法更主要的是为简易高效地录入汉字而设计,其规范性和科学性就会打一定的折扣。以拼音为例,《汉语拼音方案》是经领域专家研究制订,国家法律确定,几十年应用验证的一套较为科学的字音编码方案,而多数拼音输入法的简码、模糊音输入是违反《汉语拼音方案》方案的,这作为提高输入法效率的一种措施,对汉字编码本身的科学性无太大不良影响。同样,如果将五笔字型更多地作为一种输入方法,而非纯粹的编码方案来看待,它对汉字的一些不合常规的拆分方式也是可以理解的。即使是汉字编码方案,本身也不可能是完美的。譬如要说五笔将“礻”上的一点抹去是不科学的,那么同样可以认为《汉语拼音方案》中“q”、“x”不符合国际发音也是不科学的——毕竟输入法不是汉字本身的规范,只是辅助的输入的手段,不必矫枉过正,将科学性强加为批判的把柄。

三、输入法的运算量与人对机器的依赖性问题。以句子为单位的拼音输入法涉及大量人工智能算法,实现较为复杂,机器运算量大,一些高级功能甚至要依赖网络。而五笔字型这类与编码方案高度耦合的输入法在计算机算法实现上相对简单,一般仅需考虑优化存储与高效查表,因此运算速度快,机器要求低。智能的拼音输入法记录了用户大量的词库、词汇频度、使用习惯等信息,久而久之用户会有“越用越好用”的感觉。但在经过长期的人机相互适应过程后,用户往往会对特定机器上的特定输入法产生或多或少的依赖性,换用其它品牌的拼音输入法甚至为其它用户所磨合的同一输入法后就会有所不适。为解决用户习惯的迁移问题,谷歌拼音采用了网络存储的方案,但这又一次强化了用户对网络的依赖性。相比之下,用户对不同五笔字型输入法的依赖性要小一些,主要集中在词库和辅助功能(如便捷的造词方式、智能编码提示)方面。用户可以较快地适应不同机器上不同品牌的五笔字型输入法。

简言之,这两种思路的核心区别在于输入法把运算量交给人脑还是电脑——在当今信息时代,让电脑替代人脑的冗繁劳动固然是大势所趋,但自动化永远是双刃剑,我们应防止自己被技术捆住手脚。如何权衡人脑和电脑工作,值得深思。

四、软件的社会责任问题。计算机和软件在提高人们工作效率的同时也在影响着人们的日常习惯。由于长期使用基于拼音的汉字输入方法导致的“提笔忘字”现象已得到社会的关注。因拼音输入引起的网络文章错字成篇、网络语言使用别字成为时尚,确实对汉字文化及计算机初学者(特别是中小学生)有不利的影响。同时,一些五笔字型用户,特别是专业录入人员,往往形成了只会看稿打字的习惯;熟练的五笔用户在大脑中建立了字到键盘的映射之后也可能忽略汉字字型,同样产生“提笔忘字”现象。软件的社会责任问题深入之即是科学的道德问题,在当今社会以人为本的精神指导下,有必要作为考察输入法的标准之一。

五、历史包袱问题。一些评论输入法的文章常常喜欢拿输入法的“历史问题”说事。例如批评五笔字型,常说它占了先入为主的便宜、利用政令和考试机制得以发展等;批评拼音,则以早期高重码、低效率的全拼为比照对象。任何事物都是不断发展和变化的,更何况日新月异的计算机技术。我们应以抛开历史包袱以及其它一些无关因素,客观且现时地评价不同输入法的长短优劣。

总而言之,要对汉字输入法加以评论,客观和全面的标准是必不可少的。上述几点见解希望对读者有所启发。