智能输入法软件的社会责任问题

2010-01-04

笑来老师前不久在 twitter 上多次讨论了两个话题:五笔与中医。于是,我于 1 月 1 日晚向他简要提了两句我对五笔和中医的理解。1 月 2 日,笑来老师即发表博文称“现在的初学者最好别选五笔输入法”,不知算不算是对我的回应。那篇博文继而引发了一场令他心满意足的争论。感谢他在评论中提到了我的一篇旧文——尽管我也隶属于不赞同笑来老师那篇博文部分论点的行列。

五笔与拼音作为两种思路迥异的汉字输入法,其争斗由来已久,我的观点已在那篇旧文中做了陈述。如果我有能力引导这场炒冷饭的争论,我不会再将五笔与拼音作为对比对象,而会将传统的、本地的、低智能的输入法(如五笔、郑码、Windows 全拼/双拼、智能 ABC)与新兴的、网络的、高智能的输入法(如谷歌拼音、搜狗拼音与五笔、QQ 拼音与五笔)作为对比对象。比较这二者,我认同后者中的很多理念必然成为未来输入法中的重要元素;但后者目前的技术实现、商业运营及其行业大环境,则不能令我满意。因此,我个人暂时选择传统的五笔,而对于所谓的智能输入法,谨慎观望与期待。

我首先赞同智能化的大趋势,因为借助技术的进步来降低用户门槛、提高用户体验,是计算机历史发展的必然。对于笑来老师强调的 Google 那篇基于信息论的汉字输入法分析,我对其理论基础和技术愿景都是认可的。不同语言使用的字符集的信息熵不一致,在具有上下文的情况下,确实可以计算出“1 个汉字 ≈ 1.3 次击键”的公式。但对于经过长期历史演化形成的各种现代自然语言,我相信它们具有“表达相同的语义,击键次数基本相同”的特性——前提是所有语言都使用了基于上下文分析的智能输入法(想想手机上的 T9 英文输入法,它基于智能构词;看看国人开发的 Triivi,已经具备基于词组的智能匹配;再看看 eLocutor 这种为斯蒂芬·霍金教授设计的单键输入方案,成功地应用了基于语义的词语匹配)。因此,从这个角度说,即使是英文输入,未来的击键次数都有可能大幅减少。如果仅从输入效率和正确性角度来说,各国语言的输入法必然要选择智能化之路。只不过汉字的特殊性使它率先成为了探索的对象。

无论借助机器性能的大幅提高,还是新的计算理论的突破,在单机上实现无误的上下文匹配的“1.3 键/字”输入方案都是很有可能的——但前提是语义连续、词汇库固定。语义分析是智能输入的基石,在输入离散内容(如花名册、生词表)时,语义分析随即失灵,智能优势不复存在。同时,再智能的算法也不可能预料“陈冠希”这种新名词的出现,新词入库需要外部机制解决。但在目前的技术条件下,互联网还没有进入自组织、自进化的智能阶段,所谓的社会计算仍然是程序驱动下的被动计算,所谓的网络语料库必然揉合了大量人工的或机械化程序的因素。作为一种过渡,我们可以接受现有的智能输入法;但作为一个技术愿景,它还有很长的路要走。然而,各种领域的智能化都会涉及一个“度”的问题:技术应该在多大程度上代替用户的思维?用户自己还需要保有哪些技能?技术的不恰当使用又会对这个行业乃至整个社会带来什么威胁?这些问题不得不牵扯到笑来老师不以为然的软件社会责任问题。

首先,是用户对技术的可知、可控性。这有点类似 Richard Stallman 的自由观:你应该对保证你使用的工具是可理解的(当然,对于一般用户来说没有必要理解,但你不能放弃理解它的权力)、可限制其行为范围的。输入法作为一种较为基础而又相当重要的通用软件,应该由用户本人或者一套非专有的机制保证这一关键环节的可控性,而不能将其寄托在若干家专有的互联网公司身上。传统输入法的实践虽缺乏可知(不一定开源),但相对可控(没有联网操作)。我们应当期望智能输入法未来不再受控于专有技术和单一机构;即使依赖于网络,也能够在各类软硬件平台上出现一致的、无用户接口级差别的实现,让用户不再依赖于具体的产品。这一点类似于 Linux 之于 Windows——开源是次要的,派生和商业化也是可行的,但保障自由是关键的。

其次,汉字输入是否需要作为一种技能而存在,这有待商榷。图形界面的出现让用户不再需要记忆烦琐的命令、Web 的出现让用户不再需要使用其它单调的网络信息协议,用户放弃这类技能是顺理成章的,因为在这些情况下技术对于一般用户来说是生产工具而非劳动对象,应当对用户保持简单和透明。但汉字输入究竟属于一般性的工具,还是属于公民语言文字技能的组成部分,这个定位会决定智能输入法应该智能到什么程度。如果它是语言文字技能的一部分,那么除了快速、正确之外,还有必要保证精确,即在掌握一个汉字的精确发音、写法的前提下,再掌握它的某一项精确的数字化属性,就算单字也可精确录入。目前而言,形码基本符合这一属性,而基于拼音的智能输入法反而更像一种“听写法”、“意识流记录法”,而非文字数字化技能。

再次,是五笔之父王永民教授老生常谈的汉字教育和文化传承问题。王教授所谓的“拼音毁灭文化”的确言过其实、危言耸听,但目前已经被媒体关注的错别字涌现、提笔忘字等,确实成为了一种智能化引发“网民病”。这一点是输入法“简化记忆负担”带来的副作用,因此智能输入法至少不适合在语文教育的基础阶段推广。但因噎废食不是办法,最好依靠技术之外的社会方法来预防这些社会问题的发生。也许市场的细分可以缓解这一问题:针对一般网民或文秘的输入解决方案(智能输入法)、针对古籍或户籍等离散内容的输入解决方案(形码+基于专用库匹配)、针对速记和同传的输入解决方案(速录机),以及适合文化教育的解决方案(这可能不是单纯的输入法,而是与传统教育结合的整体解决方案)。

最后,我要说的是当前软件行业的大环境给汉字智能输入法笼罩的阴影。上世纪末本世纪初,刚刚形成气候的中国共享软件生态圈就随着互联网泡沫的破灭而急剧缩水。然而中国民间的软件行业却没有因此销声匿迹,相反,它们探索出了一条“中国特色”的发展模式:免费是王道(知道自己斗不过盗版);收费靠娱乐(网站形象秀和网页游戏的收入恐怕远大于商务邮箱);功能一定大而全(媒体播放器不管有没有侵权也要支持所有格式);界面一定酷而炫(杀毒软件也需要支持换肤、有卡通助手);对用户要体贴(帮盗版 Windows 用户安装安全补丁,屏蔽“黑屏”补丁);对同行不手软(输入法的强行排序、安全软件的误导性“警告”);对上游要服帖(建设产业链,有钱大家赚);无论何种应用,联网都是必须(还记得去年的“暴风门”吗),一方面可以向用户推送广告(人之常情,可以理解),另一方面则要对用户的行为乃至数据进行收集上报(名曰提高用户体验,但谁知道他们在进行什么勾当)……我并不否认“中国特色”有相当的可取之处,但其中的某些畸形确实是影响这个行业进步的障碍。我痛恨某些厂商在这一过程中出于自身利益及其它不可公开的目的对用户进行的不良引导。如果这样的大环境不改变,即使技术的进步使得无误的智能输入成为可能,这类涵盖了太多非功能因素的智能输入法也终将成为少数机构实现自身利益的工具。

总之,中国人的计算机中“输入层”必不可少,它需要尽量屏蔽语言障碍,让中国人更加自然地使用计算机。但“输入层”决不能不受到社会责任和用户能力制约。