智能输入法软件的社会责任问题

2010/01/04 | 09:52 | 分类:IT杂谈 | 标签: | 637次阅读

  笑来老师前不久在 twitter 上多次讨论了两个话题:五笔与中医。于是,我于 1 月 1 日晚向他简要提了两句我对五笔和中医的理解[1][2]。1 月 2 日,笑来老师即发表博文称“现在的初学者最好别选五笔输入法”,不知算不算是对我的回应。那篇博文继而引发了一场令他心满意足的争论。感谢他在评论中提到了我的一篇旧文——尽管我也隶属于不赞同笑来老师那篇博文部分论点的行列。
  五笔与拼音作为两种思路迥异的汉字输入法,其争斗由来已久,我的观点已在那篇旧文中做了陈述。如果我有能力引导这场炒冷饭的争论,我不会再将五笔与拼音作为对比对象,而会将传统的、本地的、低智能的输入法(如五笔、郑码、Windows 全拼/双拼、智能 ABC)与新兴的、网络的、高智能的输入法(如谷歌拼音、搜狗拼音与五笔、QQ 拼音与五笔)作为对比对象。比较这二者,我认同后者中的很多理念必然成为未来输入法中的重要元素;但后者目前的技术实现、商业运营及其行业大环境,则不能令我满意。因此,我个人暂时选择传统的五笔,而对于所谓的智能输入法,谨慎观望与期待。
  我首先赞同智能化的大趋势,因为借助技术的进步来降低用户门槛、提高用户体验,是计算机历史发展的必然。对于笑来老师强调的 Google 那篇基于信息论的汉字输入法分析,我对其理论基础和技术愿景都是认可的。不同语言使用的字符集的信息熵不一致,在具有上下文的情况下,确实可以计算出“1 个汉字 ≈ 1.3 次击键”的公式。但对于经过长期历史演化形成的各种现代自然语言,我相信它们具有“表达相同的语义,击键次数基本相同”的特性——前提是所有语言都使用了基于上下文分析的智能输入法(想想手机上的 T9 英文输入法,它基于智能构词;看看国人开发的 Triivi,已经具备基于词组的智能匹配;再看看 eLocutor 这种为斯蒂芬·霍金教授设计的单键输入方案,成功地应用了基于语义的词语匹配)。因此,从这个角度说,即使是英文输入,未来的击键次数都有可能大幅减少。如果仅从输入效率和正确性角度来说,各国语言的输入法必然要选择智能化之路。只不过汉字的特殊性使它率先成为了探索的对象。
  无论借助机器性能的大幅提高,还是新的计算理论的突破,在单机上实现无误的上下文匹配的“1.3 键/字”输入方案都是很有可能的——但前提是语义连续、词汇库固定。语义分析是智能输入的基石,在输入离散内容(如花名册、生词表)时,语义分析随即失灵,智能优势不复存在。同时,再智能的算法也不可能预料“陈冠希”这种新名词的出现,新词入库需要外部机制解决。但在目前的技术条件下,互联网还没有进入自组织、自进化的智能阶段,所谓的社会计算仍然是程序驱动下的被动计算,所谓的网络语料库必然揉合了大量人工的或机械化程序的因素。作为一种过渡,我们可以接受现有的智能输入法;但作为一个技术愿景,它还有很长的路要走。然而,各种领域的智能化都会涉及一个“度”的问题:技术应该在多大程度上代替用户的思维?用户自己还需要保有哪些技能?技术的不恰当使用又会对这个行业乃至整个社会带来什么威胁?这些问题不得不牵扯到笑来老师不以为然的软件社会责任问题。
  首先,是用户对技术的可知、可控性。这有点类似 Richard Stallman 的自由观:你应该对保证你使用的工具是可理解的(当然,对于一般用户来说没有必要理解,但你不能放弃理解它的权力)、可限制其行为范围的。输入法作为一种较为基础而又相当重要的通用软件,应该由用户本人或者一套非专有的机制保证这一关键环节的可控性,而不能将其寄托在若干家专有的互联网公司身上。传统输入法的实践虽缺乏可知(不一定开源),但相对可控(没有联网操作)。我们应当期望智能输入法未来不再受控于专有技术和单一机构;即使依赖于网络,也能够在各类软硬件平台上出现一致的、无用户接口级差别的实现,让用户不再依赖于具体的产品。这一点类似于 Linux 之于 Windows——开源是次要的,派生和商业化也是可行的,但保障自由是关键的。
  其次,汉字输入是否需要作为一种技能而存在,这有待商榷。图形界面的出现让用户不再需要记忆烦琐的命令、Web 的出现让用户不再需要使用其它单调的网络信息协议,用户放弃这类技能是顺理成章的,因为在这些情况下技术对于一般用户来说是生产工具而非劳动对象,应当对用户保持简单和透明。但汉字输入究竟属于一般性的工具,还是属于公民语言文字技能的组成部分,这个定位会决定智能输入法应该智能到什么程度。如果它是语言文字技能的一部分,那么除了快速、正确之外,还有必要保证精确,即在掌握一个汉字的精确发音、写法的前提下,再掌握它的某一项精确的数字化属性,就算单字也可精确录入。目前而言,形码基本符合这一属性,而基于拼音的智能输入法反而更像一种“听写法”、“意识流记录法”,而非文字数字化技能。
  再次,是五笔之父王永民教授老生常谈的汉字教育和文化传承问题。王教授所谓的“拼音毁灭文化”的确言过其实、危言耸听,但目前已经被媒体关注的错别字涌现、提笔忘字等,确实成为了一种智能化引发“网民病”。这一点是输入法“简化记忆负担”带来的副作用,因此智能输入法至少不适合在语文教育的基础阶段推广。但因噎废食不是办法,最好依靠技术之外的社会方法来预防这些社会问题的发生。也许市场的细分可以缓解这一问题:针对一般网民或文秘的输入解决方案(智能输入法)、针对古籍或户籍等离散内容的输入解决方案(形码+基于专用库匹配)、针对速记和同传的输入解决方案(速录机),以及适合文化教育的解决方案(这可能不是单纯的输入法,而是与传统教育结合的整体解决方案)。
  最后,我要说的是当前软件行业的大环境给汉字智能输入法笼罩的阴影。上世纪末本世纪初,刚刚形成气候的中国共享软件生态圈就随着互联网泡沫的破灭而急剧缩水。然而中国民间的软件行业却没有因此销声匿迹,相反,它们探索出了一条“中aaa色”的发展模式:免费是王道(知道自己斗不过盗版);收费靠娱乐(网站形象秀和网页游戏的收入恐怕远大于商务邮箱);功能一定大而全(媒体播放器不管有没有侵权也要支持所有格式);界面一定酷而炫(杀毒软件也需要支持换肤、有卡通助手);对用户要体贴(帮盗版 Windows 用户安装安全补丁,屏蔽“黑屏”补丁);对同行不手软(输入法的强行排序、安全软件的误导性“警告”);对上游要服帖(建设产业链,有钱大家赚);无论何种应用,联网都是必须(还记得去年的“暴风门”吗),一方面可以向用户推送广告(人之常情,可以理解),另一方面则要对用户的行为乃至数据进行收集上报(名曰提高用户体验,但谁知道他们在进行什么勾当)……我并不否认“中aaa色”有相当的可取之处,但其中的某些畸形确实是影响这个行业进步的障碍。我痛恨某些厂商在这一过程中出于自身利益及其它不可公开的目的对用户进行的不良引导,这幅图描述了我的担忧。具体到现有的智能输入法软件,看看上面的多少条可以直接套用呢?笑来老师选择 Google 搜索而非百度搜索的原因不必多说,但谁又能保证这个号称“不做恶”的巨人不会入乡随俗?如果这样的大环境不改变,即使技术的进步使得无误的智能输入成为可能,这类涵盖了太多非功能因素的智能输入法也终将成为少数机构实现自身利益的工具。
  总之,中国人的计算机中“输入层”必不可少,它需要尽量屏蔽语言障碍,让中国人更加自然地使用计算机。但“输入层”决不能不受到社会责任和用户能力制约。

探访唐家岭,反思“蚁族”

2009/11/22 | 20:37 | 分类:生活空间 | 标签: | 1,713次阅读

  不能不说《蚁族》一书拉动了唐家岭小月河等地的旅游业。当然,这种所谓的“旅游”对大多数游客来说只是“想看一看”而已,对当地的经济基本没有正面作用,反而增加了交通的压力。今天,我与 Jeepidealee 同学慕名探访了唐家岭,参观了新时代知识青年的实现生活环境。

  我们从中关村软件园沿唐家岭路走向唐家岭村。住在唐家岭的外来人口很多在上地、软件园一带工作,所以这条路成为唐家岭对外最重要的通道。很窄的双行道,公交开行密度却很大,但也难以满足上下班人群的需求,来往的车辆均塞满了人。安全起见,行人和自行车往往要走在柏油路外侧的土路上。
探访唐家岭,反思“蚁族”

  唐家岭村口,和一般的乡村也差不多,但拱门上的标语既不是“欢迎来到”也不是“建设和谐”,而是强调该村是“全天候电子监控区域”,居民要“严格自律”、“注重行为规范”。这显然是写给外来人口看的,给人以压抑感。
探访唐家岭,反思“蚁族”

  村里最热闹的路段还是那一条唐家岭路,路边密集地排布着各种商店、餐馆、网吧、理发店、澡堂、诊所以及中介公司,一片繁荣景象。公共厕所也不少有当街的,臭味直冲对面的店铺。路过的房屋中介公司里都排着长队,门外有人把风,我没有敢拍照。
探访唐家岭,反思“蚁族”

  路边也见到几个综合治理办公室岗亭,周围有一些穿军大衣的人出没,不知道他们是不是所谓收“水费”的“治安员”。可惜我们来的不是时候,没有赶上收“水费”,没能收藏到传说中的“外来人口缴纳卫生费、水费凭证”。
探访唐家岭,反思“蚁族”

  繁华的唐家岭路背后,更多的则是像这样狭窄的无名小路。路面晴天是土雨天是泥,冬天还要小心高处落下的冰柱。小路两侧是二层以上的建筑,绝大多数都是面向外来人口的寄居场所。其中有较大规模的集体公寓,也有民房改建的、按间或按床位出租的出租屋。遍天的电线、电话线、网线也衬映了这里居民的文化构成。
探访唐家岭,反思“蚁族”

  村里最常见的广告当然是房屋招租了,从这种大广告牌,到院墙上随处可见的小广告。可见这早已成为唐家岭村的主要经济支柱,同时也让人慨叹一个农村的畸形流经发展模式。很多出租屋美其名曰“白领公寓”,也可见北京的高学历和白领职业早已泛滥,像 IT 民工这行当与普通外来务工人员的差异正在日益缩小。
探访唐家岭,反思“蚁族”

  这是一栋在建的小楼。尽管是寒冬,但整个村子里的建设氛围却没有受到影响。据说这里的很多建筑都是违章的,即使是合法的建筑,其质量也不敢恭维。估计当城市化的蔓延到唐家岭时,这些建筑的拆迁又会成为村民致富的另一条途径。
探访唐家岭,反思“蚁族”

  像这样的小楼,主体结构完成后外表不用装修,安装一个简易的金属楼梯就可以对外出租了。空调等设备也能够配备,当然需要租房者自行承担相应费用。10 平方米的单间算是奢侈,4 到 8 个人挤一间的床位房是刚刚毕业的大学生的经济选择。
探访唐家岭,反思“蚁族”

  这是一条水泥铺成的“自建路”,在我们走过的线路中是比较罕见的。墙上告示中一句“后果自负”显示出修路者那种“此路是我开”的霸气。在这条路的尽头,我们看到了几座民房。农具、大白菜、板车、看门狗,终于有了一些农村的生活气息。
探访唐家岭,反思“蚁族”

  在返回村口时,我们有幸遇到了中国政法大学法律援助中心和海淀区劳动争议调解中心在做劳动者维权方面的法律宣传。这又一次提醒我们,这里是北京城八区之一的海淀,还没有出“城”呢。政法大学的研究生们冒着寒风向过往的行人发放《劳动者维权实用手册》并接受群众的法律咨询,只是在我们路过的那阵子似乎没有多少人响应。
探访唐家岭,反思“蚁族”

  此外,村北气派的村委会大院、人满为患的唐家岭北公交车站也给我们留下了深刻的印象。但这两个地方把风的人都比较多,我也不方便拍照。也有人说只有走进那些出租屋看看,甚至住一两个月才能真正体会唐家岭外来人口的艰辛生活。我们这一次没有做此类计划,《蚁族》已经告诉我们了许多,下次有机会再和有相关经验的人去参观出租屋吧,地点可以在小月河之类。

  同样都是大学毕业生,我们的确比唐家岭的新知识青年们幸运一些。目前的体制和政策是有不当之处,需要决策者改进,但“蚁族”自身有没有深入地反思过自己的选择?“蚁”字赞扬了这一人群的高智商、锲而不舍精神和聚沙成塔的力量,但同时也反映了这一人群与社会性动物类似的特点——群体行为。陷入“蚁族”的生活究竟是真的无奈还是一种被动的跟风?除了做“蚁族”真的没有别的选择了吗?都说高中教育磨灭个性,把所有学生塑造成了同一个样子,那么大学教育呢?也许只是有限的 N 个样子吧!“蚁族”们在公司里要装扮得体体面面,对家乡父老要表现出事业有成,自己却要忍受着经济压力苟且偷生。原本是奋斗者的心态,在群体行为的高压同化下变得麻木并盲目了。就业和住房的压力,政府是有责任,但其中有多少比例是自己给自己强加,甚至是自己给社会输出的呢?中国不仅仅是由北京、上海等几个大城市构成的,IT 业也并非只能在中关村、张江等地方发展,更不用说那些高学历人群从事的低起点行业了。当然,选择的权利始终在你自己手里,但不要忘记了,你还有思考的权利,不要让群体思维覆盖了自己的思维。

  而对于暂时还没有遇到生活压力的我们——身在福中要知福。

铁人与油城

2009/07/24 | 13:09 | 分类:生活空间 | 标签: | 412次阅读

  组织上提供今年主旋律影片《铁人》的团体票,我领了一张去看。理由挺简单:我来自铁人王进喜的出生地——油城玉门。
  首先注意我说的这两个词:“来自”、“出生地”。王铁人和我的祖籍都不在玉门,祖辈的迁移使得玉门成为我们的出生地。我在提到玉门时常使用“家乡”一词,不过我不知道当年的王铁人是否愿意接受“家乡”的提法,故在这里仅使用客观一点的表达。从玉门走出来的人,祖籍、出生地、家庭居住地和户口所在地各不相同的情况很普遍,历史上的支援会战、政企改制,近年来的政府西迁、企业东移等都是原因。在这方面,《铁人》中有一个细节表现得很正确:王铁人从玉门拉来的钻井队伍讲着各地的方言——这是那个时代的情形,现在玉门的新一代都讲着稍稍带点兰银官话口音的普通话,与河西其它县市明显的方言格格不入。大学时听一位台湾客人讲起台湾本省人、外省人和原住民问题时,我突然想到玉门的人口构成也是大致如此的,只是我们比他们和谐得多。
  《铁人》中的当代石油工人刘思成确实引起了同样作为油田子弟的我的共鸣。他所谓的沙漠综合症本质上到底是什么?现在的像刘思成和赵一林那样的油田子弟各有多少比例?他们都显式或隐式地承担着怎样的历史包袱和社会压力?在中石油光环笼罩之下的普通石油人家的真实生活又与外界的描述有多少差别?要让我回答这些问题,我可能会给出过于特例的答案,但从日渐衰落的工业城市、政企纠结的社会体制和计划经济的残余阳光中走出来的人,或多或少都会有一些共性的生活经历和思维模式。特别是当你来自西部地区,家庭人均收入是当地非石油家庭的两倍以上,却还不及东部二三线城市职工收入的二分之一时,心情应当是复杂的。的确,在基本生活成本也相应偏低的西部,“石油鬼子”确实是当地的小康阶层,可是看看什么大学学费、数码产品、机票车票之类的,从来不会有太多的区域性照顾。
  王进喜工作过的两座油城:玉门——已经正式被认定为资源枯竭城市并在这几年基本上完成了人口搬迁,大庆——也在资源即将枯竭时计划着工业和城市的转型。不知道王铁人这位老前辈有没有想过解决“贫油”之后还要解决油城转型的民生问题,甚至更为可怕的国家无油可采的战略问题。当然我们不能因此责备他,因为时代背景和国际环境已经有了很大的变化。但不能变的,是王铁人那种对国家利益高度负责的态度。

对“为人民计算”的几点思考

2009/06/30 | 23:30 | 分类:计算机科学与编程 | 标签: | 751次阅读

对“为人民计算”的几点思考

(本文为本人“先进计算机和软件技术系列讲座”课程作业)

 
  “为人民计算”(Computing for the Masses)是近年来计算机科学技术和产业发展的目标之一。而究竟什么是“为人民计算”,出于国情、技术水平和个人认识的差异,不少学者提出过不同的理解。我国人口众多,农村人口占56%(国家统计局2007年10月数据),城乡经济和区域发展尚不协调,正处于信息化带动工业化的发展时期。在这种历史条件下,如何使得信息化的成果真正惠及人民,实现计算机行业所谓“普惠计算”的目标,是业界出于其社会责任感有必要思考的一个问题。针对我的导师徐志伟研究员在“为人民计算”方面的提出的一些观点,我浅谈一下我对几个相关问题的思考。
对“为人民计算”的几点思考
 
  消费动机不在信息化本身
  在受益于信息化且面向大众服务的行业当中,近几年来增长较为显著的是移动通信产业。中国的移动电话用户数量由1999年底的4330万户发展到2009年中期的6.87亿户。城市手机用户已经趋于饱和,但运营商对农村移动通信市场仍有信心。移动通信之所以得到了市场的认可,与其明确的消费目的息息相关。绝大多数消费者购买手机,其基本动机就是为了享受通信的便利;对于相当一些职业的人士,实时的通信可能已经不是“方便”而是“必须”。对于农村新市场的开拓,其难点可能在经济方面,而不在于人民对手机的基本功能和作用的认知。类似的案例还有银行卡。截至2009年6月,全国累计发行银行卡18.88亿张,银行卡的主要用户也分布在城市,农村和欠发达地区受制于经济条件和消费意识,对银行卡产品也许有所误解,但这不能说明银行卡本身的定位有问题,至少它们的功能是相对单一和明确的,满足了人民群众的特定需求。
  然而,计算机与网络技术对人民大众来说,其直接的消费目的性并不如移动通信、银行卡那样显而易见。在目前阶段,计算机与网络更多地扮演着工具和桥梁的角色。购买计算机、接入互联网,并不能直接解决什么具体问题,计算机和网络解决的问题是通过运行在其上的应用体现出来的。“上网”、“获得信息”、“学习”都是一些相对抽象的动机,不能直接满足低端用户具体一项生活需求。因此在商业化推广中,这些空虚的目标可能不会对低端消费者产生太大的吸引力。即便通过财政支持来发展信息化,这些成果也很可能沦落为地方政绩的象征或闲人娱乐的工具,对生产生活不会有实质的影响。要在2040年建成惠及至少12亿人的信息化社会,我认为不能把民用计算机、网络定位为移动通信那种具有明显消费目的性的产品,而必须改变现有中低端计算机和网络相关产品或服务的社会定位,在应用层面寻找“为人民计算”的突破口。
  信息化被作为工具的现状令很多从业者,特别是计算机科学研究人员不满:业界不愿意让信息技术变成像楼宇保洁一样必不可少但几乎不能创造价值的服务业,学界不也甘心计算机科学停滞不前,最终被其它学科以工具和技术的名义吞并。上世纪末本世纪初,网格计算的理念曾十分风行,研究人员力图建立一种像电网一样即插即得的信息基础设施,但至今网格技术只在部分专业研究领域发挥了功效,而那种惠及全民的“Great Glocal Grid”还未见雏形。其中主要的原因,我认为是信息资源缺乏像电力资源那样的同质性,抛开技术层面的因素,难以同质化的信息本身就使得潜在的用户无法建立明确的消费动机。但信息的同质化正是一个值得研究的科学问题,这个问题的解决,将使得计算机、网络由独立的工具进化为信息基础设施的地位。我们需要这样的基础设施在社会的后台像电网一样默默无闻地“为人民计算”,而用来明确消费动机、创造商业价值、进而构建信息社会的,不是计算机和网络的实体,而是这一基础设施之上的、像家用电器一样的、但目前尚未被发明的具体应用。
 
  比“脱贫”更难的是“第二跳”
  目前我国大多数人口仍处于“信息贫困线”以下,“脱贫”是产业界、学术界和决策层正在着力解决的问题。“脱贫”的方向相对明确。对于产业界,主要需要考虑机器生产和网络运营的成本,让计算机和网络对所有人来说由奢侈品变成日用品;对于学术界,需要摒弃一味追求性能的老路,从功耗、易用性等贴近用户的角度考虑体系结构的设计;决策层则需要提供政策扶持,对相关产业采取优惠措施,对人民群众加以合理引导。但我认为有可能出现困难的,并不在于“脱贫”的“第一跳”,而在于由基本价值向商品价值提升的“第二跳”。
  还是以银行卡为例,我国银行卡发行数量虽然已经超过人口总量,但真正用卡的人群并不大,相当一部分银行卡是通过任务摊派的方式进入低端市场的,这些卡大都成了没有任何交易记录的“死卡”。即使是使用银行卡的人,他们中的多数也只享受了其商品价值,把它当作一张可以自助取款的存折,从未使用甚至从未听说过银行卡所关联的高级金融服务。
  纵观我国计算机网络用户,其层次分化较为明显。IT界的精英人士、具有探索精神的专业人士早已享受到了信息产业的泛在价值、专业价值乃至个性价值,他们甚至可以在软件开发商与网络运营商尚未提供相关服务的情况下发扬自主创新的DIY精神,主动地让信息化为自己创造价值。而目前数目最庞大的用户群是将计算机、网络作为工具的人群,他们虽然享受了信息化带来的基本价值和商品价值,但只是在工作和生活中为了特定的目的有意去使用计算机和网络,计算机和网络更多地作为间接、高效实现传统生产模式价值的途径,而不是直接为这些用户提供新的价值。在农村和欠发达地区也有一定数量的计算机、网络用户,网吧是他们接触信息化成果的主要场所。这些用户缺乏自主探索的意识,他们通常使用仅仅使用网吧预置的网站、软件与游戏。即使是这些地区的一些官员,对信息产业的理解也有可能过于狭隘,甚至可能因为未成年人沉迷网游等问题对计算机、网络建立负面的印象,进而抵制信息化进程。然而要达到“普惠计算”的目标,必须把这类人群作为未来市场的潜在用户。目前我国的信息化还没有像工业化那样彻底地改变大多数人的生活方式;在相当一部分地区,工业化的成果甚至还没有全面应用到生产中,在这些地区谈信息化的价值,确实不容易为当地政府和人民大众所接受。单纯的基础设施建设所带来的基本价值就像提供给毫无养殖经验的农户的良种牲畜,他们只能一吃了之,不懂得通过繁殖子代、获取副产品来增值。既然信息化带动工业化已经是中国特色的跨越式发展模式,我们就应该在“脱贫”的同时完成“第二跳”的工作,提供一系列能够直接服务于生产、生活的应用。只有完成“第二跳”,信息化才不再是软硬件堆叠的花架子,其价值才能使个人用户受益。如何让人民群众真正从“为人民计算”中得到实惠,让计算机科学的成果成为人民群众喜闻乐见的事物,而不是像银行卡市场那样徒有虚名,这才是比信息“脱贫”更重要的任务。
 
  对“计算透镜”半保守半超前的认识
  Richard M. Karp提出的“计算透镜”(Computational Lens)理念被认为是未来二十年计算机科学可能的发展方向之一。其核心理念是将计算作为一种通用的思维方式,通过这种广义的计算(涉及信息、执行算法、关注复杂度)来描述各类自然过程和社会过程,从而解决各个学科的问题。Karp给出了计算透镜理论在生物科学中的成功应用。这一理论试图将计算机科学由最初的数值计算工具、仿真与可视化技术以及后来基于网络、面向多学科的e-Science平台,变成普遍适用于自然和社会领域的通用思维模式。从这一点上看,计算透镜的思路也似乎是要将计算机从传统的“为军事计算”、“为科学计算”、“为商业计算”过渡到“为人民计算”、“为人类计算”,只是这一思维工具并不一定直接为人民所使用,而是要借助学界和业界之手将计算透镜带来的好处通过生产力的发展来施惠与人。
  世界真的可以用计算过程来表达吗?在初次接触到计算透镜的概念时,我首先想到的是近代机械唯物主义的自然观,试图用力学和机械的观点来解释并分析自然与社会现象。进而联想到了人工智能发展史上的符号主义、连接主义和行为主义等学派的基本观点,它们都力图用一种简单的形式化模型来解释智慧和思维。计算透镜是不是在走这些老路呢?我个人感觉,在图灵机模型和现行的可计算性理论本身是否符合自然规律尚未被证实的前提下,不要指望计算透镜能在短期内给一般大众的工作和生活带来什么影响。但对计算透镜的研究是有意义的,其意义可能不在于用计算改造自然,而在于更好地认识自然,从而改造现有的计算模型,使之能够像一些自然过程一样高效。也许到那个时候,人、机、物界限因为思维方式的统一而变得模糊,“为人民计算”的理念演化为对人类思维能力的直接扩展,届时作为中介的信息化工具、应用可能反而变得不重要了。
  回到现实,这方面已经存在的一些问题需要引起我们的关注。计算透镜理论中包含“社会计算”。尽管社会计算的概念目前还没有精确的定义,无论是用计算机的方法研究社会还是用社会学的方法研究计算机,统统被一些机构打上了“社会计算”的标签。从“社会”二字可以看出,这一计算的执行也并非人民的个体可以完成的,要做到社会计算,仍需要掌握着社会数据和社会决策权的机构来完成。但在法治完善程度赶不上技术发展速度的情况下,如何保证社会计算的成果真正服务于民,成为“为人民计算”的理念与实践需要面对的一个重要的非技术问题。例如当前舆情计算技术的发展确实为政府机关提供了迅速准确的决策支持,但一些社会团体对舆情计算中的个人隐私保护问题仍存在争议,认为这对网民存在侵权。舆情计算技术还被某些搜索引擎公司或网络公关公司所利用,通过推送正面信息、屏蔽负面评价的方式从不法商家手中谋利,直接侵害了消费者的知情权,损害了市场的公平竞争。从这一点可以看出,“为人民计算”不是一两个新理论、新技术就可以实现的,它需要完善的法治框架、良好的业界环境,以及官、产、学、研各方对人民利益高度负责的态度。
 
  总之,我心中的“为人民计算”应该是由有价值的应用所导向的、带来明确消费动机的、架构在信息基础设施之上的信息化发展模式。它应该像电网和电器一样易用,让人民受益的同时却感觉不到信息基础设施的存在;它应该突破城乡与区域差异,惠及全民,为信息化带动工业化带来历史契机;它应该兼顾可用性、保密性与可控性,在具有社会负责感的机构的运营下真正代表人民群众的利益。
 
参考文献
[1] 徐志伟.为人民计算的三个问题.中国计算机学会通讯,2008(10).
[2] 江泽民.新时期我国信息技术产业的发展.上海交通大学学报,2008(10).
[3] 李国杰.创新求索录.电子工业出版社,2008.
[4] Richard M. Karp. Computer Science as a Lens on the Sciences. ICDCS 2008.

“kwpwf.dll”的问题不能归咎于绿坝

2009/06/11 | 16:54 | 分类:IT杂谈 | 标签: | 1,549次阅读

  “绿坝-花季护航”刚出来没几天,很多网友就对它展开了技术分析,其中不乏一些有趣的结论,较火的一条当属绿坝的密码保存方式:把密码的MD5值直接保存在“C:\WINDOWS\system32\kwpwf.dll”文件中。这被很多网站炒作成“致命漏洞”、“小学生发现的破解”。我相信绿坝这东西潜在的漏洞会有不少,真要推广的话恐怕会给互联网带来“暴风门”那样潜在的灾难。但仅就这个密码保存方式的问题,我想只能算是一个缺陷,并没有上升到所谓“致命漏洞”的地步。
  原因很简单,在Windows XP中只有管理员账户才有权限修改system32目录下的文件,普通账户只能查看。如果保持良好的系统使用习惯,让家长持有Windows管理员密码,只在安装软件等必要场合使用;小孩只能使用普通账户,可以查看kwpwf.dll却无法得知或修改原密码,这样就不会存在密码被轻易修改的问题。这与早期版本UNIX的passwd文件的机理是一致的,缺陷也基本一样:小孩可以通过cmd5.com之类的数据库做MD5反查,只要家长选择的是个弱口令,小孩就能查出原始密码。
  因此,这个问题不能归咎于绿坝,原因是小孩能够使用本来不该让他使用的管理员权限。其根源一在微软,二在品牌机厂商,三在用户。我认为Windows XP最大的败笔就在于默认账户具有管理员权限。微软当年这样设计,无非是想让Windows 9X的用户平滑地过渡到XP平台,然而却因此造成了病毒和流氓软件泛滥,同时为Vista(UAC)的推广埋下了隐患。品牌机厂商做操作系统的OEM时,本来可以针对用户的特点,默认建立普通账户,然后向用户警告管理员权限的重要性和危险性,但目前多数厂商也都没有在这一层把关,让知识储备不足的用户失去了培养良好使用习惯的机会。而用户是一方面是微软这是项决策的受害者,病毒泛滥就是一个例证;另一方面也需要反思自己有没有用好Windows既有的安全机制,用正确的使用方式、良好的使用习惯来保证系统、软件、文档的安全性及其访问控制。
  如果说绿坝有“致命漏洞”,我想不在于密码保存的机制,而有可能在于软件本身的访问控制机制及其实现。由于绿坝没有加壳,相信很快会有人分析出它是怎么实现对自身功能的访问控制的。密码保护会不会只是一个可以轻易绕过的幌子?内存中的密码或其MD5是否可以轻易被修改?从直观印象上猜测,这些都是有可能的。不过那些清高的crackers很可能不把绿坝这种小儿科的东西放在眼里,把它整明白的价值可能并不大。
  有关密码保存方式早已有不少成熟的模型,比如现代的Linux使用的带salt的crypt函数shadow文件,可以克服上述明文摘要的缺陷。Windows XP和NTFS的特性完全可以实现这一套,绿坝要想改进,不如直接模仿。访问控制模型也类似。但唯一的前提就是用户需要正确分配和使用不同权限的账户。如果所有用户都有管理员权限,没有什么不可以,除非绿坝完全学习流氓软件和那些用流氓方式保护自己的所谓安全工具的伎俩,来增加用户发现和修改密码的难度。这样就不是真正机制上的安全,只是实现上的以暴制暴。
  我相信绿坝不会带来太大的社会影响,因为各方都得到了各自想要的。只要它未来不变成Big Brother的telescreen,就会在短期内被人们遗忘,没几年也会被既得利益者抛弃。

页面存档: 上页 1 2 下页