诚然,无论步枪还是手枪,用得惯就是好枪。但是,如果我们都这么想,那么这个世界上将永远不会出现机枪,进而也就不会出现坦克。五笔字型输入法,也就是王码,是目前市面上最流行的形码输入法,毫不夸张地说:是五笔字型让中国人在信息高速公路上“提速”,五笔的流行程序,绝对称得上是一个“王朝”。在此,作为一个五笔字型的使用者,我向他的发明人——王永民先生——致敬!同时也向无数为五笔字型发展而默默奉献的人们——致敬!我想说的是:五笔是伟大的!
五笔虽然伟大,但并不代表它没有缺陷。而且,有些缺陷是它的硬伤。作为一个长年使用五笔的人,今天我就要说一说这些缺陷。
一、字根的排布不科学
有两个体现:
1.字根的排布是按照起笔和次笔的组合来排布的,目的是为了“好记”而非“速度”。为了好记,这本无可非议,但这样排布是不是符合字根的使用概率分布,是不是符合人的反应心理和人体工学便无从考证了。不过,我估计不符合:因为老祖宗造字的时候还没有把王码的创造提到议事日程上来,所以没有考虑起笔与次笔的问题。
2.据王永民先生自己描述,五笔字型的字根是用纸卡片在住的旅馆里没日没夜拼出来的——这个故事被人们传为佳话。而我要说的是——精神可嘉,技术未必可取!这绝对不怪王先生,因为他那个时代,计算机已经与“神器”差不多级别了,所以只能这样做。而今天呢?不但计算机垂手可得,就连强大的搜索技术,老百姓都可以免费使用;Google,Baidu也纷纷开放了他们的Web API,供程序员使用——这样,我们就有了更加大、更准确、更科学的分析工具。所以,也就有了本文的标题:生产工具更新了,生产力理应提高。如果古埃及人告诉:“金字塔是用石锤石斧造出来的”那是值得自豪的,如果空客公司告诉你,他们的A-380是用石锤石斧造出来的——My god,我宁可游泳去美国出差。
就个人看法,这一点是最严重的问题。举个例子:王字旁就一定要放在G键上吗?为什么?有没有统计学上的论证呢?青头一定要与王放在一起吗?就因为“长的像”?很多很多问题,在过去是不可能解决的,而现在工具先进了,就应该得到解决,不能固步自封,不再发展。
二、字根设置不科学
这一点是所有形码设计者都头疼的事情。特别是一用“面向教育,不能让孩子们学写错字”,就更加头疼。但我要说的还不是关于教育的问题,抛开教育问题不谈,五笔的很多字根本身就有问题。一个字根为什么要这样拆?这样拆出来的字根在汉字中的使用率是多少?单字的使用率是多少?双字词,三字词,多字词中的使用率又是多少呢?
三、简码的设置不科学
有些字,本身是常与其它汉字组成词来使用的,就没必要设成简码,而把简码的码位让给独立使用概率更大的汉字。还有就是一个字到底应该是二级简码还是三级简码,这都应该有统计的依据,不能想怎么搞就怎么搞。
四、字与词的冲突问题
五笔是一种字词混输的输入法,而且用五笔久了的人都知道,真正打的快的人是因为掌握的词组多,而且个性化词库要好。但五笔(无论是86版还是98版)在创作的时候,都过分地强调了“重码率”如何如何低。这就有两个不科学的地方。1,谁也不是要用五笔把所有汉字都打一遍,所以没有必要过分强调单字的重码率。2,常用字与词的重码率更高,在这里下下功夫,才能提高输入法的质量,我的一个建议就是:如果在编码上实在无法突破,至少我们可以在软件上下下功夫,让我们IME软件“智能”一点,根据上下文来判断一下到底是字优先还是词优先……而要确定这些,我们都离不开汉字使用的数据统计——基于搜索技术。
搜索时代到了,五笔——何去何从?
谁,将是终结五笔时代的英雄?