是他,让汉字走进计算机丨科学史小画

500

古老的汉字一脉相承,记录、传承、传播了绵延数千年的中华文明,然而进入20世纪后,计算机的飞速发展使汉字面临着险些被信息化时代抛弃的局面。40多年前,一位科学家带领团队,发明了“汉字信息处理与激光照排系统”,使汉字印刷在信息时代走出困境、重焕光彩。这个人,就是王选。

上世纪70年代,我国采用的仍是“以火熔铅、以铅铸字”的铅字排版印刷,在印刷厂车间里,铸字师傅们要站在上百度高温的铸字台前工作,忍受炙烤、机器噪音以及有毒金属铅的污染。拣字工人们则在一排排高大的字架间来回穿梭,左手拿字盘和稿件,右手则不停地在字架上挑出所需要的铅字。一个熟练工人每天要来来回回走上十几里路,双手总会因捡字而变得漆黑。为了改变印刷业的落后状况,我国在1974年8月设立了“汉字信息处理系统工程”,即“748工程”。王选当即被这个项目吸引,以极大的激情投入其中。

当时我国已有五家科研团队从事汉字照排系统研究,在汉字信息存储方面采取的都是模拟存储的方式,输出方案选择的则是国际流行的二代机或三代机。王选经过反复比较研究,大胆做出决策:模拟存储没有前途,应采用“数字存储”的方式将汉字信息存储在计算机内。他决定跨过当时流行的二代机和三代机,直接研制世界上尚无商品的第四代激光照排系统。

印刷界认为这个想法是天方夜谭,王选也遭到了许多冷嘲热讽。但他并没有理会外界的风言风语,把全部的精力放在中外科学家都没能解决的难关上来——如何让印刷体的汉字进入计算机。然而,汉字光常用字就有几千个,还有20多种大小不同的字号,如果全部用数字存储方式进计算机,信息量高达几百亿甚至上千亿字节,即数千兆。当时国际上的计算机存储量只有几十兆,根本无法容纳。

怎样用最少的信息描述汉字的笔画呢?王选冥思苦想,大胆创新,发明了“轮廓加参数”的数学方法来描述字形。这一方法可使汉字字形信息量压缩500倍至1000倍,并实现变倍复原时的高速和高保真。如此一来,汉字字形信息的计算机存储和复原的难题被攻克,“参数信息来控制字形变化时的质量”这一高招获得了我国首个欧洲专利。

此后,王选又发明了“高速不失真的汉字字形信息复原技术”,被压缩的汉字字形信息以710字/秒的速度高速复原。以此为基础,王选设计了汉字激光照排系统的核心——照排控制器,由它生成汉字字形信息并控制激光照排机发射激光,在胶片或印刷版材上感光成字,然后制版印刷。

1979年7月27日,王选用汉字激光照排系统输出了一张八开报纸样张,标志着汉字信息处理技术获得了重大突破。1980年9月15日又成功地排出了第一本样书《伍豪之剑》。1981年,汉字激光照原理性样机通过了部级鉴定。但王选并没有就此止步,他要把这项技术商品化,大量推广应用。

经历了漫长的技术攻关过程,王选团队终于在1984年成功研制出华光Ⅱ型系统。1985年5月8日,“华光Ⅱ型计算机—激光汉字编辑排版系统”通过国家经委主持的国家级鉴定,成为我国第一个实用照排系统。我国的印刷术从此告别铅与火,迎接光与电的时代。王选领导科研团队研制出的汉字激光照排系统为中国新闻、出版全过程的计算机化奠定了基础,被誉为“汉字印刷术的第二次革命”。

作者:吴晓斌,系中国科学院大学人文学院科学史系博士生

来源:中国科学院大学

全部专栏