陈堃銶,1936年6月出生于上海,北京大学王选计算机研究所教授。1953年进入北京大学数学力学系,毕业后留校任教。与王选一道从事我国 “汉字信息处理系统工程”(简称“748”工程)中“汉字激光照排系统”的研究,是该系统大型软件的总负责人。
挤进“748”
1974年,北京大学研制成6912计算机,校领导为了能使学校各部门采用计算机管理,于1975年初成立调查组。从调查中得知,国家有个“汉字信息处理系统工程”,是四机部、一机部、中国科学院、新华社、国家出版局联名于1974年8月向国家计委请示设立的,简称“748” 工程。该工程设三个子项目:汉字通信、汉字情报检索和汉字精密照排。
当时王选正在家休养,我与他谈及此事。王选被精密照排所吸引,此时他身体正在好转,但还不能上班,可以在家做些工作,于是他开始调研和设计。王选常拖着病体到科学院情报所查阅有关照排的资料,了解到字模的数字式存储是发展趋势,光学机械式的二代机没有前途,采用模拟存储方式的阴极射线管三代机也将被淘汰,他决定采用数字式存储汉字字模。
数字式存储是将汉字的字形以点阵形式存在计算机中,每个小点占计算机一位,一个小字(五号字)大约需要100×100点,大字则要1000×1000点以上。汉字的字数比西文的字母多数百倍,算上各种字体以及大小十几种字号,总的存储量达数百亿位,大大超出了当时计算机的容量。这是很大的难题,因此必须设计一种字形信息压缩的方法。为此,王选每天对着印刷品上的字思考,经过苦思冥想,几经修改,我配合他在6912计算机上试验,最终试验成功“轮廓加参数”的信息压缩方法,将横、竖、折笔画称为规则笔段,用笔画的长度、宽度、笔锋等参数表示;撇、捺、勾、点等为不规则笔段,用折线轮廓表示,此后又设计将压缩信息快速复原为点阵的算法。1975年11月底,我们完成了汉字字形信息压缩与快速而不失真的复原方案,并设计出紧凑的压缩信息格式,取得了完美的结果。我以黑、宋、仿、楷等字体和十几种字号点阵的总存储量与压缩后的存储量相比,压缩倍数达500多倍。
学校对国家任务很积极,我们将初步方案向学校汇报后,学校表示接“748”任务要干,接不成学校也要干。1976年10月底,北京市召开照排方案座谈会,我报告了字形点阵的压缩信息方案,并展示了用软件还原、打印机打出的“义”字,不少人很感兴趣,但北京市只支持二代机方案。
我在与王选设计压缩信息及还原算法的同时,开始设计书刊排版软件。我首先学习排版知识,调查各种书刊的排版格式,了解到国外流行贴毛条拼版方式,就是将文章排成长条,称为毛条。若是排书,将毛条按一页书的长度,依次剪开,再贴上每页的页码、书眉;若是排报,按每栏的高度剪开,一条一条拼贴。我决定跳过这种做法,直接设计整页组版的排版程序。1977年,我设计完成整个软件系统,包括排书刊的书版排版语言和排版软件,分时操作系统,将编辑、排版、发排等分解为多个命令的命令系统等,设计出实现框图,与组里及协作单位同志一起编写程序和调试。
陈堃銶与王选在家工作
为了决定压缩信息还原为字模点阵的实现途径,我编写软件在130主机上运行,发现速度太慢,平均每秒只能还原1个字。有软硬件两方面功底的王选决定用硬件实现。1976年9月起,他设计微程序用微处理器实现字模生成和形成版面。同年确定输出方案,王选得知用激光输出的四代机是发展方向,当时英国蒙纳公司正在研制四代机,尚未成为商品。后来听说邮电部522厂研制成功报纸传真机,他请教物理系光学老师后,知道可以将其改装为激光照排机,由此确定了用激光输出的四代机方案。
无心插柳柳成荫
“748”工程办公室设在四机部,由计算机局副局长郭平欣任主任。按照惯例,四机部已决定由部属单位负责总体设计,但该单位迟迟拿不出方案,郭平欣很着急,听说我们的工作后,几次派人来了解。1976年年初,他派人组织报告会,说是要与该单位“打擂台”。因王选身体尚未恢复,我在会上报告了方案,该单位没有报告,只对我们方案提了几个问题,王选和我一一作答。此时郭平欣已中意我们的方案,也许是为了好对四机部交代,1976年5月4日,他指定11个字,要我们在一个半月内用计算机将它们的压缩信息还原成点阵。于是,王选做每个字的压缩信息,我与同事一起编写将压缩信息还原为点阵的程序,6月9日调试完成。
6月11日,郭平欣等四机部人员、国家出版局、第一用户新华社以及人民日报社、光明日报社等媒体单位来观看文字生成表演并座谈,大家认为文字质量能满足出版要求,对信息压缩倍数予以肯定。这就使郭平欣下了决心。
因为北京市已确定了二代机方案的用户和研制单位,所以四机部要经北京市给我们下达任务费了些周折。直至9月8日,由副部长刘寅批准,精密照排任务才下达给北京大学。后来郭平欣说:“有心栽花花不开,无心插柳柳成荫。”可见我们是挤进去的。
北京大学对这一工作很重视,1975年就从各系抽调人员,数力系、无线电系、中文系都派教员分别参加软硬件和字模制作,但抽调计算机教员十分困难。由于王选患病,我也经常病休,有关单位不相信我们能承担项目,不愿派人。直到1976年3月,会战组正式成立,由张龙翔任组长。在校党委黄辛白同志和校长周培源的关心下,队伍逐步充实。
1977年8月,学校批准成立了“北京大学汉字信息处理技术研究室”,还将旧图书馆(现为档案馆)一层作为科研用房。从此我们的工作走上正轨。1983年,研究室与计算中心等单位组成北大计算机科学技术研究所,1985年后计算中心等撤出,研究所中只有我们研究室,王选任所长。
陈堃銶和王选在家中讨论技术问题,一起分享科研成功带来的喜悦
同时,在四机部“748”工程办公室的领导下,逐步落实了协作单位,包括:生产主机和王选设计的照排控制器的潍坊计算机厂、生产终端输入设备的无锡计算机厂、生产照排机的邮电部522厂、生产汉字输入键盘的天津红星厂等。第一用户新华社派技术人员参加软硬件设计,并承担了部分字模制作。至此开始了跨部门大协作。
在困难中前行
许多人对我们的方案极不信任,印刷出版界尤为普遍,对于用数字化字模,有人说:“这是小助教在玩弄骗人的数学游戏!”“简直是天方夜谭!”直到1988年,还有公司向潜在用户和业内人士发了几百封信,说北大系统使中国拉大了与西方国家的差距,从而至少落后了十年。因此,王选说:“我们在骂声中成长!”
有的人只主张引进,他们说:“是北大系统干扰了引进!”1979年引进英国蒙纳系统,由于该系统不完善及国家的干预,风波暂时得以平息。1984年,美、英、日等国的产品纷纷来中国进行展示。随后有六家大报社和几十家出版社、印刷厂进口了国外系统,还有多家单位要求与国外合作。
“文化大革命”结束后,学校走向正轨,张世龙为组建计算机系召回计算技术教员;同时,国家为了加快发展科学技术,组织教师作为访问学者出国进修,这很有吸引力。我们这里工作条件差,调试工作琐碎而繁重,还不可能出去,因此人心浮动,逐渐有一批教员离去,王选的硬件组只剩两个教员。
1979年原理性样机开始连调,由于国产元器件很不可靠,调试时所有设备此起彼伏地出现故障,原定于1979年7月1日输出一张考验硬件的报版样张,直到27日才输出成功。调试由14万行汇编语言编写成的软件更加困难,没有显示器,用纸带输入,调试结果看不到汉字,打出的是字符的编码和坐标,分析后才能知道对错。最苦的还是硬件不可靠,主机、纸带输入、打印机和照排控制机故障率很高,往往费了半天劲,仍得不出结果,其艰难程度在今天难以想象。
柳暗花明
经过千辛万苦,我们终于在1980年9月15日上午排出了讲述周总理当年惩治叛徒的小说《伍豪之剑》。周培源把书送给副总理方毅,并请他送给各位政治局委员。方毅同志于1980年10月20日在随书附上的我们的信上写了一段热情洋溢的话:“这是可喜的成就,印刷术从火与铅的时代过渡到计算机与激光的时代,建议予以支持,请邓副主席批示。”邓小平同志于1980年10月25日作了“应加支持”的批示。此时正逢改革开放,国家给了我们20万美金。于是1981年我们购买了国外的硬件设备,科研条件得到很大改善。
1981年进口了NOVA计算机作为主机,照排控制器等全部换代,组成新一代的Ⅱ型系统。我培训大家熟悉新机器,设计软件换代。正在此时我患了直肠癌,只得在交代完换代工作后住院治疗。幸而癌细胞没有扩散,但从此给我带来难以想象的麻烦。
1979年,王选开始设计Ⅱ型系统(名为“华光”)的照排控制器,用国外最新芯片替代国产组件,设计了世界首创的用普通纸出大样,增加了长春光机所的转镜式照排机。
因为NOVA机与130机指令系统相同,软件改动不大,只需要为实用性做充分考验。我主持新系统联调,并设计一些复杂版面作实用性考验。手术后我身体虚弱,夏天在空调机房里待两小时,就会腹泻三四天。为保证每个字模正确,需要手工将错字的压缩信息还原,再在坐标纸上画出后查找原因,为此王选费了很多精力。
1985年1月,系统交新华社使用,整页排出8开中文报纸——新华社内部旬报《前进报》和14万字的日刊《新华社新闻稿》。使用中照排机故障最多,抖动、漏光甚至不能工作,还有变字、丢字、缺字模,还因使用不当造成了事故,问题层出不穷,而随机性的变字更令人费解,我们在忐忑不安中度过那年的春节。
陈堃銶与王选在查看报纸胶片
此时国家设立了印刷专项,成立了印刷技术装备协调小组,由原经委机械工业调整办公室主任范慕韩任组长,经委机电局沈忠康为副组长兼办公室主任。项目逐步从四机部过渡到由协调小组总管。在他们的协调下,各参加单位协作攻关,一一解决问题。
日报系统日益完善
1.险遭“毙命”的Ⅲ型系统
为方便使用,需使系统小型化,但改用微机尚需时日,所以在1984年,王选决定用指令系统与130机相同的台式机DESKTOP为主机,这就是过渡性的Ⅲ型系统。
提供给大报使用,是王选坚定不移的目标。因为只有经得起日报的考验,系统才算成功。而科技书籍的排版在当时效率极低,出版社亟须高效率的排版软件。所以,我们决定在Ⅲ型系统上开发排报纸的报版软件和排科技书刊的科技版软件。
潍坊厂科研人员积极性很高,他们率先开发报版软件,其间我多次与他们讨论方案,并解决疑难问题。我们承担排数学、化学等科技公式的科技书版,我还设计了用以插入其他软件排版结果的结构,以便插入图形等,使软件功能更强,使用更方便。1986年年底,科技版软件与Ⅲ型系统一起通过部级鉴定。
1985年,经济日报社看到新华社成功使用激光照排,决定购买Ⅲ型系统。1987年4月开始试用,5月22日排了全部四个版面。但软件问题很多,有时出现严重错误,甚至延误出报,大样机和照排机也不稳定。报社每天接到读者投诉,不得不多次登报道歉。为此,报社领导警告:“十天内解决不了,退回到铅排!”如果退回,意味着系统很难用于日报,也就是系统失败。在生死攸关之际,大家只有加倍努力,终于使系统逐渐稳定。
潍坊的软件终究存有隐患,后来还出现过重大事故,所以在1987年年初,我们安排肖建国等重做,他们不负众望,很快取得成功,1988年12月在《深圳特区报》开始使用。
1988年7月,经济日报社印刷厂卖掉了全部铅字,1988年下半年换装了Ⅳ型系统。
2.里程碑式的Ⅳ型系统
在紧张备战新华社的同时,王选开始设计Ⅳ型系统,主机改用PC机。为使汉字复原速度加快、功能加强,他设计了两块专用芯片用于照排控制器中,使文字复原达到710字/秒,并有图形图像处理功能,还实现了勾边字、倾斜字、旋转字、立体字、空心字等铅排无法做到的文字变化功能。
软件必须重新设计,我修改、扩充了排版语言,并修改输出结果的数据结构,形成了后来用于远传的版面描述语言BDPDL。我与学生一起设计书版排版软件,并承担核心部分。除了保留Ⅲ型系统的全部性能外,我设计了排字典时自动抽取词条作书眉、自动形成目录,以及排长表格时自动拆页并保留表头到下一页等功能,很受用户欢迎。此时,肖建国等设计的报版排版软件已十分稳定,并配备了竖式显示器,使报纸版面显示更加逼真。
陈堃銶与王选
1988年年底,Ⅳ型系统开始在新闻出版、印刷业推广普及,由于其性能优良、系统稳定、价格低廉,很快在全国推广开来,成为国产激光照排系统诞生以来大规模推广的里程碑。
开创汉字印刷的崭新时代
1988年,北大在时任校长丁石孙支持下,成立了新技术公司。年初经经委同意,新技术公司开始生产Ⅳ型系统。
1990年,北大的系统以“方正”命名,公司也改名为“方正”。1991年起,王选又设计了方正91和方正93等第五、六代性能更加优越的系统。
为了彻底改造出版印刷行业的技术,继告别铅与火后,王选率领年轻一代又实现了四次告别。
第一,告别报纸传真机。用卫星传输版面描述语言替代报纸传真机,信息量约为传真方式的1/50,且毫不失真。1990年9月首先在《人民日报》使用。
第二,告别电子分色机。研制彩色出版系统,在世界上首次实现彩色图片和中文的合一处理和输出。1992年1月首先在《澳门日报》使用。
第三,告别纸和笔。研制新闻采编流程计算机管理系统,记者的稿件快速传入报社,编辑在计算机上直接组版,1994年1月《深圳晚报》首家采用。
第四,告别照排软片。研制直接制版系统,将版面直接输出在印刷版材上,1998年在羊城晚报社的《新快报》投入使用。
1985年,人民日报社以429万美元订购美国HTS公司的照排设备,调试三年还不能使用。1988年他们想来买“华光”,王选感到花国家外汇买来的设备应该尽量利用,决定对它进行改造。1989年3月,人民日报社与北大签署了技术改造协议,4个月后改造成功投入使用,同年年底美国HTS公司宣布破产。
1993年,香港《明报》进行国际招标,方正93系统技压群芳,最终获胜,从此在海外大量推广,占据了90%的华文报业市场,外国公司难与匹敌,全部退出中国。同年,香港《大公报》以专文报道海外采用方正系统的盛况。文中写道:“国外许多电脑公司已先后宣布:在汉字电子激光照排领域,我们放弃与中国人竞争。”
20世纪90年代末,以年轻一代为骨干研发的第七、八代出版系统已出口美、英、法、德、加拿大等几十个国家和地区。