王选语录

科学研究本身就是一种美,给人带来的愉快是最大的报酬,是一种高级享受。献身科学就没有权利再像普通人那么样生活,必然会失掉常人所能享受的不少乐趣,但也会得到常人享受不到的很多乐趣。

一个好的科学家或企业家首先应该是一个好人,才能带领队伍。什么叫好人?季羡林先生曾说过,考虑别人比考虑自己更多就是好人。这一标准我觉得可以再降低一点:考虑别人与考虑自己一样多就是好人。

我的座右铭是:“多做好事,少做错事,不做坏事”。

中国古代有句话,上士忘名,将名利彻底淡忘;中士立名,靠自己的成就把名立起来;下士窃名,自己不行就窃取人家的。我做不到上士,但是我不会为了立名而去窃名。

更多>>
 
回忆激光照排
理性样机的启迪:需求刺激创新

——激光照排系统研制回忆之三

激光照排系统原理性样机是1975年开始研制的,在闭关锁国的环境下不得不全部采用国产设备和国产元器件,可以说,设计时没有一个元件和设备是进口的。存储器用磁心,最大容量64KB;没有磁盘,只有一个512KB的磁鼓和一条磁带;集成电路则是小规模的,一片内最多含两个D触发器。上述主存和外设相当于美国50年代末水平,集成电路则相当于美国1964年水平。输出设备是邮电部山西侯马的研究所70年代初研制的滚筒式宽幅面报纸传真机,是按60年代松下传真机仿制的。虽然是手工上下片,但扫描精度高,因为滚筒式扫描容易保证主扫描精度和行对齐精度,而匀速前进(而不是走走停停)的丝杠又容易保证副扫描精度,从而使60年代的松下滚动传真机的精度可与70年代末的Monotype平面转镜式照排机相媲美;当然,前者若要增加自动上下片,机械结构就较复杂,而后者输片机构简单,还能做到走走停停。如上所述,原理性样机的高精度输出设备相当于60年代中期国际先进水平。这样就提出了一个有趣的问题: 假如60年代我们就能利用国外最先进的硬件条件,我们能否于60年代中后期就研制出先进的激光照排系统呢?我认为完全可能,因为汉字字数多的特点使我们比美国人和欧洲人更早得到十分宝贵的需求刺激。

1958年美国已有32K×48位的磁心存储器;英国较穷,只能搞8K×48位的磁心存储器,而多道程序的需求迫使英国人最早提出虚拟存储器的概念。汉字字数多、字形信息量大,滚筒照排机不能走走停停,64KB内存、512KB磁鼓和没有磁盘、小规模集成电路等这些十分苛刻的条件,迫使我们做出了一系列的创新。原理性样机的设计和调试是我一生中从事的难度最大、挑战最多和最富有创造性的工作,有些设计算得上“首创”。可惜的是我们在70年代中期用了国际60年代初期的硬件条件,从而使很多这类所谓的“首创”性工作变得毫无价值;当然还有一部分首创性工作具有较长远的意义,在后来的商品系统中保留了下来。下面将具体分析需求是如何刺激创新的。

汉字字形的轮廓加参数描述

60年代初日本就研制电脑照排机,70年代初期日本电气公司NEC和京都大学合作开始研制基于第三代阴极射线管照排机的系统。由于采用数字化存储,日本同行也受到了汉字字形信息量大的需求刺激,NEC方案采用字形信息压缩技术,把汉字看成由基本部件构成,系统中存有几百个基本部件,每个基本部件用折线轮廓表示,然后由基本部件拼出汉字,例如“新”字,由“立”、“木”、“斤”三个基本部件经放大、缩小、拉长、压扁处理后拼成。1975年NEC曾来京介绍过这一系统,但因产生的汉字质量差,中、日两国印刷界均不接受,系统未投入实用而夭折,但这毕竟是首次采用部件组字的信息压缩技术和折线轮廓描述来解决汉字精密照排难题的尝试。

1975年我们采用参数描述宋、仿宋、黑体等字体的横、竖、折笔画的出发点是为了提高信息压缩倍数和变倍后的文字质量。统计表明,横、竖、折占笔画总数近一半,使我们感到压缩的油水较大。当时希望在排一本《毛泽东选集》或一本《红楼梦》的过程中,照排机可以连续输出而不必再启动磁带,因此512KB磁鼓上必须放下一本《毛泽东选集》中全部用字。根据统计,考虑了不同字体(但不考虑字号)后,一本书一般不会超过5000字头,这样就要求一个宋、黑、仿宋体的汉字字形经轮廓加参数描述后平均为100字节,这是当时必须达到的指标,而只有横、竖、折笔画的参数描述才有可能满足此要求。轮廓加参数的描述方法虽然总体压缩倍数不如NEC,但保证了汉字质量,而这是印刷界最关心的。

80年代中期以前美国流行的是第三代阴极射线管照排机,依靠瞬时改变光点直径和扫描步长,一种点阵可以代表很多种字号,加上西文字母数量少,采用黑白段描述方法时,信息量问题并不突出。80年代中期激光照排开始流行,西文字体已达上千套,字形存储量问题也变得尖锐起来,使轮廓描述逐步流行,而且发展到了三次曲线轮廓,但毕竟美国人比中国人晚了很多年才得到了这一宝贵的需求刺激。

用参数信息控制变倍后的文字质量

汉字笔画多,尤其是横道很多,例如“量”字中有九道横,在字形变小时如何保证横的一致和匀称是很重要的问题;竖也有类似问题,但竖一般比横粗,数量相对少一点。黑白段、点阵和单纯的轮廓描述都无法避免同样宽度的两道横当字形变小后会宽度不一样。在1500 DPI的照排机上,这一细小差别对文字质量丝毫不影响;在1016 DPI的Monotype照排机上,这一问题也不很突出,但当光强较弱或光点直径较小时,会出现某些横道断笔的现象;我们1975年选择的照排分辨率为742 DPI,若不加控制,应该一样粗的横道变倍后不一样宽,明显影响了文字质量。1975年我们用参数这一附加信息来描述横宽、竖宽,并保证本来一样宽的横或竖变倍后仍维持相同的宽度,使742 DPI下的小字仍旧美观匀称。300 DPI的激光打印机是1985年才开始大量流行的,在300 DPI分辨率下,上述参数描述作用极为明显。80年代和90年代初,只要一看激光打印机的输出纸样,我就能断定该系统是否用了我们的技术。因为不采用附加信息描述,有些字的某些横道会莫名其妙地比邻近横道粗出许多或细出不少,十分难看。

西文字母笔画少,在高分辨率照排时不必用附加信息控制敏感部分变倍后的质量,但300 DPI激光打印机输出时,用“提示信息”(HINT)描述宽度、间距以及需要保证对称的敏感部分变得很有好处,我们1975年的参数描述就是后来80年代末西方广为流行的“提示信息”(HINT)的一种初步形式。1991年10月我在美国波士顿文字处理国际会议上报告了我们1975年提出的这种参数描述,事后会议主席Robert Morris教授说: “汉字笔画的高密度使中国人更早采用控制变倍后质量的描述方法。”这一例子说明,谁最早获得需求刺激,谁就有可能作出发明创造。较低的742 DPI分辨率和汉字笔画密的特点给了我们创造的动力。

实时逐段生成版面点阵

第三代阴极射线管照排机是逐字扫描的,且可以等待,而激光扫描是逐线的,国产滚筒式或转镜式照排机,以及1976年以前的国外传真扫描输出装置均是不可等待的。“不可等待”带来的困难很大,742 DPI分辨率下,一版报纸的版面点阵就达20MB,而我们只有512KB磁鼓和64KB磁心存储器。这些硬件条件迫使我们采用每次只生成8线,交替缓冲8线的方案,迫使我们提出了能把轮廓加参数信息快速实时复原成点阵的算法和硬件。我们是第一个在不可等待的逐线扫描情况下,研制轮廓信息高速复原的。

按布尔串挑选式读带写鼓

全部字模(轮廓加参数的描述形式)是放在磁带上的,磁带是顺序存取而不是随机存取的。排一本14万字的新华社新闻稿只应启动一次磁带,把所用到的全部字模(一般小于5000个)一次从磁带读出送入512KB的磁鼓中。主机软件先对一本书的小样信息作统计,用布尔串形式列出用到的全部字模编码。磁带控制器是专门设计的,根据布尔串内的“0”、“1”指示,只读出实际用到的那些汉字字形信息,并写入磁鼓中。这样在一本书照排的开始,只需几分钟就把全部用到的字模从磁带送入磁鼓。1979年130主机配了5MB的保加利亚硬盘,改成软件按布尔串读盘写鼓。

按索引把磁鼓上的一行字模读入磁心存储器

磁鼓的每一道上都有磁头和读写放大器,可以并行读出16位(外加双重错纠错所需的附加位)。扫描不可等待的特点又带来速度上的压力: 必须保证在磁鼓转一圈的过程中把一行汉字的全部字形压缩信息读出并送入磁心存储器。因为磁心存储器容量很小,不可能放一版上用到的全部汉字字模,而只能放交替的两行字模。我们把磁鼓设计成按索引访问: 每个汉字的字形信息的第一个16位是一个字模码,一行内所出现的汉字的字模码是一张表,顺序排列,逐个与磁鼓上的字模码比较,相同时才把磁鼓上的汉字字形信息送入磁心存储器。

上述内容组成了原理性样机方案的主要部分,这一设计是基于国外60年代初期的硬件条件的,假如在60年代中期实现,无疑是非常先进和极具竞争能力的,而且这种先进性可以保持到70年代初期。这种假设似乎是天方夜谭,但这一事实证明,中国人是有可能比外国人更早提出某些新思想和新设计的,而要做到这一点往往需要下述两个条件: ① 采用国际上最先进的技术;② 与国外同行相比,同时或更早得到前沿的需求刺激。上述第一个条件现在已不成问题,第二个条件则是我经常思考的问题。给优秀的年轻人创造良好的环境,不仅指待遇、住房和科研条件,更重要的是设法把他们推到需求刺激的风口浪尖上,只有这样,才能使他们“出彩”。1993年起我们积极开拓港、台、东南亚、北美的中文出版系统市场,1995年起我们大力推动方正日文出版系统进入日本市场,就是为了寻求这种需求刺激。一天出1000页的台湾《联合报》、双周出一本1200彩页的日本杂志,以及十分发达的日本彩色广告业和印刷业,都将给年轻人带来创造的动力和机会。

1997年7月8日

本文刊登于《王选谈信息产业》,北京大学出版社,1999年1月。