书城传记倪光南:大国匠“芯”
82521600000003

第3章 结缘中科院计算所

第一节 战火中萌生的强国梦

镇海位于浙江省宁波市东北部,它的东面是舟山群岛,西面有宁绍平原,南面是北仑港,北面则是杭州湾。这里不仅有全国闻名的镇海中学,同时还有历史悠久的商帮文化,同时,这里还是“中国院士第一乡”。

截止到2017年底,从镇海区已经走出了30位中国“两院”院士,而倪光南正是这30位院士中的一员。

倪光南出生于1939年,时值艰苦卓绝、烽火连篇的抗战岁月,整个中国都处于战争的旋涡之中。

尚处童年,倪光南不知道战争为什么发生,但却可以感受到战争带来的苦难,而逃难似乎成为了自己跟父母唯一能做的事——这个过程是痛苦的,也是危险的。

倪光南出生在香港,祖籍宁波镇海。

1942年6月,日军进攻香港,倪光南只能随着父母辗转逃难回到上海。

在炮火下成长起来的人,总是对那个时代有着刻骨铭心的记忆。对倪光南来说,从小逃难的经历是深刻而难以忘怀的。这些难以磨灭的记忆会潜移默化地影响他:国家积弱,就会被人欺凌。他渐渐明白,一个国家只有富强起来,才不会遭受战争的蹂躏。落后只能挨打,不想办法进步,就要一直挨打。

抗日战争结束之后,倪光南告别了自己颠沛流离的生活,开始进入钱江小学读书。在同一时期,大洋彼岸已经开始了计算机时代。冯·诺依曼第一次提出了建立在二进制基础上的现代存储程序计算机概念。在1944年到1945年之间,冯·诺依曼创造了现在使用的将一组数学过程转变为计算机指令语言的基本方法。

到了1946年,世界上第一台电子数字积分计算器诞生。随后,1948年,晶体管的发明大大促进了计算机的发展,电子设备的体积开始不断缩小。1952年,第一台大型计算机系统IBM701问世。1964年,第一个采用集成电路的通用电子计算机系统IBM360系统诞生。直到1981年个人计算机诞生,可以说,倪光南成长的时代正是计算机飞速发展的时代,但倪光南最初接触到的却不是计算机。

刚刚进入钱江小学读书的倪光南并不知道当时世界上发生了什么,由于性格内向,倪光南总是给人一种沉默寡言的印象。除了学习,倪光南还喜欢背诵《唐诗三百首》,目的是为了锻炼自己的记忆能力。他说:“我并没有文学细胞,只是喜欢而已。我背诗的另一个目的是锻炼记忆力,因为我看到有些书上是这么说的,不论是否有充分的根据,多动脑筋总是有益的吧!”

小学毕业之后,倪光南进入复兴中学学习,在这里他学到了很多治学和做人的道理。更为重要的是,从小喜欢动手的他,在中学期间学习了很多手工制作,这对于日后他从事工程实践产生了很大的帮助。

描述到这一方面的内容,倪光南说:“我们那时候不像现在的学生有这么重的负担,我们有一些课余活动小组,有做航空模型,有做小电机,做收音机,这样锻炼了动手能力。我是做工程的,动手能力挺重要。”

倪光南后来之所以能够与计算机结缘,也与这些课余活动有着不小的关系。倪光南很喜欢动手实践,经常会自己组装矿石收音机。矿石收音机是指用天线、地线、基本调谐回路和矿石来制作检波器而组成的没有放大电路的无源收音机。这是一种最为简单的无线电接收装置,但在当时,这也算是一个稀罕物件了。

最初,倪光南所组装的多是单管收音机,在玩腻了单管之后,开始尝试组装2管机、3管机。到了高中,倪光南依然没有放弃这项爱好,而这时,他组装的矿石收音机已经达到了7管,这在当时已经算是非常高级的收音机了。

倪光南之所以喜欢组装这种矿石收音机,主要是因为这个动手的过程,能够让自己的大脑得到锻炼。事实上,正是这个动手的过程,让倪光南对无线电产生了浓厚的兴趣,随着对无线电的兴趣与日俱增,倪光南最终决定报考“南京工学院无线电系”。

在当时中国的大学中,工科院校最好的就是南京工学院,而无线电系又是南京工学院中最热门的系。可以看出,在学习方面,倪光南对自己是很有信心的。最终,凭借着优异的成绩,倪光南得偿所愿进入南京工学院。

从1956年秋天开始,倪光南便进入了南京工学院学习。南京工学院是现在东南大学的前身,在1952年进行全国院系调整时,以原南京大学工学院为主体,又并入了复旦大学、交通大学、浙江大学和金陵大学等学校的有关系科,在当时中央大学本部的原址上建立了南京工学院。倪光南所就读的,就是调整重建之后的南京工学院。

同样在1956年,同样是临近秋天,中国科学院计算技术研究所成立,这也标志着中国早期的计算机事业拉开了帷幕。作为中国第一个专门从事计算机学科技术综合性研究的学术机构,中科院计算所研制成功了我国第一台通用数字电子计算机,并形成了我国高性能计算机的研发基地,我国首枚通用CPU芯片也诞生在这里。中科院计算所的主要研究方向非常广泛,迄今为止,它已经在信息处理、信息检索、网络安全、大数据处理、智能技术研究、生物信息计算和虚拟现实技术等方面展开了研究。

中科院计算所是我国计算机事业的摇篮。伴随着计算所的发生发展,先后为国家培养了几百名我国最早的计算技术专业人员,在这里工作或学习过的院士有二十余位。随着学科与技术发展,从计算所陆续分离出中科院微电子学研究所、计算中心、软件所和网络中心等多个研究机构,以及联想、曙光等高技术企业。六十多年来,计算所在科学研究和科技成果等方面取得了显著成就。截至2018年底,计算所获得国家、院、市、部级科技奖励227项,其中,国家级科技奖励50项(含非第一完成单位13项),院、市、部级科技奖励178项(含非第一完成单位16项)。

倪光南与中科院计算所的缘分似乎是命中注定的一样。但实际上,倪光南之所以能够从南京工学院进入中科院计算技术研究所,很大原因还在于他自己的刻苦努力。

倪光南在南京工学院度过了5年的求学时光,对于倪光南来说,这5年是充实而高效的。他学习了无线电发送接收技术、放大整流技术、脉冲技术、微波技术,同时还接触到了许多此前从未见过、听过的陌生领域的知识。

对于在南京工学院学习的时光,倪光南说道:“对我来说,这好比是面对一座丰富的宝藏,在勘探和开垦的过程中,充满了无穷的乐趣。”

在大学阶段,倪光南最喜欢的就是上实验课,几乎每一次实验他都是最快完成的学生。对于这一点,倪光南略带调侃地说道:“因为我那时上课完全看不清黑板,只能靠动手了。”

倪光南的视力确实存在一点儿问题,早在初中时,他的视力就降到了0.4,但即使到了大学他都不肯配戴眼镜。他将此解释为是受到了米丘林理论的影响,认为只要长时间坚持,自己的眼睛也能够适应环境。

米丘林是苏联著名植物育种学家和农学家,苏联科学院荣誉会员,米丘林学说的奠基人,他发现了植物幼体对生活条件具有很强的适应能力。为此,他将一些正在苏联南方才能生长的果树进行耐寒性驯化,最终培养出了可以在北方生长的果树新品种。

倪光南似乎将自己看作米丘林的果树,认为自己也能够通过适应环境摆脱近视问题。为此,倪光南即使在冬天也会故意少穿一些衣服,将其作为磨炼意志的方法。

倪光南大学时期的刻苦学习为他以后的工作打下了坚实的基础。如果当时没有选择无线电专业,倪光南可能就要与计算机研究失之交臂。不得不说,在这方面倪光南是幸运的。从无线电到计算机,隔行如隔山,倪光南最初并不适应。在1958年南京工学院成立计算机系的时候,整个系里没有一个学生见过计算机,学生们只能进行理论学习。

没有见过计算机的倪光南想象了许多不同的场景。他曾认为有了计算机,就能够自动将外语翻译过来,这样大家不必再学外语了。当时的计算机在中国并不常见,大多数人只是听过,很少有人见过,所以很容易将其想象得无所不能。

倪光南也是一样,将计算机看作无所不能的物件。随着自身知识水平的增长,以及中国计算机行业的发展,倪光南逐渐认识到了当时计算机的局限,同时也认识到了中国计算机水平的局限。这也更加坚定了他想要进入这一行业的决心。

第二节 初入中科院计算所

1961年是一个平年。辛丑年,也就是牛年。

4月12日,苏联宇航员尤里·加加林成为世界上第一个太空人。

6月17日,中国女子登山运动员西绕(藏族)和潘多(藏族)登上新疆境内海拔7595米的公格尔九别峰顶峰,打破了女子登山高度的世界纪录。

夏天,中科院计算所来了位年轻人,他的名字叫倪光南。

当时,倪光南以全5分的成绩从南京工学院(现东南大学)无线电系毕业,被分配到中科院计算所研制外围设备的第六研究室输入组工作。最初,倪光南参加了我国自行研制第一台大型电子管计算机(吴几康领导的119机)的工作,倪光南担任外围设备的值班长,负责调机。后来担任插件(线路)组长,负责设计和改进线路。1964年4月,119机研制成功,倪光南被评为计算所先进工作者和中科院北京地区先进工作者。这时,他已成为所里小有名声的“业务尖子”。此后,倪光南主要从事新输入技术的研究。

当时计算技术研究所大多数是与倪光南年龄相仿的年轻人,7个人被安排在一个宿舍中。刚刚离开大学校园的年轻人,充满了蓬勃的朝气和力量。对于当时的工作环境,倪光南说:“大家工作热情都很高,工作完了就回宿舍睡觉,睡醒了就接着工作,时间好像都不存在了,每天都过得很充实。”

这种充实更多是因为这些年轻人对当时的工作充满兴趣。那时中国的计算机事业刚刚起步,一切都是未知,一切都是创新。这些年轻人与其说是在工作,不如说是在为国家探索一个新的行业、新的领域。

在此期间,倪光南结识并与六室党支部书记兼主任王中田成为知己。

王中田是一位1945年参加革命的老干部,他与一般党政干部的最大不同是对技术有强烈的兴趣,他常说,“我们当领导的,即使不会演戏,至少也要能听戏”。为此,这个“提着裤腰带闹革命”的党政干部,变成勤奋学生,业余时间几乎都用来学习技术,他的“老师”就是倪光南。从与王中田的接触中,倪光南学到了许多优秀品质,特别是王中田不计个人得失、坚持真理的精神给了倪光南很大的教育,两个人常常在实验室里研讨技术直到深夜。

当时,计算机输入手段十分落后,计算所的几台计算机都采用穿孔纸带输入,严重地妨碍了计算机的应用。

王中田希望倪光南研究计算机新输入技术,倪光南欣然从命。从那时起,倪光南就步入研制新输入技术之漫长历程。倪光南认为,要改进计算机输入技术,应该依靠计算机本身。于是,他逐渐形成了自己的研究目标,一是用计算机辅助汉字输入,二是用计算机识别文字;前者发展为联想式汉字输入方法,后者发展为手写文字识别机。

以下,是倪光南院士写的一篇回忆王中田的文章:

我的良师益友

——记中科院计算所原六室主任王中田同志

1961年夏天,我从南京工学院(现东南大学)无线电系毕业,进入中科院计算所,被分到研制外围设备的第六研究室输入组,很快就和室党支部书记兼主任王中田成了好朋友。

王中田是一个老干部,1945年参加革命,曾任山西晋中地委副秘书长兼办公室主任,1960年10月调入中科院计算所工作,他带领六室科技人员为计算所自行设计的119机、109乙机、109丙机、013机等大型计算机研制了外部设备。

王主任与一般党政干部的最大不同是他对技术有强烈的兴趣,他不满足于做一般的党政领导,而要求自己能了解技术,他常说,“我们当领导的,即使不会演戏,至少也要能听戏”。为了在我国计算机的最高学府能够“听戏”,这个具有超前意识的党政干部老黄牛,变成了一个勤奋的学生。业余时间,王主任几乎都用来学习技术,他不耻下问,虚心向科技人员请教各种技术问题。可能是因为我回答问题比较耐心的缘故吧,王主任和我在一起讨论问题的时间最多。实际上不只是王主任从我这里学技术,我也从与王主任的接触中学到了他的许多优秀品质,特别是王主任不计个人得失,坚持真理的精神给了我很大的教育。我们两个人,一个是党政干部,一个是科技人员,常常在实验室里研讨技术,谈古论今,直到深夜。

2000年7月,王主任不幸去世,当时我和六室老同志们聚在一起,含泪回忆王主任的生平,我们一起商议后,在王主任的悼词中加了这样一段话来寄托我们的哀思:“王中田同志作为一个党政干部,不仅认真学习马列主义、毛泽东思想和党的方针、政策,还以甘当小学生的精神,孜孜不倦地学习现代科学技术,为广大科技人员树立了榜样,同时也提高了自己的领导水平。他这样做在今天看来似乎不足为奇,但在当时需要有极大的勇气,甚至要冒一定的风险。但王中田同志不计个人得失,坚持真理、崇尚科学,坚持‘学习、学习、再学习’的正确方向,他的这种大无畏精神值得我们每个同志学习。”

如果是在今天,一个干部像王主任那样,如痴如醉地学习科学技术,肯定会受到人们的尊敬,但在上世纪六十年代,王主任这样做却遭到了许多非难和指责,甚至被扣上“只专不红”“业务挂帅”等帽子,在“文化大革命”中被揪出来挂上“修正主义分子”的牌子遭到批斗。后来,王主任因工作调动离开了六室,六室的科技人员一直都很想念他。

在王中田当六室主任期间,他就有远见地希望我研究新的汉字输入技术,给了我很大的科研自由度。这样,从上世纪六十年代起,我就开始了研制计算机新的汉字输入技术的漫长历程。我认为,要改进汉字输入,应该充分发挥计算机的智能,从而产生了利用“联想”功能辅助汉字输入的设想。1974年我在计算所阶梯教室做了一个关于联想汉字输入方法的报告,后来,这一创意发展成为联想汉字信息处理成果。1984年底我们研究所创办了计算所公司实施所内成果转化,这一成果就转化为联想式汉字系统拳头产品,计算所公司即以此起家并在1989年改名为联想集团。我想,如果王主任泉下有知,他一定会为此感到欣慰。

1956年,中国制定了12年科学远景规划,将开创计算技术事业作为四大紧急措施之一。中国科学院计算技术研究所就是在这一背景下成立起来的。当时中国科学院成立了计算技术研究所筹备委员会,面向全国招募优秀人才,同时依靠从苏联获得的技术图纸和苏联援建的电子管工厂来设计并生产中国自己的计算机。

1958年和1959年,中国分别研制成功了103计算机和104计算机,这让中国计算机完成了从无到有的跨越。由于是仿制的苏联先进的计算机,所以当时的103计算机和104计算机在技术水平上仅次于美国和苏联。

到了1960年,107计算机研发成功,这是一台小型的串联通用电子管数字计算机,也是中国第一台自主设计的计算机。

107计算机的诞生标志着中国的计算机制造完成了从模仿到自主设计的跨越。

在107计算机之后,由于一些历史方面的原因,中国无法再从苏联获得援助,同时,西方国家也对中国进行了严格的技术封锁。这就使得中国只能依靠自主设计、自主生产来开发自己的计算机。

在当时,中国自主研发计算机首先需要迈过晶体管研发这道坎。在20世纪60年代初,晶体管制造技术对于中国来说几乎是一项不可能完成的挑战,西方国家和苏联也认为中国没有办法掌握这项技术,认为只要能够在这项技术上钳制中国,中国的计算机就无法获得突破。

为了能够攻克这项技术,中国人民解放军军事工程学院四系404教研室的康鹏进行了大量的实验研究。最终,他成功研发出了“隔离-阻塞振荡器”,也就是后来所说的“康鹏电路”。“康鹏电路”的问世解决了晶体管制造的难题,中国也开始进入晶体管时代。

在解决了晶体管制造难题之后,1964年,中国成功研发出第一台全晶体管计算机441B-I。这一计算机的问世只比美国第一台全晶体管计算机RCA501晚了6年。同样在1964年,119计算机研发成功,这台计算机的运算能力为每秒5万次,稍强于美国在1958年制造的IBM709计算机。倪光南当时所参与研发的就是这台计算机。

在当时的中国,计算机属于一种新学科,一直到1963年中国才出现计算机专业的毕业生。所以与倪光南同时代的人大多都是“改行”过来的,他们有的是学习电机的,有的是学习无线电的,还有的是学习数学的。这些人当时为了掌握计算机技能,主要是靠自学。

在刚刚进入计算所时,倪光南就表现出了强烈的学习欲望。当时,在119计算机的控制台上,密密麻麻地分布着几百个氖灯和部件,倪光南凭借自己过硬的记忆力,就记住了它们的位置和功能。

当时的倪光南仍然没有佩戴眼镜,他依然相信“米丘林理论”。直到一次在与同事一同看电视时闹出了笑话,倪光南才放弃了自己的坚持。对于当时的情景,倪光南这样形容:“有一次新闻里播一场体操比赛,同事问我,这是男运动员还是女运动员,我反正也看不清,就胡乱猜了个‘男的’,结果好一阵哄笑……”

紧接着第二天,倪光南就去配了眼镜。他抛弃了“米丘林理论”,并说道:“我忽然明白人是要尊重客观规律的,有些事是不以人的意志为转移的。”看上去这并不是一件多么重大的事情,但对于倪光南来说,从中悟出的这个道理,却值得他牢记一生。

在119计算机研发成功之前,世界上能够研发巨型机的国家只有美国、苏联、英国和法国等几个大国。在119计算机问世之后,中国的计算机研发水平也进入了世界先进行列。

在119计算机研发过程中,倪光南凭借优秀的表现被评选为计算所先进工作者和中科院北京地区先进工作者。

在谈到119计算机时,倪光南总是如数家珍。他说:“当时119计算机的内存是2.4万颗小磁芯,每颗小磁芯都要人工穿上四根线才能用,猜猜它的内存容量是多少?只有24K,现在的一个U盘,容量就是它的几万倍。当时119计算机的速度是5万次,而现在家用电脑的速度则是10亿次……”

每次谈到这里,倪光南都会感叹计算机事业发展的速度如此之快,快到令人难以想象。所以在计算机行业中,永远都有事情可做。每一个身处其中的人都会面对巨大的压力,如果跟不上计算机行业的发展速度,就没有办法看到这个领域的潮流是什么。如果不跟着潮流进行学习,一两年之后,原有的知识也就毫无用处了。

“不断学习”也成为了倪光南的人生信条,即使过了几十年,倪光南依然走在计算机行业的前列。他总是有一种危机感,只要还在这个行业之中,就不能让自己掉队。正是这种危机感在推动他不断向前,不断进步。

计算机行业的发展速度确实快得惊人,这一领域的潮流也在瞬息万变。在大洋彼岸,集成电路已经闪亮登场,成为了计算机行业的重要技术。

当时中国研发的119计算机虽然在运算速度上已经达到了世界领先水平,但仍然采用的是电子管。随着晶体管的问世,这种电子管开始逐渐失去了优势。晶体管的出现让计算机开始向小型化转变,计算机也开始从纯计算转向了其他领域的研究。

在这股潮流的推动下,汉字信息处理成为中国计算机行业的一个新的难题。

第三节 汉字处理难题

现在人们在使用电脑时,只要通过敲击键盘上的26个字母,就能够顺利拼写出汉字。但在计算机刚刚进入中国之前,想要让计算机显示汉字,却并不是一件容易的事情。

让计算机进行汉字处理在当时是一件难事。首先,想要让计算机处理汉字,就一定要让计算机能够显示汉字,还要让计算机知道人们想输入的汉字是什么。如果是英文,直接按照字母输入就可以了,计算机很容易识别这些拼音文字。汉字作为一种表意文字,很难创造出一种简单明了的方法来让计算机理解。

在20世纪六七十年代,计算机和汉字之间存在着一条鸿沟。当时的计算机并不能处理汉字,这就严重影响了中国计算机事业的发展。如果中国人在计算机上都使用拼音文字,那汉字就将逐渐退出历史舞台。

汉字是中华文化的根,如果没有汉字,中华文化就无法得到传承。汉字诞生之后,曾在世界文化中独领风骚。但当机械打字机出现之后,西方拼音文字的地位得到极大提升,汉字在打字方面的缺点便开始显现出来。

随着计算机的出现,拼音文字的地位又一次得到提升。汉字打字困难的缺点再一次暴露出来。一些西方人开始认为方块汉字是世界上最古老、最繁难、最笨重的一种文字工具。在计算机时代,汉字似乎已经走到了尽头。

20世纪80年代初,IBM公司曾耗资6500万美元进行中文电脑化的研究。IBM公司的研发实力加上充足的资金支持,原以为中文电脑化将会很容易成为现实,但没想到IBM公司并没有完成中文电脑化的研究。

IBM公司着急进行中文电脑化的研发,是为了抢占中国的计算机市场,但显然经济利益的驱使并没有让他们取得成功。相反,在中国,一些人同样在进行中文电脑化、汉字现代化的研究,他们所追求的并不是经济方面的利益,而是为了让更多中国人能够方便地使用电脑、更好地利用电脑这一高科技工具。

倪光南就是这些人中的一个。在研制完119型计算机之后,倪光南被安排进入了六室,主要攻克汉字输入系统的研究。在六室工作期间,结识了室主任王中田,倪光南经常和他一同探讨技术方面的问题。

在当时,倪光南的理想是让计算机和人能够更方便地交流。要么是让汉字能够更方便地输入到计算机之中,要么就是让计算机能够学会认识汉字。也正是由于这样的原因,他才会选择去研究输入技术。

1974年10月,国家计委批准了由国防科工委、中国科学院和四机部联合提出的“关于研制汉字信息处理系统工程”的建议。这一工程主要包括键盘输入、中央处理及编辑、校正装置、精密型文字发生器和输出照排装置、通用型快速输出印字装置远距离传输设备、编辑及找资料管理等软件系统、印刷制版成形等7个部分的内容。

“汉字信息处理系统工程”已经被列入国家重点科技攻关项目之中,研究汉字信息处理技术也成为了当时中国计算机行业的头等大事。

在70年代,倪光南在计算所主攻的研究方向有两个,一个是汉字信息处理,一个是模式识别。

在汉字信息处理方面,倪光南、竺乃刚、万永熙等人为了解决人机交互问题,从1968年开始,先是在“717计算机”上研制出了能够显示256个汉字的显示器,随后又研发出了“SK-1光笔图形显示器”,能够显示出不同字形的汉字,而光笔则成为了人机交互的重要手段。

在当时,汉字输入的主要方式就是利用光笔进行输入。光笔输入需要在一个特殊的大键盘上进行,几千个汉字纵横排列在这个大键盘上,想要输入汉字,就要用光笔选到需要的汉字。每一个字都需要这样选择,其他输入方法虽然在具体操作上与光笔输入有所不同,但也同样非常烦琐,需要操作者记忆大量的输入规则。

倪光南想要让汉字输入变得简单,彻底解决汉字输入复杂烦琐的问题。但当时想要更好地解决这个问题只有两条路可以选择:一是创造一种“规则”,也就是对汉字进行编码,然后再通过汉字编码来进行输入。二是让计算机能够直接识别出手写的汉字。这是两个并不相同的研究方向,但究竟哪种方法能够更好地解决计算机的汉字输入问题,谁也不能给出一个准确的答案。

为了能够更好地解决汉字输入的问题,倪光南决定从两个方向同时努力。为此,他承担了两个项目的研究:“手写文字识别机”和“111汉字信息试验系统”。

想要进行这两个项目的研究,都需要用到计算所的111型计算机。在当时111机是计算所的“抢手货”,基本上全国大多数重点、尖端的科研项目都会用它来进行大量运算任务。为了能够多用几个小时机器,倪光南和同事们总是在深夜的时候预订机器,这样在晚上就不会有人来“抢机器”了。

经过多次反复试验,倪光南和同事们成功研制出了“手写文字识别机”和“111汉字信息实验系统”。其中,“手写文字识别机”能够识别出手写的60多种字母和数字,这是中国最早的文字识别机之一,而“111汉字信息实验系统”则推动了汉字输入、输出、显示和人机交互等多种汉字技术的发展。

倪光南和同事们研发的这两个项目,1979年同时获得了中国科学院科技成果二等奖。在汉字输入上,倪光南已经取得了很大的成绩。但对于他来说,汉字输入的烦琐性问题依然没有得到彻底解决。

“有没有一种方法能够让人们将文字更好更快地输入计算机中呢?”伴随着这种思考,倪光南创造了“联想式汉字输入法”,这种输入方法的问世,让汉字输入的效率得到了极大提高。

第四节 联想汉字输入法

从20世纪60年代开始,中国的一些技术专家和高校学者便开始对汉字信息处理技术进行研究。倪光南和中科院计算所的同事们就是其中的一支重要研究力量。

最初对汉字信息处理的研究更多局限在“汉字编码”上,这是一种为汉字设计的便于输入的计算机代码。一个完整的汉字信息处理系统主要包括编码、输入、存储、编辑、输出和传输等环节,其中编码是最为关键的环节,不解决这个问题,就无法让汉字进入计算机之中。

在当时,想要完成“汉字编码”并不容易。

首先,由于汉字的总数量比较多,即使只对3000或4000个常用汉字进行编码,仍比处理由20多个字母组成的拼音文字要难。

其次,汉字的字形很复杂,既有古体今体,又有繁体简体。而且汉字笔画也相差悬殊,多的有36笔,少的只有1笔。

最后,汉字中存在着大量一字多音和一音多字的现象。汉语音节一共有416个,区分声调之后有1295个。如果按照1万个汉字来计算,每个不带音调的音节就会平均有24个汉字,而每个带调的音节也有7.7个汉字,有一些同音同调的汉字甚至多达66个。这些都为汉字编码造成了不小的困难。

也正是这些原因,当时几乎所有的“汉字编码”都是单纯的人工编码。也就是用汉字的字形和发音来作为编码的基本元素,将一个汉字用一些基本的元素来进行组合表示,一般来说,这些基本元素只有几十个,所以可以用一个普通的西文键盘来输入汉字。

看上去,“汉字编码”能够解决汉字输入的问题,但实际上,在使用“汉字编码”时,编码者需要记忆大量规则,这就为汉字输入带来了很大负担,这也决定了“汉字编码”无法成为最便捷的汉字输入方法。

在倪光南看来,想要让汉字输入变得简单便捷,就要充分利用计算机自身的处理能力,让计算机来辅助人们进行汉字输入。倪光南将这种方法比喻成人类的联想能力,这种方法就是经常被提到的“联想式汉字输入法”。

这种想法看上去很好,但当时的计算机还不能处理文字,所以也就无法实现这种“联想”的功能。想要让联想输入法成为现实,首先要让计算机能够显示汉字,然后还要让计算机知道人们所选择的究竟是哪个汉字。

为此,倪光南积极参与了当时计算所显示组进行的汉字显示技术的研究工作。

计算所六室显示组研制的最早的汉字显示器被安装在卫星监测用的717机上。此后,显示组又研发出了“111机”的汉字显示器。在“111机”上的汉字显示器,已经能够用键盘来进行人机交互了。但为了更好地实现人机交互功能,显示组又为另一台显示器增加了一种人机交互手段,也就是前面曾提到的“光笔”。

虽然当时的光笔比较大、比较重,使用起来也不方便,但至少这已经算是实现联想式汉字输入法最为理想的一种手段了。为了更好地用光笔进行输入,倪光南在“111机”上专门为联想式汉字输入方法设计了带有光笔的汉字显示器。随后,还对这一显示器进行了一些小的改进。

以前的光笔主要是用手来控制开关的,当光笔指点了屏幕上的图形和文字之后,还需要用手指再按一下笔上的触及点,才能进行选择。倪光南在光笔的头上加了一个微动开关,这样一来,只要用光笔指点到屏幕上的汉字,轻轻一压,开关就会被启动,汉字就被选择了。这一微小的改动让光笔输入变得更加方便,同时也为联想式汉字输入法的实现做好了准备工作。

到了1974年,“748工程”会议召开,“748工程”就是前面提到的“汉字信息处理系统工程”。这一工程开启了中国印刷技术的第二次革命,也让中国正式告别了铅火印刷的时代。也正是在这一工程中,汉字与计算机之间的鸿沟被逐渐抹平,计算机的文化进程也逐步加快。

倪光南是计算所参加“748工程”会议的唯一代表,并向当时的负责专家介绍了自己的汉字处理研究。到了1975年,计算所六室输入组正式开始了对汉字信息处理课题的研究。倪光南曾在计算所的阶梯教室进行过学术报告,介绍自己的联想式汉字输入法。

倪光南的“联想式汉字输入法”主要利用上下文的关联性,让计算机来辅助汉字输入。在汇报时,倪光南在黑板上画出了联想式输入方法的示意图,并表示当使用者输入一个汉字之后,计算机会在汉字显示器上面提供许多关联词,这些关联词可以由一个也可以由多个汉字组成。随后,使用者可以使用光笔或者键盘来选取某一个关联词,这样就能够方便地输入汉字了。

虽然倪光南很早便提出了联想式汉字输入的方法,但最终落地整个过程历经了近10年时间。在这些年中,除了提出联想式汉字输入方法外,倪光南用了不少时间去研制人机交互汉字显示技术。

这也就是前面提到的“111汉字信息试验系统”和“手写文字识别机”。倪光南将这两个项目放在一起进行研究,共享技术和设备。

当时,“手写文字识别机”的硬件设备基本上包含了“111汉字信息处理实验系统”的硬件设备。“手写文字识别机”主要包括“自适应飞点扫描器”和“文字识别监视器”等硬件,而“111汉字信息处理实验系统”的主要硬件则是人机交互汉字显示器。

这样,当“111汉字信息处理实验系统”在工作时可以用来显示和输入汉字,而当“手写文字识别机”在工作时,则可以作为文字识别监视器和修订手段。这两个设备可以共用控制器,这样一来,两项研究不仅可以节省设备,同时还能够缩短研制周期。

整个项目可以分为9个部分,即控制器研制、设备接口研制、机械设计研制、人机交互汉字显示器研制、汉字系统软件研制、对话输入法词典和联想词典编制、汉字打印机研制、飞点扫描器研制、识别机软件研制。

当时111机的人机交互汉字显示器的控制器逻辑基本上是“SK-1光笔图形显示器”控制器逻辑的移植,只是将“三维坐标变换器”简化成了“二维坐标变换器”,同时还修改了其与主机的接口。

在这9个部分工作中,倪光南参与了其中6个部分的工作,同时他还主持了全部硬件、软件的研制和上机实验。

倪光南最初提出的联想式汉字输入法采用的是“从字到词”的方式,就是输入一个汉字,然后计算机会提供一组联想词,供使用者去选择。比如输入“中”字后,后面会出现“国、文、心、华”等联想字,同时还会出现“华民族、华人民共和国、心思想”等联想词。

在这种情况下,选择一次就可以输入多个汉字组成的词,比如通过输入“中”,选择最后一项就可以再输入“华人民共和国”。这种联想是单词的,也就是从一个汉字到一个词,然后再输入一个汉字,再联想到一个词。

但如果按照这样的构想来进行,联想式汉字输入法就会占用较多存储空间。因此在后续研究中,倪光南和同事们又进一步完善了联想式汉字输入法。

第五节 访学加拿大

在研发“111汉字信息处理实验系统”过程中,竺乃刚负责编制联想词典。为了节约联想词典的存储空间,他提出了使用“从字到字”的方式进行联想输入,也就是在输入一个汉字之后,由计算机提供一组联想字让人选择,这样联想字会形成一个链,从而达到“从字到词”的效果。

倪光南接受了竺乃刚的建议,用软件控制开关,这样就可以在这种“从字到字”的联想方式和之前单次的“从字到词”的联想方式之间自由切换。

相较于“从字到词”的联想方式,“从字到字”的联想方式需要在输入一个词的时候进行多次选择。这样一来,就会降低联想字的命中率,所以说这种方式还有很大的改进空间。

随后,在开发联想式汉卡时,倪光南进一步完善了联想式汉字输入法。他创造了一种“从词到词”的联想方式,即根据已经输入的“词”,由计算机提供一组联想词,供使用者选择。其中,联想词会根据已输入词的长度被称为“联想相关长度”,这个长度越长,联想词的命中率也就越高。

到联想式汉卡V2.X软件系统时,“联想相关长度”已经发展为1到4,也就是计算机能够根据前面已经输入的1到4个汉字,来为使用者提供联想词。

举例来说:

当“联想相关长度”为1时,输入“中”字,计算机会给出“国、华、央、文”等联想字。

当“联想相关长度”为2时,输入“中国”这个词,计算机会给出“人民、公民、制造、政府”等联想词。

当“联想相关长度”为3时,输入“中国人”后,计算机会给出“口、民、文”等联想字。

当“联想相关长度”为4时,输入“中国人民”后,计算机会给出“银行、解放军、政府”等联想词。

很显然,按照这种输入方式,不仅联想词的命中率会很高,整体输入效率也会得到提升。发展到这里,联想式汉字输入法才算最终成形。

除了用联想式汉字输入法进行汉字输入外,倪光南在联想式汉卡V2.X软件系统中,还利用联想功能来减少输入中的重码。

汉字一音多字的情况十分普遍,拼音输入法虽然规则上比较简单,但重码情况也比较多。比如“yi”的同音字就超过100个。这样在这么多重码字中找到自己需要的那个字,就会消耗很长的时间,从而降低输入效率。

为了解决这一问题,倪光南在联想式汉卡V2.X软件系统中加上了“允许利用联想功能减少重码”这一选项。在选择这一项之后,重码字就会被筛选,属于联想字的那些字就会排列在前面,方便人们选择。这与现在常见的智能拼音输入法十分类似。

在开发联想式汉字输入法过程中,访学加拿大为倪光南留下了深刻的印象,在加拿大的所见所闻所学也让倪光南在联想式汉字输入法的研发之路上更进了一步。

1980年,加拿大国家研究院的一位副院长来到中科院计算所访问。当时六室的万永熙负责接待工作,他把副院长引领到倪光南那里,让倪光南为其演示了“111汉字信息处理实验系统”和“手写文字识别机”。

倪光南的英文水平不太高,所以只能用并不流利的英语来和这位副院长进行交流。在交流过程中,倪光南深得这位副院长的赏识。在访问结束后,这位副院长邀请倪光南前往加拿大从事研究工作。

倪光南很清楚,想要追赶上西方计算机研究的步伐,就要努力学习别人的先进技术,而出国访学不仅能够接触到许多先进的计算机设备,同时还能第一时间接触到国外的先进技术。对于开阔自己眼界、提升技术水平有着重要的帮助,为此,倪光南欣然接受了对方的邀请。

1981年,倪光南应邀前往加拿大国家研究院工作,成为了那里的访问研究员。倪光南的工作年薪是4.3万加元,如果按照官方汇率来计算,当时倪光南在加拿大的工资水平相当于国内的70倍,而这一工资水平在加拿大国内,也属于5%的高收入群体的水平。

在第一个月发工资时,倪光南将其中三分之一的钱寄回了家中。当时国内工资只有几十元一个月,而倪光南一次就寄回了上千元的“巨款”。倪光南的爱人在单位开好介绍信之类的证明文件,在单位领导陪同下去邮局领取这笔“巨款”。

倪光南在加拿大访问期间,不仅工资收入丰厚,工作环境也要比国内好很多。当时倪光南作为加拿大国家研究院的访问研究员,主要从事计算机图形学研究,这是从此前“手写文字识别机”延伸而来的一项研究。在加拿大国家研究院,倪光南第一次感觉到了计算机科学的发展潮流。

当时在研究院中,每一位研究员都有一台小型机。这些小型机在运行速度上与国内的机器相差并不多,但这里的机器却有完整的操作系统和大量的应用软件。无论是文件处理还是日常研究,都可以在这些计算机上进行。

亲眼见到这样的情境,倪光南说道:“那时第一次感受到计算机必将会作为一个工具为各行各业提供服务。而国内计算机还主要用于重大项目的运算,对于软件的开发和应用非常有限。”确实,国内计算机行业由于起步较晚,在当时,普及范围并不广泛,更多只是用于一些重要实验项目的运算,在软件应用和开发方面涉及得并不多。

倪光南开始利用在加拿大工作的机会努力研究相关技术,同时还经常与同事们聊天,了解国外各个高科技公司的运作方法。在这个过程中,倪光南又得到了一种新的认识。他说:“我开始了解到,科技成果只有和市场联系起来,才能实现良性循环,才能真正被更多人使用,这是我对科技成果产业化最初的认识。”

也正是出于这种认识,倪光南才会有后来将“联想汉卡”推向市场创造了联想集团最为辉煌的时刻。当然,这是后话。

在两年访问期结束之后,加拿大国家研究院非常满意倪光南的工作,希望他能够留在这里继续工作。但倪光南婉拒了对方的邀请,并对研究院的部门负责人说:“我一直在研究的汉字信息处理系统,既然是汉字,怎么能离开它的母国呢?在原来的研究基础上,加上在加拿大获得的新技术,我对它的发展前景十分看好。”

其实,倪光南对自己在加拿大的工作也十分满意,他认为这里还有很多技术和知识需要去学习。但在加拿大发生的一件事情改变了倪光南的想法,让他下定决心要离开加拿大,回到自己的祖国。

第六节 1.99元的“中国制造”

1981年底,倪光南刚刚开始自己在加拿大的工作。一个晴朗的周末,他独自骑着自行车在市区闲逛,不远处的一家鞋店吸引了他的目光。在鞋店的橱窗中摆放着各式各样的精美皮鞋,可以看得出这些皮鞋来自英国、美国、意大利等不同国家。

正当倪光南驻足观看时,他发现在鞋店门口的几个筐子里面摆放着一大堆布鞋,上面标示着“1.99加元一双任选”的字样。看到如此便宜的价格,倪光南觉得有些不可思议,就走到筐子边挑选起来。谁想到,拿起来一看,这些鞋子的底部都印着“MADE IN CHINA”的字样。

拿着鞋子的倪光南一下子有些恍惚,看着自己手中中国制造的1.99元的布鞋,又看了看橱窗中精美的外国皮鞋,这让倪光南百感交集,在这里,“中国制造”似乎成为了简陋、低级的代名词。但在倪光南心中,当时的中国只是在发展上慢了一步而已,“中国制造”不会永远跟“简陋和低级”联系在一起。

此后在加拿大,倪光南又看到了许多中国制造的产品,这些产品不是轻工产品就是农产品。而且很多时候,这些产品都是最低档次的,高科技产品基本没有。

也正是因为这些经历,倪光南才在访问期满之后拒绝了加拿大国家研究院的挽留。倪光南所放弃的不仅是对方的挽留,同时还有高额的年薪以及继续提升的机会。当有人询问倪光南选择回国的得失时,他说道:“我想有一点是肯定的,如果我不回来,之后我所做的一切工作,将不会对‘中国制造’有新的帮助。”

在加拿大两年,倪光南不仅学到了最新的微处理器技术和C语言,还开阔了自己的眼界。从加拿大回来之后,倪光南认识到中国的计算机也会大面积地普及。这就说明计算机并不仅仅是一个学术上的东西,所以必须要将其拿到市场之中去应用才行。

倪光南在加拿大认识到计算机会逐步普及,研发具有市场价值的产品才能将高科技的“中国制造”品卖到国外去。此前倪光南所研究的正是汉字信息处理技术,现在只不过用从加拿大学习来的新技术进一步加深研究而已。

在当时,倪光南已经能够用微处理器和C语言技术将联想式汉字输入等汉字处理技术整合在一个微机系统上了。为了能在回国后尽快做出成果,倪光南在加拿大自掏腰包购买了价值几千加元的科研器材。其中,包括Z80微处理器、SRAM、DRAM等设备,都是国内很难买到的器材。

在描述自己将这些设备运回国的过程时,倪光南说道:“一路上每过一个关卡,都要赶紧检查一遍,生怕把这些‘宝贝’磕了碰了。”在此后的研究中,这些设备确实给倪光南提供了很大的帮助。

回国之后,倪光南开始利用这些设备将联想式汉字处理成果做成一台实用的汉字微机。由于硬件器材齐全,软件采用C语言进行开发,效率很高。到1984年初,倪光南团队就开发出了新的汉字处理产品。这是一台完整的汉字微机,被称为“LX-80联想式汉字图形微型机”。

“LX-80联想式汉字图形微型机”是一个独立的汉字处理系统。从最初依赖于大型计算机的实验系统,到逐渐发展成为一个实用的汉字微机,倪光南在汉字信息处理的研究上取得了很大的进步。

1984年,“LX-80联想式汉字图形微型机”获得了中科院三等奖。此后通过技术转让,广东省科学院实验工厂、大连科华公司、四川万县船舶总公司457厂、苏州计算机厂四家公司共生产了600台这种微型机。

1984年4月23日,在深圳市“电脑产品及应用成果展览会”上,“LX-80联想式汉字图形微型机”和IBM-PC展开了较量。LX-80采用的是硬件处理汉字,也就是“硬汉字”技术,而IBM-PC则采用CCDOS软件来处理汉字,即“软汉字”技术。

当时PC的运转速度很低,使用16位的8088CPU,主频只有4.66兆赫,性能大概只有现在新PC的千分之一、万分之一。因此,只能显示出几十个汉字,而且在一个全屏幕上,只能够显示出来十行汉字。

反观LX-80,虽然使用的是8位的Z80CPU,主频只有4兆赫,但由于主要依靠硬件来进行汉字处理,所以在汉字信息处理方面要远超过PC机。当时LX-80的汉字显示速度每秒可以达到千字,而且全屏幕能够显示25行汉字。

很显然,在与IBM-PC的较量中,LX-80占据着很大的优势。外界也对LX-80表示看好,但倪光南却并没有被眼前的“胜利”冲昏头脑。在加拿大的经历让他知道,PC才是计算机行业的主流,使用Z80微处理器的系统都不能与之抗衡。所以必须要将LX-80的技术移植到PC上,才能够获得真正意义上的“胜利”。

倪光南知道计算机的未来在市场之中,而不会仅仅局限在学术研究上。因此,开发出便捷高效的汉字信息处理系统才是汉字输入的解决之道。虽然是一个搞科研的专家,但在计算机研发领域,倪光南更注重做产品。或许这也是此后倪光南接受中科院计算所公司总经理王树和等人的邀请加入计算所公司的原因之一。

此前计算所业务处与中航深圳工贸中心签订了合作协议。中航深圳工贸中心提供了两台当时最新的IBM-PC/XT,倪光南便着手将LX-80移植到PC上。由于信通公司邀请倪光南担任顾问,所以在这个过程中,信通公司也提供了支持。

这是汉字处理的第三项产品,也是最有产业化前景的产品,这项产品的问世也为倪光南研发“联想式汉卡”打下了坚实的基础。

倪光南曾说:“大型计算机的研制,我洒过汗水。国家级科研成果,我取得过。中科院重大科技成果奖,我也拿过数次。但遗憾的是,这些成果至今还躺在奖状上,一直没有成为产品。”

倪光南是一个科研工作者,但同时他还有长远的科技眼光。他知道那些躺在功劳簿上的科研成果并不能对社会发展产生作用,所以他想要让这些成果变成产品,这也成为了倪光南选择“下海”研发“联想式汉卡”的一个重要原因。