俄罗斯“芯”酸往事:从行业霸主到无人问津
集微网报道,环顾当今世界,CPU领域已形成由美国、中国、俄罗斯、日韩和欧盟构建的“一超多强”体系。但如果钩沉历史,苏联应曾是世界上微电子技术最强大国家之一,甚至一度领先美国。
然而,在苏联解体后,俄罗斯的经济衰退、政治不稳等局势,导致大量科研人才离境前往美国。其中,得益于俄罗斯的技术人才,英特尔迎来发展的黄金时代,从而成为CPU领头羊。
整体上,俄罗斯的CPU研发经历了“辉煌”、“动荡”、“难产”、“衰败”四个时代。如今,虽然俄罗斯仍在CPU领域奋力搏击,但以往风光无限的岁月注定一去不复返。
01 辉煌
1976年,正值冷战“铁幕时期”。由于承担了研制苏联超级电脑的重任,鲍里斯•巴贝扬的活动范围被局限在苏联境内。因此,酷爱登山的他只好埋头攻坚关键技术。
仅两年后,巴贝扬就率领团队研究出全世界第一台超标量计算机Elbrus-1。显而易见,这台计算机取名自苏联及欧洲最高峰——厄尔布鲁士(Elbrus)峰。
苏联研制Elbrus-1的主要目的是服务于开发飞弹系统、核武器和太空计划等军事工业。巴贝扬称,Elbrus-1采用的超标量处理器,在运行时会将连续的符号转换为并行符号加速执行。
而这一技术直到1993年才在IBM研发的PowerPC 601上得以应用。这意味着俄罗斯在该技术领域领先美国可达15年。
早在Elbrus-1的问世前,巴贝扬就因出色的计算机辅助设计工作被授予了“十月革命勋章”。Elbrus-1诞生后,巴贝扬接着领导第二代产品的设计开发工作。
Elbrus 2 CPU
1987年,Elbrus-2研制成功,不仅拥有超标量体系架构,而且还具备支持高级程序语言的新技术。这台计算机有10个处理器,每秒运算达1.25亿次。
鉴于对Elbrus-2及其乱序超标量体系架构的巨大贡献,巴贝扬当年获得政府颁发的“列宁勋章”。这是苏联当时的最高荣誉。
盛名之下,已年届54岁的巴贝扬并没有停止探索,并继续率队开发第三代Elbrus。他提出采用更新的超长指令字(VLIW)架构,即通过一个编译器来确保指令同时在不同的处理器上被执行。
值得注意,在巴贝扬开始研发Elbrus3时,苏联还完成了32位El-90微处理器设计。
这一项目的负责人弗拉基米尔·彭特科夫斯基。他在Elbrus研究小组中曾是巴贝扬下属。他参与了Elbrus-1与Elbrus-2计算机的研发,并主导开发了高级程序语言El-76。
1990年,El-90微处理器的原型问世。这一结构反映出把RISC和Elbrus-2结合在一起的设计思想,因而具有更强大的兼容性。
02 动荡
随着苏联的政治体制和经济体系遭遇剧变,Elbrus-3项目的研究经费突然中断。痛心之后,巴贝扬1992年成立了MCST公司,专注于VLIW架构的处理器Elbrus 2000(E2K)的开发。
面对美国企业纷纷找上门,巴贝扬一概拒绝。但他却答应了Sun公司创始人Scott McNealy的合作请求。因为在苏联解体前的1989年,他已经来“拜访”了巴贝扬。
1992年,MCST与Sun公司在莫斯科联合建立了SPARC技术中心,共同研发处理器架构、操作系统、编译器与多媒体函式库。而这促成了Sun后来在处理器上的快速崛起。
不过,在苏联政局动荡下,彭特科夫斯基选择了移民美国。1993年,凭借强大实力以及把许多Elbrus小组开发的先进技术带到了英特尔,彭特科夫斯基晋升为英特尔CPU首席工程师。
弗拉基米尔·彭特科夫斯基
随后,他开始主导PentiumIIl的架构研发,其中的重点就是新增SSE指令集及改善微架构。然而,Pentium III处理器的几大特色几乎都与El-90微处理器的特征相同。
其中包括:每个时钟周期可以执行两条指令的超标量体系结构;支持两路多重处理、排错;具有支线推算,高性能的管线浮点单元,以及充足的高速缓冲存储器。
另外,1995年英特尔推出了结构更优的Pentium Pro微处理器,而新增的主要特点几乎都是彭特科夫斯基在苏联积累的技能,包括改进的x86指令解码器单元和超标量体系结构,推测执行以及无序执行等。
基于此,曾有人推断Pentium就是以Pentkovski的名字命名。其实彭特科夫斯基到美国后,Elbrus团队一直都不知道他到底在做什么。直到1999年,他的名字才出现在一本技术刊物上。
在技术来源问题上,巴贝扬也曾直言,英特尔的Pentium Pro微处理器与俄罗斯超标量体系结构的变体非常相似。“英特尔是第一家采用超标量结构技术的公司,并在后来迎来自己的黄金时代,成为西方世界领头羊。”
03 难产
九十年代中后期,MCST公司面临人才流失、经费短缺和项目停滞等众多困难。所幸的是,最核心的几位科学家留了下来,从而使项目研发得以延续。
对此,巴贝扬率团队攻坚克难,并于1999年成功研制Elbrus 2000的处理器E2K。
该CPU可能同时执行Elbrus VLIW和英特尔x86代码,每一时钟周期可以执行24条指令,仅凭1.2GHz的工作频率就能带来10.2GFLOP/s的运算性能。
这一速度是当时英特尔正准备发布的Itanium(安腾)服务器芯片的三倍。
虽然E2K凭借不可思议的超高效能、超小芯片面积与超低功耗等轰动了业界,但俄罗斯投资者却因为电子设备开发风险大,而不愿意投资MCST公司。
为了解决经费及融资问题,巴贝扬在开曼群岛注册了Elbrus国际,同时宣称他们需要6000万美元和3年时间才能完成最终设计,如果只做缩水版处理器则需要500万到1000万美元。
在四处寻找资金支持者或客户时,巴贝扬还让MCST为各种美国公司编写程序。但他没有把所得利润用于扩大编程业务,而是投入处理器的研制。
鲍里斯•巴贝扬
在巴贝扬看来,处理器是更有价值的东西。“我们比很多美国人更了解微处理器市场”。俄罗斯技术的拥护者为大胆的梦想喝彩,也可能在技术领域取得突破性成就。
后来,巴贝扬一度在普京身上看到了希望。
2000年6月,普京在上台三个月后就批准了《国家信息安全学说》,提出重点开发的关键技术包括:高性能计算机技术、智能化技术和信息攻击与防护技术等。
俄罗斯的高调引起了西方关注。当时美国加州的著名半导体杂志《微处理器报告》,曾做了一篇叫《The Russians Are Coming》的报道深度介绍了Elbrus 2000处理器的各项黑科技。
04 衰败
面对来自俄罗斯的竞争,美国科技企业很快开始行动。2002年,英特尔和惠普联合研发Itanium 2处理器,代号“McKinley(麦金利)”。
虽然表示Elbrus比麦金利更好,但时移势易,巴贝扬认为“要做到世界第一,就要走出去”。于是,在Elbrus 2000成功落地的2004年,他决定和E2K团队一起加入英特尔。
巴贝扬在英特尔担任的职位是软件和服务部门架构总监,以及英特尔莫斯科研发中心的微处理器研发主管。另外,他还是第二位获得英特尔院士称号的欧洲人。
与此同时,英特尔收购了MCST的超标量处理器相关知识产权,进一步巩固了在处理器行业的地位。
此后,俄罗斯的处理器研发几乎一蹶不振。在政策推动下,MCST推出了一系列Elbrus处理器的进阶版,但这些处理器一直在“吃老本”,并逐步落后西方。
直到2012年,俄政府开始对微电子产业大力扶持,制定了《2013-2025年电子工业发展规划》和《国防工业综合体发展规划》等产业发展战略。其中对计算机设备等优先支持的子项目,下拨预算总额达1700亿卢布。
紧接着,俄政府对微电子产业也做了不少努力,包括尽可能采购国产电子产品,开发CPU民用和军用条线,全面发力Elbrus2000、SPARC、MIPS三大架构,以及研发“贝加尔”芯片。
基于此,2015年MCST推出了号称俄有史以来技术水平最高的国产处理器——Elbrus-4C,可比肩英特尔i3和i5(2009年发布)。该芯片采用65纳米,包含4个核心,工作频率800MHz。
Elbrus-16C处理器
2020年10月,MCST又公布了旗下最新款CPU——Elbrus-16C。这款处理器采用第六代VLIW指令集架构打造,由120亿个晶体管组成,设计为16核、2GHz频率,制造工艺是16纳米。
显然,目前俄罗斯能研发的最顶尖处理器也已经比较落后。这一切,年近九旬的巴贝扬自然看在眼里。虽然至今仍没有退休,还有很多项目计划去做,但他已不再回来。
结语
时下关于计算机处理器架构的主流历史,都在宣扬CPU核心技术源自美国。但鲜有人知道,英特尔早期处理器的核心技术,或多或少来自于苏联Elbrus超级计算机的工程师。
俄罗斯处理器专家基思·迪芬多夫曾说,“超标量体系结构、共享存储多重处理技术和EPIC技术等概念,在西方出现之前很久,Elbrus就已经成功开发出了基于这些技术的电脑。”
然而,风光辉煌之后,俄罗斯CPU技术衰落的原因或许更值得探讨。其中既有俄罗斯忽视计算机科技民用和商用化原因,也有其政治经济不稳,以及产业发展滞后等因素。
在当前国际形势下,如果从国家安全角度考量:一旦俄罗斯处理器技术受制于人,将在国际竞争和对抗中处于非常不利的地位。虽然仍有一定“基底”,但俄罗斯已难以扭转这一被动局面。


观测生成的随机数列顺利通过了SP800-22标。 图源:论文《Physical publicly verifiable randomness from pulsars》
借助宇宙天体来获取随机数,这是通过物理现象获得随机数的方式之一,与骰子、扑克一样,脉冲星或可以被称为一个物理性随机数生成器。研究团队在论文开篇就强调了这一点。而在脉冲星与随机数产生关联的背面则是另一场担忧。
随机性通常被认为是安全、隐私、信任以及公平的基础。一旦随机数的生成机制被攻破,任何加密方法也会显得不堪一击。
几年前,美国爱荷华州彩票公司被曝出一位负责曾负责设计和维护计算机摇奖机的安全部门主管在近十年间依靠篡改摇奖机程序,购买彩票非法领取奖金超过200美金。这其中的「计算机摇奖机」,就是一个用于生成彩票号码的随机数生成器。
纪录片《The Importance of Being E.R.N.I.E.》片段
在这种局面下,PVR协议(可公开验证的随机性)作为当下面临多方环境的解决方法出现,当前最先进的 PVR 系统往往建立在被认为普通算力难以解决的数学问题之上,比如分解大整数或者寻找离散对数。但随着超级计算机的算力在近几十年的飞跃式增长,随机数生成器的规律被找到已经从天方夜谭变成隐忧。在超级计算机之后,在算力上对前者来说无异于降维打击的量子计算机正在入场。
“只要是基于数论,一切对于量子计算机来说就不成问题。”
随机数的真伪之争
基于真实的物理世界,或者基于计算机与数学模型,两者将随机数划分出“真伪”。
伪随机数指的是生成于计算机内部的随机数,比如下面这个谷歌所提供的伪随机数生成器。
图源:Google
在这个体系内,来自计算机主板上的定时或计数器在内存中的记数值被选定为“种子”,作为让这个运算开始并产生随机数列的第一块多米诺骨牌。但这里的问题在于,生成随机数列的递推公式是可预见的,这意味着当输入的随机数种子相同,其所输出的随机数列会对应一致,这种随机伴随着一种紧密的映射关系。
真随机数则指的是物理世界中出现的随机数。与伪随机数生成器相比,真随机数生成器需要满足一层凌驾于算法实现的要求——不可复现。即当生成器接收到两次相同的输入操作,也仍然会生成两组不相同的随机序列。
骰子是我们最容易理解的真随机数发生器之一。如果粗糙的将“投掷骰子”作为一个相同的输入值,连续投掷十次为一个随机序列,一个人投掷三组(大概率)会得到三组不同的随机序列,这既是不可复现。
物理世界中,利用原子的热运动是寻找真随机数的可靠方法之一。
图源:Google
温度高于绝对零度的原子都存在热运动,这些热运动的副产品之一,是其会在电路中产生噪声。噪声会引发电路中的电压产生微弱波动,CPU里内置的真随机数生成器就是通过放大这些电路中的热噪音来产生随机数。
相比完全基于算法的伪随机数生成器,真随机数生成器所处的物理环境更加复杂,涉及的变量更多,这导致其具有更优越的随机性。但即使如此,在经典力学的范围内,只要所有变量的初始状态确定,这个系统其实依然在按照一种确定性的原理运行,由此而得出的随机序列自然也是可以预测的。
换句话说,基于热噪声的随机数发生器被从“伪”随机数中区分出来,很大程度上是因为这个综合的“输入值”太难测量了,这仍然不是最理想的随机序列。以最严苛的假设环境来看,最理想的真随机数生成器只能在经典物理之外具有内禀随机性的量子力学中去找。
另一层意义:跨越PVR
从这个角度上来看,当人类能够完全掌握脉冲星的天体特性,后者理论上也不会是完美的真随机数发生器,而这又不免走向了拉普拉斯的决定论——如果在这一刻,你知道宇宙中所有基本粒子的位置和速度,你就知道了宇宙的所有的将发生的事情。
拉普拉斯
因此,研究团队对于用脉冲星来捕获随机数满足了通过了NSP800之外,有另一层更现实的考虑。研究团队试图利用遥远的脉冲星来完全跨越PVR的协议标准,脉冲星或许是最简单直白的可公开验证的随机数生成器。
随机数产生中的「可公开验证的随机性」可以被分为五方面的要求:
可得性:没有任何一方可以封锁信号源,并且任何人都可以在任何时间使用这个信号源。
不可预测性:没有任何一方可以预测未来的随机序列。
不可变性:没有任何一方可以影响未来的随机序列。
可公开验证性:任何一方都可以核对已经生成的随机序列的正确性。
无第三方:不需要另外的可信服务器来启动或管理随机数生成器。
之前已经提及,脉冲星单次脉冲通量密度无法预测,并且地球上的研究者都无法对几百亿光年外的脉冲星产生影响或者遮蔽脉冲信号。于是最重要的一点就落在其中的「可公开验证性」上。
研究团队在测试试验中设置了另一颗脉冲星PSR J0953+ 0755,这颗脉冲星就是为了验证「可公开验证性」,即同一个随机数生成器上生成的同一段随机数列,是否可以由两台观测设备在不同方位得出。与帕克斯天文台形成参照的另一台射电望远镜,则是8000公里外,位于中国贵州的天眼FAST。
从实验结果来看,同一时刻的两台射电望远镜指向了相近的观测结果。
帕克斯天文台(上)与“中国天眼”FAST对于脉冲星PSR J0953+ 0755的脉冲信号观测结果。图源:论文《Physical publicly verifiable randomness from pulsars》
从1964年冯·诺依曼发明了平方取中法开始,人类在寻找随机序列时先选定一个随机数种子,再经过复杂算法生成数列的逻辑就没有变过。到了1997年,来自硅谷的一个团队发明了LavaRand——一款硬件随机数生成器,与之前依靠计算机的逻辑不同,LavaRand用一个网络摄像头来对着熔岩灯拍照。从摄像头中过来的图片数据是一个真实的熵源,可以以165kb/s的速率生成随机数,随机数生成器开始接入真实的物理世界。
统计学家 Francis Galton在1890年的《Nature》杂志中表达了对骰子的钟爱,「在所有的产生随机数的事物中,没有什么能够比骰子更加优越了」。
统计学家 Francis Galton在1890年的《Nature》上的文章
“当它们在容器中不断地摇晃,互相碰撞,与容器壁剧烈的相抵,它们在容器中的样子是完全不可预见的,此时再摇晃一下,一切又重新打乱。”
130年之后,对宇宙的探索不断带来新的启发,人类第一次将寻找完美骰子的目光聚焦到脉冲星上。此次的研究表明,即使通过研究单一的可观测特性,已经可以为随机序列的研究提供了很多选择。未来研究团队可能会尝试改变观测的目标特性,将到达时间抖动(arrival time jitter)、噪音等其他脉冲星的特性也纳入测试。
这个无垠的骰盅里,透进的光亮还太少,因此每一次主动发起的探索都格外迷人。
参考资料:Physical publicly verifiable randomness from pulsars


