硬核科技:历史上著名的逆转秀“IBM Power5”
摘要: 2004年第二季,除了NVIDIA在NV40表演了一场华丽的逆转秀,那年的夏天,在高端服务器CPU市场更上演了一场空前绝后的「性能大屠杀」
2004年第二季,除了NVIDIA在NV40表演了一场华丽的逆转秀,那年的夏天,在高端服务器CPU市场更上演了一场空前绝后的「性能大屠杀」:蓝色巨人IBM在7月14日发布了采用用Power5(代号”Squadron”)处理器的服务器,包括双处理器的p5-520、四处理器的p5-550和16处理器的p5-570(当然后来又追加一堆机型,像「开放」的OpenPower720)。
IBM早在2003年的HotChips15初步公开Power5的技术概要,2003年底的Microprocessor Forum发布参数细节,大家也都很清楚Power5是以Power4为基础的延伸加强版。但世人万万没想到的是:结合同时多执行绪(SMT)和大翻修后的内存子系统,Power5的性能表现竟然会「剌么厉害」,把所有擂台上的竞争对手通通轰到了观众席。
博学的科科一定会很好奇:1999年底披露、2001年上市的Power4(代号”Regatta”),是电脑工业史上首颗原生双核心泛用CPU,不仅兼容了IBM所有的商用RISC指令集(RS/6000、AS/400、PowerPC),也有大量个人电脑无缘一亲芳泽的尖端技术,那为何Power5会如此令人感到震撼?
答案很简单:因为Power4的性能表现实在有点让人感到差强人意,并没有替当时的IBM带来明显的优势,而Power5横空出世的好戏,也清楚告诉大家Power4的弱点究竟在哪里,也充分彰显了后来x86处理器的几个重要的技术趋势。
首先,Power5导入同时多执行绪(SMT),每个处理器核心等同于2个逻辑处理器。科科们也许会马上反应:Intel的HyperThreading也不就这样吗?但IBM毕竟是那个领导电脑工业术10年的服务器王者,做出来的东西也绝非「区区个人电脑背景」的Intel AMD所能比拟,除了在AIX操作系统可「动态」启动关闭SMT模式,当无须第二条执行绪时,就将资源集中给单一执行绪(你的眼睛绝对没看错),更可借助分配「8个」指令解码器给2条执行绪,调控执行绪的性能优先权(你的眼睛还是没看错)。
相较于Intel在Pentium 4实做HyperThreading仅增加5%功能电路,为了充分提高性能,Power5比Power4整整多出了24%,如更充沛的实体暂存器档案等等。
其次,内存子系统更是Power5的重头戏,L3快取内存控制器直通处理器核心,变相成为L2的延伸,并整合了内存控制器,也提升了不同Power5芯片之间的总线(和多处理器延展性息息相关的快取资料一致性协定、和大型多处理器架构层面的改善项目,就不须在这里解释了)。2003年底Microprocessor Report那句“Power5 Tops On Bandwidth”标题,堪称最好的注脚。
大幅缩减的L3快取与内存延迟,有如激增性能的威而刚。
L3快取内存也通过多芯片封装跟处理器包在一起,整合度更高,也精简系统架构的复杂度。
从1964年的S/360为起点的IBM大型主机,其虚拟化领域的独门绝活,也陆续「下放」到Power体系,Power5具备微分割区(Micro-Partitioning),最多配置10个分割区,以1%为基本单位,可精细的设定每个分割区的资源比例与使用权限(别再怀疑了,你的眼睛没有问题),可将所有运算能量都砸在刀口上,毫无一丝一毫浪费。这些看似外星科技的特性,也一直存在于IBM的高端服务器并持续进化中。
好啦,前面扯了这么多,那Power5到底是厉害到什么程度?
在TPC-C公布的测试数据,16颗双核心Power5的p5-570,足以抗衡「64颗」Intel Itanium 2的HP Integrity SuperDome。SAP SD-2 Tier测试,8颗Power5胜过「32颗」Itanium 2和「36颗」Sun UltraSPARC IV。至于SPEC CPU,Power5一举创下浮点项目的历史新高,单核心性能更是Intel Itanium 2的「2倍」。更扯的还在后面,2004年11月的p5-595(32颗Power5),创下TPC-C世界纪录,性能相当于「二、三、四名的总和」,和同级产品相比,不是人家的2倍3倍,就是4倍5倍,甚至快要6倍。
简而言之,就是「1个核心打对方2个还有剩」的概念。同样拥有SMT和整合内存控制器,IBM和Intel/AMD相比,同样是肝药处方,相同提炼,做法不同,成本效果也不同,斯斯保肝... 呃,总之就是天差地远。
最后,那Power4的弱点是哪些?说穿了不外乎「布署庞大执行单元但使用效益不佳」和「内存子系统不够有力」,IBM就对症下药,在2004年的夏天,再次确立其服务器王者的地位。顺便讲一下,Power4的总工程师叫做Chuck Moore,后来跳槽到AMD主动并操刀推土机的研发... 然后?就没有然后了。
不过,想必科科们一定会好奇,像Power5这种各方面都强到夸张的高端服务器CPU,1颗大概要多少钱?笔者只能说,当年IBM的替料维修报价,Power5都是「10000美元为基本单位」起价,保证让你看到连科科笑都笑不出来,也难怪IBM Power10敢用外界质疑良率不佳的Samsung 7nm工艺了。
科技史