随着推出M1 Pro与M1 Max,苹果依旧在无拘无束的封闭花园内,把最简单的事做到最完美的「暴力美学」,贯彻到两颗巨无霸系统芯片。
如果说一年前M1只有让人印象深刻的惊人单执行绪效率,今年M1 Pro与M1 Max则告诉世人,苹果如何「硬干」出M1的巨型横向扩张版,并靠看似用不完的大量存储器理论频宽,支撑超出两倍现行x86笔电处理器的多线程浮点运算效能。论能耗比,大概也没啥好比较的空间了。 苹果为何可在M1 Pro和M1 Max做到这些事,就不得不追溯苹果自研芯片研发团队的起源:P.A Semi与Intrinsity了。了解这两家公司的背景和专长,就不难预期苹果今日成就与未来想干的大事。毕竟苹果从来不公开技术细节,也从不参加处理器业界学术交流活动(如ISSCC和HotChips),要推敲苹果干了啥好事的线索,也就只剩下被并购的公司了。 2008年4月,苹果以2.78亿美元收购某无晶圆厂芯片设计公司,听说不小心得到150名天才工程师。 公司名叫P.A. Semi,创立于2003年,位于美国加州Santa Clara,由曾在2003年获颁IEEE Solid State Circuits Award的芯片设计大师Daniel W. Dobberpuhl成立。 Daniel W. Dobberpuhl在1976年加盟DEC,参与过1980年代这家公司最成功的产品MicroVAX,也历经过对后世影响深远的DEC Alpha 21064与StrongARM。随着StrongARM从DEC移转给英特尔,Daniel W. Dobberpuhl创立SiBytes,专注MIPS指令集的高速网络处理器,2000年被博通并购。Daniel W. Dobberpuhl于2019年10月26日辞世,享年74岁。 今日苹果A系列与M系列处理器之所以有今天表现与地位,除了封闭性生态系统带来的先天「不对称」优势,P.A. Semi团队绝对厥功至伟。 ▲ Daniel W. Dobberpuhl。 值得一提的是,同样待过DEC并参与Alpha 21164和21264的「处理器游侠」吉姆·凯勒(Jim Keller)于1999年入职SiBytes,接着在博通担任首席架构师,又在2004年转战P.A. Semi任职工程副总裁。他在Daniel W. Dobberpuhl领导下,累积低功耗RISC处理器的丰富经验,直到2008年P.A. Semi被苹果并购,也仍留在苹果服务了不短时日,参与了A4和A5研发。 ▲ Jim Keller。(Source:视频截图) P.A. Semi当时研发名为PWRficient的产品线,顾名思义,就是追求极致能耗比的处理器。总计分成三部分:兼容PowerPC指令集的PA6T核心、CONEXIUM芯片内连结架构、ENVOI I/O子系统。后来苹果自研处理器的诸多特色,或多或少都可在PWRficient摸索到踪迹,也可从遗产判断苹果自家芯片未来的可能方向。基本上,笔者只能说M1 Pro / Max问世,就是开花结果的时刻,即使相隔超过12年,实在有点漫长。 PA6T核心在时钟频率为2GHz时,最高功耗不超过7W,1.5GHz时更低至4W,双核心PA6T-1692M在2GHz时,整颗标准功耗仅13W,最高也不超过25W。相较同时期衍生自服务器应用的IBM PowerPC(如PowerPC 970家族),无论同频率效能(SPEC CPU 2000)和能耗比,均享有压倒性优势,P.A. Semi也不搞大型化多层快取内存「金字塔」。 省电归省电,PA6T仍是货真价实的多指令派发、非循序执行的高效能微架构,浮点运算性能尤其出色,约为同频率IBM PowerPC 970的「两倍」(别忘了PowerPC 970源自Power4)。因此当时不乏苹果将用P.A. Semi产品取代IBM和Motorola的传言。 不过乔布斯却在2005年选择了英特尔。假使苹果当年直接用P.A. Semi芯片打造MacBook Air,而不是「连根拔起」转进英特尔,那计算机工业界的历史,恐怕就会重新改写,最起码IBM的Power Everywhere看来不会变成幻梦一场。 但这并不代表苹果不重视P.A. Semi的价值(要不然也不会花钱并购了),P.A. Semi也并非如外界刻板印象,只想做低功耗的低端产品。反之,P.A. Semi PWRficient一开始就放眼各式各样应用,并具备强大的多核心延展性。据已知资料,PWRficient将有16核版。 服务器也是P.A. Semi锁定的目标。换言之,P.A. Semi的目标可归纳为一条公式:StrongARM的低功耗+Alpha等级的高效能+PowerPC指令集兼容性,都是当时最重要的指标。 不过苹果收购P.A. Semi后也非一帆风顺,虽然接收150名天才工程师,但Dan Dobberpuhl与数名重要的工程师,因对两家公司的整合方式与股票奖励制度不满,2009年底先后离开苹果,一起创立了Agnilux,不到一年就被Google买走。这次Daniel W. Dobberpuhl并没有跟着进入Google,而成为机器视觉厂商Movidius的董事会主席,而Movidius则在2016年成为英特尔的一部分。 最佳化的电路设计:Intrinsity 苹果吃掉P.A. Semi后,却迟迟看不到自家芯片,甚至独创核心微架构问世,他们该怎么办? 苹果2010年4月发布首款自研处理器A4(APL0398,iPhone 4的处理器),衍生自三星S5PC110A01,最主要的差别在于GPU换成苹果长期偏好的PowerVR SGX系列,但完全一模一样的ARM Cortex-A8核心却大有来头,因得到Intrinsity公司的技术加持,延续和三星合作「Hummingbird」的成果, 时钟频率从ARM公版的650MHz一举推进到1GHz大关。 成立于1999年、设立在美国德州奥斯汀的Intrinsity,强项在优化Wave Pipeline(无锁存流水线)电路设计,命名为FastMATH。当苹果认知到这家公司的重要性后,就马上出手收入囊中,但过程却极度低调,连确切时间和收购金额都无人知悉(据说是5千万美元,但也有其他版本)。唯一可确定的是,苹果目的非常明确,就是为了A4处理器。接着出自P.A. Semi团队的独特微架构Swift,就在2012年9月A6堂堂登场,开启Apple Silicon之路。 Intrinsity人数就没P.A. Semi那么多了:22名业界老兵。 Intrinsity的FastMATH最有名成功案例,是超低功耗的MIPS32指令集处理器,频率2GHz时只有4W,1GHz时更只有1.5W。苹果得到Intrinsity后,更让从P.A. Semi获得的深厚功力提升更高。如何将特殊电路设计技术有效用到台积电最新制程,也是Intrinsity厉害的地方。 Apple Silicon的下一步? 看到这里,想必各位一定会好奇,稳扎稳打、持续推陈出新的Ax与Mx之外,苹果下一步会踏入哪些新领域呢?坦白讲,目前看不出来。但我们有充分理由相信,在商言商,苹果不太可能重回品牌服务器与存储设备市场(很久以前的Xserve和Xserve RAID),就算要打造服务器等级处理器,也是关起门来自己用,顶多像Google和AWS出租云端CPU,这不太像近期会成真的可能性。 话说回来,Apple Silicon效能表现看起来再好再威,影响范围也只限苹果生态圈和用户,会不会真的让微软危机起来,还得好好观察。简单结构的延展性:P.A. Semi