专访美国超微公司(AMD.US)首席技术官:CPU升级周期

© Reuters.

本文来自“腾讯科技”

在异常忙碌的2019年背后,芯片巨头美国超微公司(AMD.US)正获得更多市场份额,现在它是许多CPU细分市场上高性能产品的领先者。该公司不仅自家产品表现出色,而且在其主要竞争对手所面临的制造和生产问题方面也表现上佳,这意味着美国超微公司(以下简称AMD)已经成熟,可以通过大量的胜利来拓展边界、获得市场份额和建立声望。

2019年,AMD推出的Ryzen 3000 CPU和EPYC Roman CPU都采用了基于台积电7 nm工艺的新Zen 2微架构,如果两家公司没有在高性能产品方面进行深度合作优化,这是不可能实现的。AMD也在与企业原始设备制造商(OEM)建立亲密关系方面取得长足进步。AMD首席技术官马克·佩珀马斯特(Mark Papermaster)日前接受专访,谈及该公司新品发布时间表和未来产品,与台积电和三星(SSNGY.US)的合作伙伴关系,推动建立行业标准等。

以下为采访摘要:

关于AMD发布时间表与未来产品

问:到目前为止,AMD的新产品几乎每年都在增加新的内核。其路线图显示Zen 3几乎准备就绪,Zen 4正在开发中,Zen 5更进一步。这种节奏可持续吗?

佩珀马斯特:我们正处于12-18个月的发布节奏中,我们相信这是可持续的。这也是业界对我们的要求。

问:AMD最近取得的成功,比如增加关键领域的市场份额和推动审查,是给你们提供更好的机会来加快发布节奏,雇佣更多的员工,还是不可避免地会导致新想法的形成,从而减缓发展速度?

佩珀马斯特:我们所处的位置有其自然的节奏,我们有多个设计和执行团队参与其中。当一支队伍完成自己的工作时,另一支队伍就会立即接手。你知道,我认为这种节奏非常适合我们,因为在某些市场,你对每年都会有新产品的期望正逐渐增加,比如智能手机。在这样的市场,你必须抓住每年的假日季,几乎每次更新都要增加新的内核,在很大程度上,他们可以做到这一点。但是每年都需要在同一时间完成任务,这就意味着可能还会有些核心任务需要加速完成,而这将会发生在每一次迭代中。因此,我们相信,我们正走在正确的轨道上,以便向客户交付高性能的产品,这是我们帮助AMD复兴的基础。

问:你能谈谈Zen 4及其之后的路线图制定情况吗?通常,当我们谈到这些路线图,即今后3年至5年或7年的路线图时,公司的规模往往决定了长期愿景。在过去的几年里,AMD在推广其三年时间跨度路线图方面相当积极。

佩珀马斯特:我们公开分享的当前路线图,展示了我们的轨迹和我们为开发当前这一代技术正在做的事情,但也显示了其后的路线图线索。你知道,我们有团队着眼于几年之后的愿景,但我们并未真正公开谈论我们对那时的预期。与我们几年前的做法相比,AMD最大的变化是我们有多个不断跨越的设计团队,这有助于我们在12到18个月的周期内持续保持创新过程,花时间确保我们提出的硬件具有合适的性能。如果由于产品上市时间的限制,我们必须完成设计,那么不适合这个窗口实现的想法就会直接进入下一代设计中。

问:最近对AMD高管进行采访时,他们将当前的路线图描述为“钟摆模式”(tick-tock model),即基于英特尔过去十年的运营模式,你对这种说法有同感吗?

佩珀马斯特:我不知道你提到的那次采访,但我要说的是,我们并未采用“钟摆模式”。我们正在做的是研究每一代CPU,并将已经存在的、最好的进程变量与正确的IPC(CPU在每时钟周期内所执行的指令数量)改进集、内存层次结构以及我们可以放在其中的所有东西结合在一起。我们致力于保持每一代CPU都能以最好的速度进步,这是个对我们AMD很有效的公式。

问:我们是否应该期待Zen 2会有更新,就像Zen 2+或Zen 1那样?

佩珀马斯特:我对当前设计的任何更新没有什么可说的,但我们总是关注它在哪里有意义,在哪里我们能够抓住机会在性能、功率或芯片面积等方面加以改进。

IPC和性能提升

问:在最近的财报电话会议上,苏姿丰(AMD总裁兼首席执行官)提到,AMD的发展并不总是依赖于从台积电获得最好的工艺节点优势,随着时间的推移,你们公司将推动架构改进。为了推动领导层支持这两代技术更迭并进入Zen 2及以后的时代,你始终在积极推动微体系结构IPC性能提升,随着我们进入内核数量增加、回报递减的时代,这本身是否可持续?

佩珀马斯特:所以很明显,业界已经想好了如何利用不断增加的内核。作为CPU供应商,你必须对此进行管理,因为你不能以比软件所能利用它的速度更快地增加内核数量!但我们显然在CPU和GPU上增加了更多的引擎,这些特定的硬件引擎仍将是未来的一股力量。现在显然必须在内存和IO之间取得平衡,我们必须能够提供一个平衡的系统。在AMD,我们非常清楚这一点,这也是我们将继续做的事情。

问:推动新一代硬件,特别是处理器体系结构的一件事是对ISA和新指令的改进。但是,由于我们也看到特定的加速器被捆绑在套餐上,还有额外的安全硬件等等,AMD将如何推动该行业向前发展?

佩珀马斯特:如果你看看我们今天的芯片,会发现我们有很多专门的功能。每个AMD芯片都有一个PSP,即平台安全处理器,如你所知,它是我们硅片中的一个独立处理器,用于信任根并提供安全服务。我们的内核中也有专为特定数学功能而设计的加速器。我们还有大量的DSP,我们的笔记本芯片已经拥有并将拥有这些DSP,我们的客户端处理器将在那里安装音频处理器。因此,在硅片上安装加速器或特殊功能,或者甚至可以作为芯片,这是一个“什么时候有意义”的问题。我们在各个细分市场的芯片体系结构中都处于领先地位,因此我们明白,在需要模块或芯片之前,让某些东西保持离散状态或对其进行评估是有意义的。

问:AMD非常自豪今天通过Zen 2在台式机上拥有IPC性能优势,但我们继续看到英特尔突破新ISA指令的界限,例如矢量指令或bfloat16,因为英特尔必须迎合那些边缘情况和真正想要特定功能的客户需求。AMD在过去取得了很大的成功,例如推动了64位x86标准。我们能看到AMD成为定义未来x86指令标准的幕后推手吗?

佩珀马斯特:我们继续关注设计的方方面面。如果你看到我们通过Zen处理器系列和内存加密带来的安全创新,会发现我们推动的功能不需要新的扩展,因为它是在幕后进行的,也不需要驱动一组软件进行修改。因此,我们着眼于能够让最终客户受益的创新,其中有些创新确实需要延期,因此我们将继续关注这一点。从x86的整体观点来看,我们总是在寻找些推动广泛采用的扩展,如果发生这种情况,我们会将其包括在内。

问:在讨论新硬件时,大家最喜欢的话题是增加IPC。对于Zen 2,我们看到IPC比上一代有了非常好的提升(15%)。最近我们听到弗瑞斯特·诺罗德(Forrest Norrod)(AMD数据中心高级副总裁)谈到Zen 3,因为我们应该会看到IPC再次出现非常典型的提升,在Zen 2的基础上又进行了一次阶梯式的改进。你认为AMD会继续这样的改进吗?

佩珀马斯特:根据我们的路线图,正如你所知,我不会详细介绍未来几代更新的IPC提升情况,但我们正在推动一个高性能计算模型,每次迭代都将带来性能改进。这一切都是关于为我们的内核设计选择正确的IPC改进集,以及正确的工艺节点和设计规则。当我们设计我们的内核时,总是需要取得平衡,以便将功率和效率相匹配,在AMD,我们仍然期望超过行业标准。我们以前说过,业内单线程性能的年增长率只有7%,而我们的目标是每一代产品都要超越这一速度。我们最近的产品比业界执行得更好,也超出了业界的预期。

问:随着内核性能的提高,会给内核内部的缓存带来额外压力。AMD在缓存大小和延迟方面做得很好,比如当前设计中的大型L2。我们现在面临的情况是,你们的主要竞争对手将其一级缓存大小增加了50%,以换取内核核心的延迟增加25%,这让我们大吃一惊。你能谈谈AMD的缓存设计势头吗?你对此有何看法?

佩珀马斯特:如你所见,我们从第一代到第二代Zen设计改善了我们的内存层次结构和相关的延迟。我们关注这一点,我不打算预先宣布Zen 3如何改进,但是缓存设计是我们谈论的整体IPC提升的一部分,也是我们关注每次迭代性能改进的一部分。当然,延迟对我们的客户很重要。

问:自APU Kaveri以来,AMD始终在传递的关键营销信息之一是实现25x20的目标:即到2020年底,使其2016年款产品的性能提高25倍。我们一直在密切关注这一目标,而且看起来AMD还有很长的路要走。你对此有何评论?

佩珀马斯特:事实上,我对我们的团队如何围绕这个目标团结起来感到非常兴奋。我们的工程师实际上把它称为目标,但它最初根本不是一个营销信息。他们利用它作为激励因素,推动笔记本电脑的所有设计和工艺方面的优势进入每次迭代中。的确,我们对我们取得的进展感到兴奋,如果你看看我们推出的第二代Ryzen Mobile,我认为你看到的是在电池续航时间和性能方面的出色改进。然后,你必须看一看与微软在Surface Laptop 3上建立的深度合作伙伴关系,这使得更紧密的软件和硬件合作伙伴关系得以实现,这不仅有利于微软,也有利于Windows生态系统。这种合作关系使得AMD的所有移动产品与Windows的电源管理更加紧密。

封装高带宽存储器和半定制设计

问:我们是否处于处理器需要封装高带宽内存的时间点?我们看到内存通道数量在增加,内存频率也在增加,我们已经从DDR3过渡到DDR4,并在未来转向DDR5,但仍有一部分市场希望高带宽内存尽可能靠近处理器。

佩珀马斯特:没错,我们在这个领域已经努力了很多年。我们在AMD率先将HBM带到GPU上,即硅内插器上使用2.5D封装技术。关键在于为工作负载获得合适的内存解决方案,而且你还必须达到合适的性价比目标。这是个微妙的平衡,你必须为每一种产品考虑这种平衡。在高性能GPU计算中,HBM是必须的,你可以在我们的MI路线图上看到这一点。在其他时候,我们总是着眼于正确的解决方案,GDDR和DDR都有正在执行的伟大路线图,我们已经成功地利用了这些技术。我们将继续进行同样的工作,查看我们的每一款产品,询问行业的发展方向,每种产品的工作负载要求是什么,以及每种内存解决方案的成本/性能指标是什么。

问:我们已经看到许多客户按照AMD路线图使用你们的CPU和APU实现了GDDR,例如使用小霸王游戏机和其他类似游戏机上的芯片。如果HPC客户要求在CPU封装上使用HBM,你们会考虑这一点吗?

佩珀马斯特:对于我们这样的半定制业务,当客户有大量机会并希望深入合作以利用我们拥有的构建块时,如果这对涉及的两家公司都是个很好的机会,我们就会创建一个半定制解决方案。当这些机会出现时,我们将继续分析它们。

问:合作伙伴投资半定制芯片需要什么水平的投资?我知道这是个非常宽泛的问题,但我们正在努力理解某些公司必须投资多少才能获得半定制设计,是几百万,还是几千万?当然,只希望出5万美元的人不会获得半定制设计。

佩珀马斯特:不幸的是,我无法回答这个问题。我们现有的这些类型的协议是保密的。不过你说得对,超过5万美元!如你所知,如果你想在这些设计上处于领先地位,仅仅制作模具就可能耗资数百万美元。

问:从我们的角度来看,很难从这些协议中辨别出合作伙伴投入的金额,以及与AMD投入的资金进行对比:如果这是一个独特的设计,并且AMD认为合作伙伴以外的人也对该设计感兴趣,那么合作伙伴是否也能获得一笔好交易,或者所有费用都由合作伙伴承担?这意味着如果他们为所有这些提供资金,他们将不得不卖出100万到200万台才能实现收支平衡,这似乎是不可行的。

佩珀马斯特:我不能说太多,但我知道你的意思。我们的半定制协议,即使我们只是在硬件上合作,或者它是整个堆栈,最终都是保密的,这取决于客户想说什么。我所能说的是,我们的半定制模式是灵活的、成功的,也是AMD产品的关键部分。

计算快速链接(CXL)联盟

问:AMD现在是CXL联盟的成员,尽管它也是市场上几乎所有互连标准的成员,而且在过去,AMD始终在推动CCIX。CXL与PCIe 5.0有着紧密的联系,那么你能谈谈AMD对这些新互联的期望和部署吗?

佩珀马斯特:正如你所知道的,AMD的支持者需要我们与行业保持一致,特别是在IO和加速器的共同标准方面。你说的完全正确,我们加入了CCIX,我们在那里一直很活跃。但我们在几乎所有我们参与的组织中都很活跃。我们加入了CXL,我们相信这实际上是个非常强大的、利用PCIe 5.0的联盟。我们也是PCIe开发工作的有力参与者,因此这与我们的战略相一致,即利用PCIe BYT还能够通过联盟制定更低延迟的互连标准,这是行业推动一致性和利用PCIe基础的最佳方式。这就是推动PHY(物理层)开发的原因,这可能是一笔巨大的开支,但与标准PCIe相比,作为这些标准的一部分,无论是作为加速测试还是内存测试,这都有助于我们摊销这些成本。因此,我们认为这是个很好的举措,我确实认为它在行业中的势头正在增强。

问:你是否希望CXL在其生命周期内广泛与PCIe保持一致?

佩珀马斯特:对此我们拭目以待,并时刻关注这个领域。从历史上看,这些类型的联盟通常是从一个更大的标准委员会中脱颖而出的,它们过去已经是一个更广泛的标准委员会,但现在这样称呼CXL还为时过早。

问:对CXL路线图的一个担忧在于,将来它可能会有仅支持CXL的加速器,如仅支持CXL的显卡和CPU,不支持PCIe 5.0,你对此有何看法?

佩珀马斯特:很高兴知道这一点,但我不认为会发生这种情况。任何符合CXL标准的设备也将符合PCIe标准(实际上需要PCIe合作才能启动协议),因此任何额外的限制都是特定于供应商的。但我们认为这不会发生。

频率与摩尔定律

问:当转移到设计类似内核的更先进工艺节点时,其中一个问题是由于电流密度造成的频率损失。当AMD转到台积电的7 nm工艺时,该公司发出了警告,说它如何能够保持与Global Foundries的14 nm/12 nm设计的频率对等。与前几代Ryzen相比,你甚至把这些频率推得更高了。在行业的其他地方,我们看到在最新的工艺节点上保持频率奇偶校验很困难。因此,即使PPA(功率、性能、面积)整体上有所改善,AMD如何为未来的工艺节点解决这个问题?AMD有没有考虑其他因素?

佩珀马斯特:我认为当你看所有关于摩尔定律的评论时,你会看到我们都知道并喜欢的旧摩尔定律几乎是普遍一致的,在每一代更迭中都有频率提高的情况,以及伴随着频率改善而来的功率和面积的优势。在这个新领域,摩尔定律并非过时,而是不同于旧的摩尔定律。现在已经有了某种程度的普遍一致性,因为频率已经不会随着每个后续节点的变化而调整,我认为我们行业中的大多数人都接受这一点。

在AMD,这意味着我们要制定自己的计划,这样我们就可以从整体上看待我们必须提高业绩的所有杠杆。这就是我们在芯片方法上保持创新的原因,我们将其应用到有意义的地方。这就是我们对内存层次结构进行创新的原因,正如我已经提到的,仔细选择我们为特定工作负载部署的正确内存类型。正是我们已经采用这种整体系统的方法,并在我们前进的过程中不断加以补充,以确保即使在我们所处的摩尔定律的新时代,我们也可以继续这一努力。

新一代Infinity Fabric

问:AMD的Infinity Fabric(IF)是AMD推动其产品之间进行可伸缩性消息传递的关键部分,AMD研究员确实乐于谈论这一点。当我们转向新的、更快的连接标准(如PCIe 5.0甚至PCIe 6.0)时,是否会跟上带宽增长的步伐,或者仅仅是在互联方面就会耗尽电力预算?

佩珀马斯特:你标记的内容不仅是Infinity Fabric(这是AMD的协议,也是我们芯片方法的关键)的关注点,还有我们整个路线图的灵活性和模块化,以便将我们的最新一代知识产权应用到我们服务的所有细分市场。因此,我们为每一代产品递增并设计新版本的IF是有原因的,事实上,这是不断增长带宽并保持整个系统优化所需的创新。你还必须对芯片外驱动的IO和互连执行相同的操作,如PCIe和所有这些SERDES链路,它们需要同样的创新。我认为你正在看到我们的设计方法在逻辑和SERDES上所做的大量工作,无论是长距离实现还是短距离实现。

问:对于每一代新的Zen,我们可以安全地认为我们应该期待新一代Infinity Fabric与它们兼容吗?

佩珀马斯特:那是我的期望。

问:在今天的市场上,我们有使用IF的双插槽Rome,用于插座到插座之间的通信。我们被告知,GPU系列将在某个时候支持GPU到GPU的无限结构链接。我们现在没有看到CPU到GPU无限结构连接,这是不是有什么技术原因?

佩珀马斯特:所以我们在CPU和GPU中都部署了IF,它使我们能够非常有效地进行扩展。今天,我们在CPU和GPU之间充分利用,它允许我们使用我们可以通过该协议实现的优化元素。我们继续关注我们可以在哪里利用这一优势,以及通过IF将AMD CPU连接到AMD GPU的意义在哪里。

造制合作伙伴关系

问:AMD是台积电5nm生产的关键合作伙伴吗?

佩珀马斯特:我们目前还没有宣布推出5nm工艺的产品,但我们与台积电的合作非常密切,你已经看到了我们与他们的那种深度合作,我们的产品线上都有7 nm的产品。

问:已经宣布AMD正在与三星在移动图形方面进行合作。这是纯粹的硬件关系,还是可以延伸到制造领域?

佩珀马斯特:与三星的合作是一家知识产权合资企业。我们正在与他们合作,通过我们的图形IP来实现这一点。如你所知,AMD不是智能手机企业,因此合资企业将产生三星随后将部署到他们产品中的技术。

问:从我们的听众来看,我需要向你提出的一个最常见的问题是关于台积电的产能。你能解释一下这会如何影响AMD吗?

佩珀马斯特:台积电是我们的关键合作伙伴,他们和我们一起参加了第二代EPYC的发布。我认为这确实帮助人们了解了台积电的规模。台积电历史上推出最快的是它的7nm工艺节点,远远领先于我们推出Rome和EPYC。因此,我们与台积电建立了很好的合作伙伴关系,并获得了大量的供应。当我们第一次推出表现最好的Ryzens时,我们确实出现了芯片供应短缺的问题,但这仅仅是因为需求超出了我们的预期和我们的计划。这根本不是台积电的问题。

问:我们有看到台积电延长订单交货期的报道吗?这是否会为2020/2021年的发布做好准备?

佩珀马斯特:我们与台积电的密切关系让我们对他们能够提供什么以及何时提供有一定的洞察力。但我们也必须利用我们的规划团队,他们必须在每一款产品和每一次发布时都保持全力以赴。正如你所知道的,这永远是一种方式:不仅是流行节点的交付期,而且领先边缘节点的交付期也是每一代都在增加。因此,不仅是AMD,每个人都必须在这方面变得越来越好。

AMD的市场份额

问:有些媒体和分析师始终在关注AMD在产品性能和企业战略方面的动作。他们一直在等待AMD迎头赶上,并提供健康的竞争,它现在正在这样做,现在我们正在关注你们的竞争对手什么时候会赶上你。尽管如此,我们仍然认为AMD的企业市场份额增长可能比预期的要慢。这是有原因的吗?或者,我们是否仍在向人们灌输AMD已经恢复运营,抑或是缓慢的企业更新周期的牺牲品?你能澄清下吗?

佩珀马斯特:如果你看看服务器市场,我们说过,我们预计在2020年中期左右,我们的市场份额将达到两位数。人们问我们为什么需要这么长时间,为什么我们没有更快地行动,而事实是,在数据中心市场,需要更长的时间来吸引合作伙伴并完成他们的整个认证周期,以优化他们的客户工作案例和应用。事实上,我们对原始设备制造商和客户的反应非常满意,对我们的第二代EPYC,对Rome,我们正走在我们的预期轨道上,市场也在增长。

问:AMD目前市场上处理器最高的TDP(热设计功耗)是280W,例如为HPC设计的EPYC 7H12。TDP扩张有上限吗?我们预计英特尔将推出更高的TDP芯片,TDP在350W到400W。

佩珀马斯特:与我们的OEM合作伙伴的合作不仅仅是最大化CPU可用的功率。你还可以跨CPU和GPU工作,这就是我们为Frontier超级计算机使用Cray/HPE所做的事情。这确实表明,我们可以与OEM合作伙伴在硬件、系统和软件堆栈之间进行系统优化,以真正推动HPC市场的发展。

7H12是我们继续推出Rome的一部分,你可以看到ATOS使用它,我们真的很高兴他们看到自己的位置赶上了TOP500榜单,因为这是一场与时间的赛跑,但这只是展示了你可以用出色的执行力做些什么。但是,当你想到集成水冷解决方案的时候,它告诉你,你必须发展这些密切的合作伙伴关系,就像在AMD与我们的OEM客户所做的那样,而且未来可以获得更多的性能。

(编辑:彭谢辉)