农企终于翻身了?AMD(AMD.US)全球首发7nm CPU/GPU,股价大涨

47132 11月7日
share-image.png
雷锋网 雷锋网,读懂智能&未来。

本文来自“雷锋网”,作者包永刚、王刚。

11月7日,在AMD在美国旧金山举办的“Next Horizon”新品发布会上正式宣布,继全球首款7nm手机处理器之后,同样基于台积电7nm制程的CPU和GPU产品也正式发布。AMD推出了全球第一款7nm 代号“Rome”(罗马)的第二代EPYC霄龙CPU处理器以及Radeon Instinct MI60/MI50的GPU计算卡。

此外,AMD宣布,AWS成为了公司服务器芯片的新合作伙伴,并将会采用霄龙(EPYC)服务器芯片。

受上述消息影响,AMD股价最高上涨8.8%。

7nm Rome(罗马)第二代EPYC霄龙处理器

首发7nm CPU和GPU

AMD代号为Rome的第二代EPYC霄龙处理器基于Zen2架构,Rome EPYC采用特殊设计的架构,每颗处理器有8个CPU 裸片,每个裸片内集成8个物理核心,共64个。同时为了更好地协调如此众多CPU核心的协同工作,还专门设计了一个I/O裸片,放置在中央位置,专门负责输入输出控制,不过I/O裸片用14nm工艺制造。Rome处理器有8通道DDR4内存控制器,每个插槽支持最高4TB DRAM。

Rome EPYC也是第一个支持PCIE 4.0技术的服务器级CPU,支持128个PCIe 4.0,带宽通道数翻番,可提升加速器性能,搭配同样支持PCIE 4.0技术的全新加速卡Radeon Instinct MI60,AMD表示可以带来前所未有的加速性能。当然,Rome EPYC也是全球第一款采用7nm工艺的数据中心处理器。目前Rome EPYC更详细的参数暂未公布,AMD预测Rome EPYC性能将因核心数量的增加而翻倍,浮点性能也将因为IPC架构的改进和核心数量的增加两倍。

兼容性方面,Rome EPYC与现有的Naples,以及下一代的Milan都将保持兼容,这可以简化基于AMD处理器的服务器开发,也能让服务器公司把现有的设计用在未来的服务器当中。进度方面,AMD正在向服务器制造商提供Rome EPYC样品,计划在2019年推出产品,但具体时间尚未公布。亚马逊AWS计算副总裁Matt Garman表示,基于AMD霄龙芯片的R5和M5实例产品今天就可使用,T3实例将在未来几周上线,并重点强调了帮助客户运行最常见应用程序时节省成本的特点。

GPU方面,AMD在今年Computex 2018上公布了7nm Radeon Vega GPU,雷锋网《AMD抢先推全球首款7nm GPU,但能否按时出货?》有详细介绍,不过第一款正式发布的7nm GPU产品并不是Radeon RX游戏显卡,而是Radeon Instinct计算卡。AMD同时发布了Radeon Instinct MI60/MI50,均基于7nm工艺的Vega架构,得益于7nm工艺,Radeon Instinct计算卡集成132亿个晶体管,比目前14nm Vega 的125亿个晶体管增加了6.4%,核心面积为331平方毫米,比现在的484平方毫米缩小了31.6%。据称,在同等功耗下,新核心性能提升超过25%,同等频率下新核心功耗降低50%。

Radeon Instinct显存搭配最多32GB HBM2,带宽达1TB/s,內建ECC纠错。同样,7nm Vega也是世界首个支持PCIE 4.0技术的GPU,双向带宽64GB/s,借助带宽高达100GB/s的Infinity Fabric系统总线,支持4路GPU并行,双路性能提升99%,4路比单路提升298%,8路比单路提升664%。

AMD 7nm Radeon Instinct 计算卡

在加速功能上,7nm Vega计算卡在几个关键领域与Vega10有所不同,7nm Vega支持半速率双精度,同时支持新的低精度数据类型。具体看,MI60 FP64双精度浮点最高为7.4TFlops,FP32单精度最高为14.7TFlops,INT整数最高为118Tops,相比于同样Vega 10核心的MI25专业性能提升8.8倍。

还有值得注意的是,新的GPU还包括一对片外Infinity Fabric链路,允许Radeon Instinct卡通过相干链路直接相互连接。由于每个GPU只有2个链接,因此AMD的拓扑选项仅限于环上的变化,这意味着4路配置的GPU不能全部直接相互通信。另外,AMD仍坚持使用PCIe卡,没有像NVIDIA一样的定制夹层式卡,所以这些卡需要通过顶部的桥接器连接。

为弥补AMD在软件方面的不足,AMD宣布了开源计算平台ROCm 2.0,并继续承诺完全开源。进度上,Radeon Instinct MI50将于今年第四季度上市,MI60将在明年一季度上市。

AMD宣布芯片新买家,AWS的第68次降价顺势到来

此次发布会上,AMD还宣布AWS成为了公司服务器芯片的新合作伙伴。竞争对手英特尔短线跌逾1.1%,收跌0.88%,报47.25美元,接近五日新低。

CNBC分析称,多年来英特尔一直是AWS的数据中心处理器供应商,现在不得不与AMD“二分天下”,自然影响股价表现。

雷锋网也了解到,目前AMD的霄龙处理器已经用来支持全球前两大公共云基建供应商:亚马逊AWS和微软Azure的计算实例。

消息公布后,AWS随即发布公告称,新的EC2虚拟云服务器将为第三方客户提供AMD霄龙处理器芯片,并能为通用实例(M5和T3)和内存优化实例(R5)节约10%的计算成本。

AWS副总裁Matt Garman表示,基于AMD霄龙芯片的R5和M5实例产品今天就可使用,T3实例将在未来几周上线。

雷锋网在AWS官网上查询一圈后发现,一篇由AWS的首席布道师Jeff Barr写的博客《New Lower-Cost, AMD-Powered M5a and R5a EC2 Instances》非常值得关注,暂且将其翻译为《新的低成本,AMD支持的M5a和R5a EC2实例》。

博客里的重点信息是:

目前为止,AWS已经灵活调整了价格多达67次(这个数字此前雷锋网在亚马逊财报中亦有露出)。随着与AMD合作的展开,将提供更加经济的EC2实例选择。注:EC2实际上是亚马逊提出来的概念,叫“弹性计算云”,Elastic Compute Cloud。它是一个让使用者可以租用云端电脑运行所需应用的系统。简而言之就是EC2缩短了用户获取和启动新的服务器实例时间缩短到几分钟,用户只需为实际使用的计算进行支付。Amazon在2006年8月25日发布EC2受限公众Beta版本。

最新的EC2实例由运行速度为2.5 GHz的定制AMD EPYC处理器提供支持,价格比同类产品低10%。雷锋网:这或许是AWS的“第68次降价行为”。

专门对M5a实例(通用型)和R5a实例(内存优化)做了负载说明。M5a实例有6种尺寸可供选择;R5a实例有6种尺寸,与R5实例相比,每GiB内存价格较低。

新的EC2实例使用范围。目前在美国弗吉尼亚北部、俄亥俄州、俄勒冈州、欧洲的爱尔兰、亚洲新加坡等地可以使用最新EC2实例。当然,价格会优惠10%。

抢先推出7nm,AMD这次终于翻身了?

当下,7nm无疑是业界关注的焦点,不过AMD总裁兼首席执行官苏姿丰博士(Lisa Su)此前已经多次谈到AMD的7nm进展。在此次Next Horizon会议上,AMD CTO Mark Papermaster表示,AMD在7nm上豪赌了一把,首先是相信能把7nm做出来,其次是认为7nm将成为产业关键节点,并持续很长一段时间。AMD最初的目标是用自己的7nm和英特尔10nm竞争,至少打成平手,但没想到AMD先做出了7nm,并将成为在新节点上最先推出产品的公司。

除了已经公布7nm架构和产品,AMD还表示明年锐龙、霄龙将全线转向7nm工艺的Zen2架构,接下来将是7nm+升级版工艺的新架构Zen3。不止于此,AMD还首次披露Zen4架构正在设计中。Papermaster也强调了AMD路线图的重要性以及实现路线图的能力和决心,他表示Zen2架构芯片正在流片,Zen3预计在2020年使用7nm+制程,Zen4开发已接近尾声。

在Next Horizon会议上发布7nm EPYC的时候,AMD用一颗Rome EPYC(64核心)与两颗Skylake Xeon 8180M(56核心)同时渲染1080p/QuadHD/4K图像对比,结果成绩分别是28.1秒和30.2秒,AMD更胜一筹。GPU方面,AMD拥有GPU最快配置的1TB/S全内存带宽,甚至超过NVIDIA旗舰产品GV100 GPU。这是否意味着AMD凭借着7nm一举超越了英特尔和英伟达?

雷锋网在《AMD的7nm处理器样品出锅了,不过似乎对Intel威胁不大》一文中已经提到,国外论坛HardOCP上的一位坛友mockingbird爆料称RTG(Radeon Technology Group)已经收到首款Zen 2架构7nm处理器的样品,但测试样品的基础/睿频频率是4.0/4.5GHz,要比目前Ryzen 7 2700X(3.7/4.1GHz)高一些,但与英特尔8700K 4.7GHz的睿频频率有差距,更不及未来9800K/9900K的5GHz。虽然AMD未来还有继续打磨提高频率的空间,但从初代Ryzen测试样品与正式发售产品的频率对比来看,提升空间应该不大。

另外,硬件以及7nm并不就意味着处理器的成功,指令集也十分关键。据了解,AMD先有了SSE5指令集,然后英特尔推出了AVX指令集,接着AMD又效仿AVX,但保留SSE5中的FMA4、CVT16和XOP指令;然后英特尔效仿AMD加入CVT16,但改名为F16C,随后又加入FMA4简化后的FMA3和AVX2.0指令;AMD只得跟风,加入FMA3,承认F16C,将来还要加入AVX2.0。可以看到AMD在指令集方面的竞争非常激烈。

至于GPU领域,从AMD首发的7nm计算卡可以看出其非常重视服务器市场,不过在这一市场英伟达GPU拥有绝对的优势,与在CPU领域与英特尔的竞争一样,英伟达的领先使其有能力从架构以及指令集等方面占据优势,一旦使用了7nm工艺,AMD在部分性能方面的优势能保持多久就不得而知。我们也可以从架构上看,英伟达在今年八月放出了号称12年来的最大招图灵(Turing)架构,但图灵架构的RTX2080 GPU也继承了很多Fermi架构的东西,这意味着AMD也不太可能完全放弃GCN架构设计新的架构,并且此前AMD的研发中心都放在Zen架构上,GPU的改进乏力,基于目前的情况看,AMD能够凭借新的工艺就实现对英伟达的反超?

雷锋网认为,AMD作为在高性能计算领域同时具有CPU和GPU产品的公司十分难得,不过可惜的是在CPU领域难以超越英特尔,在GPU领域难以超越英伟达,这其中有技术的因素,也有商业方面的原因。当然对于消费者和云厂商而言,只有竞争才会带来更好的产品,因此对于AMD的7nm CPU和GPU我们依旧保持期待。

相关阅读

中芯国际(00981)第三季度拥有人应占溢利同比增长2.5%至2655.9万美元

11月7日 | 陈鹏飞

AMD(AMD.US)推出全球首个7纳米芯片,可用于亚马逊云服务

11月7日 | 林喵

英伟达(NVDA.US)新推消费级显卡RTX 2080T“翻车”了!

11月6日 | 艾宥辰

亚洲最大芯片设计公司崛起——华为海思?

11月3日 | 智通编选

微软(MSFT.US)超过一半Azure服务器将使用Xilinx芯片,取代英特尔芯片

10月31日 | 林喵