商用频道
    作者:巫山

    AMD对决Intel:十年再战胜算几何?

         [ 中关村在线 原创 ] 暂无评论

           今年服务器芯片市场最引人瞩目的事件莫过于AMD携带依托Zen架构代号Naples的EPYC在上次进军服务器市场被挫败10年之后再次向英特尔发起了挑战。而作为服务器市场霸主的英特尔同样拿出了代号Skylake-SP的Xeon Scalable可扩展处理器家族系列积极应战。尽管在双方的发布会PPT中都看出了各自性能的提升以及相对竞争对手所取得的优势,但有趣的是,至少在中国,由于无法取得测试样机,因此尚无第三方可以对两者进行横向对比。为了挖掘背后的真相,中关村在线企业站通过全球权威硬件评测媒体AnannTech的对两者的测试数据来给读者和服务器行业一个清晰直观的认知。

    十年之战:EPYC对决 Xeon Scalable
    Xeon可扩展家族

          从测试结果来看,AMD的EPYC在浮点运算上和内存带宽上取得的优势是惊人的,但是与此同时英特尔在内存延迟、单线程整数运算以及事务型数据库上的优势地位同样难以动摇,双方更是在大数据测试、Java性能测试环节中难分伯仲。而接下来我们将通过测试数据来对比两者之间的性能和优劣。

    再次声明:本文中所有数据均出自AnandTech,如数据有误还请见谅。


    竞争从口水战开始

           在奥斯丁,一名AMD的工程师在详解Zen架构和Skylake架构区别的幻灯片前谈论到。"尽管从幻灯片上来看差不多,但实际上他们有很大差别"。而在波特兰。英特尔的发言人表示完全同意:"实际这两个产品完全是两回事""我们必须得让消费者明白他们不能简单的用AMD的32核心去对比我们的28核心。"

    十年之战:EPYC对决 Xeon Scalable
    EPYC的32核心令人印象深刻

      对于服务器CPU行业来说,英特尔发布的最新一代Skylake-SP的Xeon处理器最新一代使用Skylake-SP架构的Xeon处理器让人感到心喜,代号"Purley"100系列处理器包含了英特尔最新的CPU和网络光纤技术。而此前AMD发布的全新EPYC 7000系列处理器,凭借AMD公司的Zen架构和可扩展的服务器级别I/O和核心数量更是让业内感到振奋。

    十年之战:EPYC对决 Xeon Scalable
    Xeon可扩展家族提升亮点同样不少

           EPYC代表着AMD取得的史诗级成就。这也让两家公司在近五年之后再一次展开了高性能服务器的性能竞争。目前的这种状况在两家公司之间已经很久没有发生。英特尔一直不在乎AMD的挑战,也不看重两者之间的竞争,不过对于之前的AMD来说也没有能力与英特尔一战。但是现在情况则完全不同,两者都非常关注彼此下一步的举动。

            实际上,全新的Skylake-SP架构对标的并不是前一代Xeon(E5v4),而是AMD崭新的EPYC服务器CPU。两个CPU毫无疑问有很多不同;micro architecture(微架构), ISA extentions(ISA扩展), memory subsystem(内存子系统), node topology(节点拓扑)...而这些技术在具体应用中又会怎样呈现呢?我们先做一个简单的对比。

    Skylake-SP VS Zen

         英特尔和AMD这次发布的新产品相比过去都有了很大的改变,英特尔的Skylake-SP家族有如下新特点。

    1.AVX-512指令集(可提供不同的ISA扩展)

    2.1 MB(取代过去的256KB)的2级缓存并带有非包含式剔除3级缓存(只保存从二级缓存中剔除的或者写回的数据)。

    3.Mesh拓扑连接方式让每个核心和三级缓存捆绑在一起。

         而AMD这边则使用了MCM封装方式:每一块芯片封装中有4块Die,每一片中都包含8个完全一样的核心,这和AMD Ryzen的处理方式一样。每一个Die拥有两个核心群组,每一组包含4个核心,并支持两条内存通道,单个EPYC处理器最多可拥有32颗核心和8条内存通道。不同的Die通过AMD最新的内部连接器(Infinity Fabric)连接。

        至于两者之间的不同,通过下面这张表可以简单了解一下。

    十年之战:EPYC对决 Xeon Scalable
    规格对比

      从某种角度来说,英特尔拥有最先进的多核拓扑结构,因为它们能够在网格中集成多达28个核心。Mesh结构将允许英特尔在未来几代中添加更多的内核,同时在大多数应用程序中保证表现一致。最后一级缓存具有很好的延迟表现,适用于需要占用大量内存的应用程序。访问本地L3缓存块和一个更远的缓存之间的平均延迟差异可以忽略不计,L3缓存成为L2缓存之间进行快速数据同步时的中央存储。当然,性能最强的Xeon处理器尺寸庞大,而生产价格也非常昂贵。

    十年之战:EPYC对决 Xeon Scalable
    全新的Mesh架构

      AMD的MCM解决方案从制造角度来说要便宜不少。在4个die以及每个die配备的两个内存通道支持下,内存峰值带宽和容量都要更胜一筹。然而,它没有最后一级的中央缓存可以让不同的内核(除了在一个CCX群组内)的L2高速缓存之间实现低延迟的数据协调。八个8 MB的L3缓存在一些情况下表现不尽如人意。

    十年之战:EPYC对决 Xeon Scalable
    Naples的4*8 MCM架构

    标签:意见英雄
    提示:支持键盘“← →”键翻页
    本文导航

    关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询