7zip测试不专业、不全面?那就来一个全面专业测试吧!龙芯 Vs 飞腾

       2019年年末,两大国产CPU芯片巨头飞腾和龙芯,相继组织了规模宏大的年会;发布了新型桌面芯片及其整机产品,舆论场上顿时硝烟四起,各种争论高潮迭起。这两款芯片性能到底如何?谁能扛起国产化的大旗?笔者有幸获取了两种产品样机,客观公证地进行了摸底测试。

      从已经发布的使用此两款芯片的整机产品来看,采用龙芯3A4000的台式机,主频标称1.7-2.0GHz,四核,CPU标称功耗40W左右;笔记本上采用的CPU主频一般为1.5Ghz,标称CPU功耗是30W,笔记本上有风扇。发布会上厂商联合发布的产品有8个台式机,3个笔记本,3款一体机。

      基于飞腾FT-2000/4的台式机,主频2.6-3.0GHz,一般为2.6GHz,四核。笔记本使用的CPU主频2.3GHz,CPU功耗10W,采用无风扇超薄设计。发布会上厂商联合发布的产品有10个台式机,4款笔记本,6款一体机。

      我们对龙芯3A4000样机和飞腾FT-2000/4样机进行了对比,配置如下表。公平起见,龙芯3A4000与飞腾FT-2000/4采用相同内存,显卡和机械硬盘。 

500

 

测评项及结果

 1)CPU性能测评

     SPEC CPU是SPEC组织推出的CPU子系统评估软件软件, 是一项评估处理器计算性能的全球性测试标准。(SPEC全称是标准性能评估公司,是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。)

     SPEC CPU可以说是目前CPU性能评估最为客观而可信的基准测试,可以客观反映CPU自身计算性能情况。它测试通过一系列测试集,对CPU整形运算和浮点运算进行测试并进行打分。

    采用Spec2006版本进行测试,结果如下:

500

  从测试结果可以看到, SPECint(整型计算性能)FT-2000/4是龙芯3A4000 的1.5倍。SPECfp(浮点计算性能) FT-2000/4是龙芯3A4000 的1.7倍。  

 2)内存访问延迟测评

    Lmbench工具测试了所有系统的缓存延迟,例如一级,二级和三级缓存,还有内存和TLB 表的未命中延迟,是内存访问延迟的主工基准测试,     内存的访存延迟会影响应用性能,延迟越低越好。  使用Lmbench工具进行访存延迟测试,结果如下:

500

      测试结果显示:龙芯3A4000的连续访问延迟是FT-2000/4的2倍,龙芯3A4000的随机访问延迟是FT-2000/4的3倍。(访存延迟越低越好)  

 3)Stream访存带宽

    随着处理器处理核心数量的增多,内存带宽对于提升整个系统性能越发重要,如果某个系统不能够足够迅速地将内存中的数据传输到处理器当中,若干处理核心就会处于等待数据的闲置状态,而这其中所产生的闲置时间不仅会降低系统的效率还会抵消多核心和高主频所带来的性能提升因素。     Stream测试是业界公认的内存带宽性能测试基准工具,可以客观反映CPU访存性能。   Stream访存带宽测试结果:

500

    可以看到,在同样的8G内存配置下,飞腾FT-2000/4的stream值为龙芯3A4000的1.33倍。  

4)系统综合性能测试

    UnixBench是通用的测试系统性能的工具。UnixBench会执行一系列的测试,包括2D和3D图形系统的性能衡量,测试的结果不仅仅只是CPU,内存,或者磁盘为基准,还取决于硬件,操作系统版本和编译器。测试系统各个方面一系列的性能,然后将每个测试结果和一个基准值进行比较。

     UnixBench更能综合反应搭载芯片整机的性能水平,是非常重要的评价指标。UnixBench的值越高越好。UnixBench测试结果: 

500

    UnixBench测试值,FT-2000/4是龙芯3A4000的1.9倍。这代表着整机综合性能FT-2000/4是龙芯3A4000的1.9倍。  

5)2D性能测试

    在桌面终端上,图形处理的性能直接影响用户使用体验,影响图形界面、图文处理和浏览器的性能。2D和3D都是桌面终端关注的重要指标。     图形性能不仅与所配显卡有关,也与CPU的性能有很大关系,只有CPU处理能力强,才可以把图形能力完全发挥出来。     x11perf是一个2D图形测试工具,用于测试Xserver图形性能。它在各种分辨率窗口下测试进行一定数量的图形绘制运算,耗时越低越好。  X11perf测试结果:

500

    X11perf测试项众多,挑选几个典型绘图场景做比较,1) 绘制同样数量的点, 3A4000耗时是FT-2000/4的10倍;2)绘制线的耗时是3.5倍;3)绘制同样数量的椭圆的耗时,龙芯3A4000是FT-2000/4的4倍。(耗时越短越好)  

 6)3D性能测试

    同样,在桌面终端上,3D的性能很大程度影响用户使用体验,还会影响一些软件比如地图和游戏的运行能力。

     glmark2是一个针对OpenGL2.0和ES2.0性能的基准工具。Glmark2进行一系列3D图形绘制,最终得分越高,说明3D性能越好。 

 Glmark2测试结果如下:

500

   从3D Glmark2的测试来看,飞腾FT-2000/4的性能为龙芯3A4000的1.8倍。  

 7)浏览器性能测试

    浏览器是桌面终端上最重要的应用。随着HTML5的普及,浏览器不再只是信息获取的入口,而取代了众多传统客户端成为了应用的主要入口。所以浏览器的性能对用户体验是非常重要的。

     Octance测试是由google研发的Javascript引擎测试标准,其使用了各大型网站中频繁使用的Javascript代码来测试浏览器的JS引擎性能,测试Case更贴近当前的复杂网络环境,且还加入延时测试,数值越高说明浏览器的表现越优秀。

      浏览器性能测试Octance在Firefox和Chromium两个浏览器上的得分为: 

500

    可以看到飞腾FT-2000/4对比龙芯3A4000成绩明显占优,在Firefox得分为其1.63倍,在Chromium得分为其2.57倍。  

 8)FishIETank浏览器图形性能测试

    在当今的网络上,每个网页基本上都充斥着大量的图形,使用GPU加速渲染已经成为重要的性能要求。所以对 GPU图形加速的测试,成为了必不可少的项目。

     Fish Tank是微软公司推出的一款工具,可以用于评测PC浏览器的性能,也可以用来考核手机GPU性能。它是一个虚拟的鱼缸场景,有很多游动的鱼,鱼鱼游得越快,说明浏览器和GPU的性能越强,用户可以自由选择缸内鱼的数量(最多1000只),当然,鱼越多,对性能的要求就越高。Fish Tank鱼缸测试本质上是一个GPU加速的测试应用,它会提供充足的时间(60秒)让HTML5浏览器渲染内容,屏幕中的鱼按照轨迹进行由大至小散开游动。这对GPU一个很大的负担,右上角的fps数代表每秒帧数,得分越高,说明性能越强。

    浏览器Fish Tank测试结果: 

500

    龙芯的Firefox浏览器在FishIETank图形性能测试时会直接卡死,多次测试未能成功。在Chromium浏览器上,250条鱼时为30帧。FT-2000/4上,500条鱼时都是满帧60fps。  

9)JVM性能测试

    Java是桌面及服务端主要的跨平台应用运行环境,SPECjvm2008也是SPEC标准性能评估组织开发的Java基准性能工具。它的测试用例涵盖了大部分java基础应用场景,是架构选型和VM性能评测最主要的工具。

     飞腾与龙芯JAVA版本都是OpenJDK 1.8.0,版本一致。SPECjvm测试结果越高越好。 JVM性能测试结果如下:

500

    从测试结果看,飞腾FT2000/4的java性能是龙芯3A4000的1.8倍。  

10)Word/PDF文档测试

    当前国产桌面CPU最重要的使用场景是办公环境,其对Word和PDF等文件处理软件的性能情况,对用户体验有非常重要的影响。

    本次测试使用WPS软件对不同大小的文档进行打开和保存的速度测试,时间越短越好。

500

    测试结果飞腾明显领先,在打开同样的文件时,飞腾FT-2000/4的速度要快于龙芯3A4000平台,在10M大小的情况下,FT-2000/4的打开速度是龙芯3A4000的一倍多。当文件变大时,每次保存是非常耗时的事,在飞腾FT-2000/4上保存100M的文档比龙芯3A4000要快4秒。  

11)视频播放测试-4K

    视频播放测试使用4K 片源,格式为H.264,码率为20M。

     在龙芯3A4000上使用两种显卡测试,分别是R7 240、HD7450显卡,龙芯播放时都不流畅出现明显卡顿丢帧

     在FT-2000/4上使用R7 240播放流畅,没有卡顿丢帧。而使用HD7450时,也会有一点丢帧。  

结论

       以上是对两款国产桌面CPU的台式机样机进行测试的情况。测试结果表明,龙芯3A4000在计算性能上差不多是FT-2000/4的一半,在浏览器、多媒体、用户文件打开速度等用户体验指标上龙芯相对飞腾的差距也比较大。同时,在功耗方面龙芯3A4000是FT-2000/4的3倍多

       根据龙芯总裁胡伟武2019年12月24日发布的演讲来看,龙芯3A4000在DDR4和功耗方面确实存在一些问题,导致性能与上一代比较提升不明显。第一,DDR4内存频率不够高,3A4000/3B4000实际最高DDR4工作频率是2400/2133(而DDR4规定速率范围为1600-3200);第二,功耗偏大,非向量模式典型工作功耗为30-40W,这些问题都给龙芯进一步改进的空间。

站务

全部专栏