Memblaze PBlaze5 NVMe SSD评测(含固件升级评测对比)
首页>>企业存储>>正文

目录

    此前发布的该篇文章由于Memblaze 官方版本固件升级已经删除掉了。这里再次让大家回顾一下Memblaze PBlaze5 Nvme SSD这款产品,本篇评测内容重点包含了固件升级后与旧版固件之间的对比。此前Memblaze官方演示了PBlaze5 PCIe NVMe SSD装备了最新固件的内容,简单回顾一下。


    性能优化

    官方显示闪存卡的128k连续读带宽可以达到6GB/s,而闪存卡4k随机读的IOPS性能超过了100万。

    PBlaze4和PBlaze5的对比数据



    混合负载下读QoS优化

    通过自适应负反馈动态平滑、优先级队列管理等技术,尤其在混合负载下的读延迟以及QOS得到优化。

    优先级队列管理原理示意(保障读QoS)


    Memblaze的实测显示,PBlaze5 700在50000 IOPS的读压力,同时后台进行500MB/s写的混合负载下,99.9%的读延时保证在0.12ms以内。



    多命名空间

    PBlaze5 符合NVMe1.2a 标准,支持高达32 个命名空间,每个命名空间可以独立的设置逻辑扇区512/4096 字节。默认命名空间设置指向整个用户使用空间(如"/dev/nvme0n1"),当创建多个命名空间后,主机端可以看到多个独立的设备列表。

    如 "/dev/nvme0n1", "/dev/nvme0n2", "/dev/nvme0n3"。

    多命名空间分配



    Trim

    PBlaze5的Trim技术实测环境中,官方给出的Trim速度可达到8TB/s。同时,在开启Trim功能后,写延迟仍能保持在100μs以内。

    实测开启/关闭Tirm下随机写延迟



    快速启动

    大容量意味着FTL表也会非常大,在系统重启时,很关键的环节就是对FTL表的重构。下图展示了PBlaze5灵活的设置快速启动机制后的效果。


    PBlaze5拥有更为灵活的Ready Period


    新版固件默认开启快速启动(Fastboot)功能,官方指出PBlaze5所有型号(包括11TB超大容量版)启动时间缩短至5s以内。有关该固件升级的更多细节,请访问Memblaze官网。


    那么固件升级后的Memblaze PBlaze5 Nvme SSD到底怎么样了?跟官方给出的数据有出入吗?详情请阅读下文有关该产品的评测。


    用PBlaze5的NVMe SSD系列标志着该公司在PBlaze4之后的第二代NVMe SSD产品。驱动器有两种形式,U.2和HHHL AIC,以及700和900两种系列。700系列容量达到11TB,旨在用于数据中心的使用。900系列具有更高的续航能力,适用于企业应用。

    这两个系列都是为企业设计的,具有高达6GB / s的连续速度,读取延迟低至90μs。这两个系列的差异在于700系列具有更低的成本,更低的续航能力和更高的容量。另一方面,900系列具有更高的耐用性,双端口以实现更高的可用性和数据加密。这些主要区别适用于不同的用例:数据库,云,超大规模,SDS,大数据,关键任务数据库的3D渲染适用700系列,而ERP,SAP HANNA,BOSS,银行业务,税务高频交易和网上支付适用900系列则更好。


    对于这次审查,我们使用的是3.2TB,U.2,900系列的PBlaze5。


    Memblaze PBlaze5 NVMe SSD 900系列规格方面:


    外观方面

    我们正在审查的是一款2.5英寸U.2外形设计Memblaze PBlaze5。该驱动器具有坚实的黑色亚光外壳。驱动器的顶部在右侧标有品牌。



    驱动器的底部几乎完全被散热器吸收。


    驱动器的两端都有端口。在远离NVMe界面的一侧,可以看到第二个端口。


    性能方面

    测试平台介绍如下


    企业级SSD评估利用联想ThinkSystem SR850进行应用程序测试,使用戴尔PowerEdge R740xd进行综合性测试。ThinkSystem SR850是一款设备齐全的四核心CPU平台,可提供超高性能本地存储所需的CPU功率。不需要大量CPU资源的综合测试使用更传统的双处理器服务器。在这两种情况下,其目的都是尽可能地展示本地存储,以符合存储厂商的最高驱动规格。以下是设备的详细信息。


    A.联想ThinkSystem SR850


    4 x Intel Platinum 8160 CPU(2.1GHz x 24核心)

    16 x 32GB DDR4-2666Mhz ECC DRAM

    2个RAID 930-8i 12Gb / s RAID卡

    8个NVMe托架

    VMware ESXI 6.5


    B.戴尔PowerEdge R740xd


    2个英特尔Gold 6130 CPU(2.1GHz x 16核心)

    16 x 16GB DDR4-2666MHz ECC DRAM

    1个PERC 730 2GB 12Gb / s RAID卡

    插件NVMe适配器

    Ubuntu的16.04.3桌面,AMD64


    测试背景和可比较性

    企业测试实验室提供了这样的测试环境,管理员以实际部署遇到的环境中进行企业级存储设备的基准灵活架构的设计。企业测试实验室整合了各种服务器,网络,功率调节和其他网络基础设施,以方便能够在真实适用环境中能准确的评估性能。


    我们将这些有关实验室环境和协议的详细信息整合到评估中,以便IT专业人员和负责存储采集的人员能够了解我们取得以下结果的条件。值得声明的是我们的评测没有一个是由我们正在测试的设备制造商支付或监督的。


    应用程序和工作量分析

    为了理解企业存储设备的性能特征,对实时生产环境中的基础架构和应用程序工作负载进行建模非常重要。因此,我们的Memblaze PBlaze5基准测试通过SysBench  和  Microsoft SQL Server OLTP性能以及模拟TCP-C工作负载评估  MySQL OLTP性能。对于我们的应用程序工作负载,每个驱动器将运行2-4个配置相同的VM。


    SQL Server性能

    每个SQL Server虚拟机都配置了两个虚拟磁盘:100GB卷用于启动,500GB卷用于数据库和日志文件。从系统资源的角度来看,我们为每个虚拟机配置了16个vCPU,64GB的DRAM,并利用了LSI Logic SAS SCSI控制器。虽然我们测试的Sysbench工作负载先前在存储I / O和容量方面都达到了饱和,但SQL测试有利于延迟性能的评测。


    此测试使用在Windows Server 2012 R2客户虚拟机上运行的SQL Server 2014,这项任务在数据库的基准测试工厂很重视。Microsoft SQL Server OLTP测试协议采用了交易处理性能委员会的基准C(TPC-C)的当前草案,TPC-C是一种在线交易处理基准,可模拟复杂应用环境中的活动。TPC-C基准测试比测试数据库环境中存储基础架构的性能优势和瓶颈时的综合性能基准更接近。我们用于此评估的SQL Server VM的每个实例都使用333GB(1,500Scale)的SQL Server数据库,并测量15,000个虚拟用户负载下的事务性能和延迟。


    SQL Server测试配置(每个VM)

    Windows Server 2012 R2

    存储空间:分配600GB,使用500GB

    SQL Server 2014

         数据库大小:1500比例

         虚拟客户端负载:15,000

         RAM缓冲区:48GB

    测试时长:3小时

         2.5小时预处理

         30分钟的采样时间


    对于我们的SQL Server交易基准测试,Memblaze PBlaze5以12,6239.9 TPS(旧版12,623.3 TPS)落后于PBlaze4。显然应该指出的是,从最低的HGST SN100到最高的Memblaze PBlaze4的结果差异仅为41.4 TPS。更应该注意的是,该测试和原始固件一起运行,然后在测试中更新固件,以上可以从结果中看到。


    对于SQL的平均延迟,PBlaze5以10毫秒的延迟再次进入第二位,PBlaze4仅有5毫秒。


    Sysbench性能

    下一个应用程序基准包括 通过SysBench测量的  Percona MySQL OLTP数据库。该测试测量平均TPS(每秒事务数),平均延迟以及平均第99个百分位延迟。


    每个Sysbench虚拟机配置有三个虚拟磁盘:一个用于引导(〜92GB),一个用于预建数据库(〜447GB),第三个用于被测数据库(270GB)。从系统资源的角度来看,我们使用16个vCPU,配置每个虚拟机60GB DRAM,并利用LSI Logic SAS SCSI控制器来进行测试。


    Sysbench测试配置(每个VM)

    CentOS 6.3 64位

    Percona XtraDB 5.5.30-rel30.1

         数据库表:100

         数据库大小:10,000,000

         数据库线程:32

    RAM缓冲区:24GB

         测试时长:3小时

         预处理32个线程2小时

          1小时32个线程

    凭借Sysbench交易基准,我们看到Memblaze PBlaze5以8260.5TPS(旧版固件6,431.1 TPS)位居榜首。


    新版固件


    纵观Sysbench的平均延迟时间,PBlaze5再次以15.5ms(旧版固件19.9ms)获得最佳分数。


    新版固件


    就我们最糟糕的MySQL延迟情况(第99百分位延迟)而言,PBlaze5以29.4ms(旧版固件38.6ms)排名第一


    新版固件


    Houdini by SideFX

    Houdini测试专门用于评估与CGI渲染相关的存储性能。此应用的测试平台是我们在实验室中使用的核心Dell PowerEdge R740xd服务器类型的变化后的平台,  具有双Intel 6130 CPU和64GB DRAM的设备。在这种情况下,我们安装了运行裸机的Ubuntu Desktop(ubuntu-16.04.3-desktop-amd64)。基准的输出以秒为单位来衡量完成,当然少于这个更好。


    Maelstrom演示代表了渲染的一部分,通过展示其有效使用交换文件作为扩展内存形式的能力,突出了存储的性能。测试不会写出结果数据或处理这些点,以便将潜在影响的延时效应隔离到底层存储组件。测试本身由五个阶段组成,其中三个作为基准的一部分,如下所示:


    1. 从磁盘加载打包点。这是从磁盘读取的时间。这是单线程的,可能会限制整体吞吐量。

    2. 将这些点解包为一个单一的平面数组,以便处理它们。如果这些点不依赖于其他点,那么可以调整工作集以保持核心。这一步是多线程的。

    3.(不运行)处理点。

    4.将它们重新装入适合存放回磁盘的带槽块。这一步是多线程的。

    5.(不运行)将带块的块写回到磁盘。


    在我们的Houdini工作负载中,Memblaze PBlaze5落后于PBlaze4和其他NVMe组,其中8帧渲染时间为3,948秒。


    VDBench工作量分析

    说到存储设备的基准测试,应用测试是最好的,合成测试排在第二位。尽管不是实际工作负载的完美表示,但综合测试确实有助于将存储设备的基准设置为可重复性因素,从而可以轻松地在竞争解决方案之间进行横纵之间的比较。这些工作负载提供了一系列不同的测试配置文件,从“四个方面”测试,通用数据库传输大小测试到不同VDI环境中的跟踪捕获。所有这些测试都利用常见的vdBench工作负载生成器,通过脚本引擎在大型计算测试集群上自动执行并捕获结果。这使我们能够在广泛的存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。我们针对这些基准的测试过程使用数据填充整个驱动器表面,然后对驱动器部分进行分区,使其等于驱动器容量的25%,以模拟驱动器如何响应应用程序工作负载。这与使用100%驱动并使其进入稳定状态的全熵测试不同。因此这些数字将反映更高的持续写入速度。


    简介:

    1.4K随机阅读:100%阅读,128线程,0-120%iorate

    2.4K随机写:100%写,64个线程,0-120%iorate

    3.64K连续读取:100%读取,16个线程,0-120%iorate

    4.64K连续写入:100%写入,8个线程,0-120%iorate

    5.合成数据库:SQL和Oracle

    6.VDI完全克隆和链接克隆跟踪


    在我们的第一个VDBench工作负载分析中,我们查看了随机4K读取性能。所有测试的驱动器在整个基准测试中都有亚毫秒的延迟。Memblaze PBlaze5最高峰值为748,510 IOPS延迟为170μs,是迄今为止表现最好的。


    注意:图中标注了New FW 和Old FW


    接下来我们看看4K写入性能,这里PBlaze5峰值为(旧版469,345 IOPS)和211μs(旧版270μs)延迟,再次是性能大幅提升。


    转向顺序性能,我们研究了我们的64K基准。在64K连续读取的情况下,PBlaze5峰值为43,653 IOPS或2.72GB / s(旧版45,252 IOPS或2.83GB / s),延迟为366μs(旧版353μs),再次位列榜首。


    对于64K顺序写入,PBlaze5领先,最高峰值为30,760 IOPS或1.92GB / s(旧版30,760 IOPS或1.92GB / s),延迟为517μs。


    接下来我们来看看我们的SQL工作负载,其中没有驱动器超过1ms的延迟。Memblaze PBlaze5峰值为243,899 IOPS,延迟为131μs(旧版221,695 IOPS,延迟为144μs)。


    在我们的SQL 90-10中,PBlaze5继续占据主导地位,峰值评分为235,428 IOPS,延迟为135μs(旧版为206,545 IOPS,延迟为155μs)。


    SQL 80-20显示,迄今为止,PBlaze5处于领先地位,幅度最广,最高得分为229,029 IOPS,等待时间为139μs(旧版189,149 IOPS,延迟为168μs)。


    Oracle工作负载再次展示了所有驱动器亚毫秒级的性能。在Oracle工作负载中,PBlaze5峰值为277,100 IOPS,延迟为157μs(旧版177,556 IOPS,延迟为204μs)。


    使用Oracle 90-10时,PBlaze5以178,747 IOPS和123μs(旧版163,525 IOPS和134μs)的延迟赢得了榜首。


    我们最后的Oracle基准测试结果80-20显示PBlaze5的最高峰值为177,851 IOPS,延迟为123μs(旧版154,576 IOPS,延迟为142μs)。



    接下来我们切换到我们的VDI克隆测试,Full和Linked。对于VDI完全克隆启动,PBlaze5再次以高达184,936 IOPS的峰值和189μs的延迟(旧版165,576 IOPS的峰值和延迟209μs)位居榜首。


    对于VDI FC初始登录,PBlaze5领先其他驱动器,峰值为118389 IOPS,延迟251μs(旧版77,241 IOPS,延迟为386μs)。


    借助VDI FC Monday登录,PBlaze5的性能达到75,691 IOPS,延迟时间为209μs(旧版54,292 IOPS,延迟为293μs)。


    在VDI LC Boot测试中,我们看到东芝PX04比其他任何硬盘都要接近PBlaze5。PBlaze5仍然以88,179 IOPS,延迟为180μs(旧版80,424 IOPS和198μs的延迟)出现。


    VDI LC初始登录再次看到Memblaze的突破,但PBlaze5能够以41,657 IOPS 和189μs的延迟(旧版30,091 IOPS和263μs延迟)获得最高得分。


    我们的最终测试是VDI LC Monday Login,它的PBlaze5峰值为59,449 IOPS和267μs延迟(旧版39,608 IOPS和401μs延迟)。


    结论

    Memblaze PBlaze5 NVMe SSD是该公司的第二代NVMe企业级硬盘。该硬盘的最大容量为11TB(700系列),速度为6GB / s,超过100万次IOPS,延迟低至15μs。该驱动器有两种形式:热插拔2.5“U.2和HHHL AIC。该驱动器还提供两个系列:耐久性较低,成本较低的700系列和容量较高,耐久性较高,可用性较高以及加密的900系列。


    关于性能,在我们的应用程序工作负载分析中,Memblze PBlaze5在SQL Server中提供了很好的数字,拥有12,629.9 TPS和7.5 ms的平均延迟,但是,PBlaze4能够在2.5ms内击败它。在Sysbench中,PBlaze5在交易测试中的得分最高,为8260.5 TPS,平均延迟为15.5ms,最坏情况为29.4ms。在我们的Houdini工作负载中,PBlaze5落后于上一代驱动器和其他NVMe企业SSD。


    在我们的VDbench测试中,PBlaze5在每次测试中均占据主导地位,并且时间很长。在我们的4K测试中,PBlaze5能够以170μs的读取延迟和超过597K的IOPS以及211μs的延迟达到接近750K的IOPS。对于64K顺序,驱动器的写入速度为2.71GB / s,写入时延迟为363μs,读取时延迟为2.37GB / s,延迟时间为365μs。PBlaze5在SQL测试中,其峰值分数大约为244K IOPS,90-10的IOPS为235K,80-20的IOPS为229K。Oracle向该驱动器展示了大约227K IOPS,90-10的有17.0K IOPS和80-20的17.8K IOPS。在进行VDI克隆测试时,PBlaze5领先,尽管其他一些驱动器在链接克隆测试中投资巨大。


    总结

    Memblaze PBlaze5 NVMe固态硬盘提供了优于上一代的渐进式更新,同时设置了11TB的容量,这对于有这么大容量的NVMe固态硬盘来说表现非常不错。 


    本文由SSD 社区译者翻译(如有侵权,请联系作者删除)

    原文参考地址:

    1. http://www.storagereview.com/memblaze_pblaze5_nvme_ssd_review


    扩展阅读

    中美贸易大战,半导体遭重创

    新闪存,新主控,新的WD Black PCIe SSD

    SSD工程师都应该知晓的全闪存阵列(AFA)

    美光扩招1,000个新工作岗位

    内存/SSD狂涨两年 三星/美光等赚了10个华为的利润

    三星电子斥资70亿美元投资西安二号线,产能将超过总和的20%

    金士顿用A1000强攻SSD市场 群联接单乐开花

    充话费送移动硬盘,赶紧来抢

    给TA打赏
    共{{data.count}}人
    人已打赏

    相关文章

    到 2026 年,中国将消耗 21% 的国内芯片产量

    到 2026 年,中国将消耗 21% 的国内芯片产量

    IC Insights报道称,中国距离半导体自给自足还有很长的路要走。虽然到 2026 年中国的芯片产量将占其国内 IC 市场的 21.2%,但三星、SK 海力士和台积电等外国公司预计将在此期间占中国 IC 产量的 50% 以上。 中国政府在“十四五”规划中将发展半导体产业列为国家优先事项,并计划到 2025 年将 70% 的芯片在中国制造。 IC Insights 将中国的 IC 市场与中国本土的 IC 生产区分开来。尽管中国自 2005 年以来一直是世界上最大的芯片消费国,但这并不一定意味着中国的 IC 产量会

    芯片光刻领导者ASML在中国扩展业务,销售额增长至34%

    芯片光刻领导者ASML在中国扩展业务,销售额增长至34%

    据中国新闻媒体澎湃新闻报道,荷兰芯片光刻领导者ASML周一表示,其在中国的所有项目都在按计划进行,并计划今年招聘200多名员工以扩大市场业务。 在美国千方百计阻止ASML将其最尖端的光刻系统运往中国的背景下,该公司加大对市场的投资充分表明,无论美国多么不愿看到,全球巨头在像 ASML 这样的半导体行业正在中国这个全球最大的半导体消费国进行业务扩张。 生意就是生意。从投资回报率来看,ASML在中国拓展业务是完全合理的选择。据媒体报道,今年第一季度,ASML 在中国大陆的销售额占其光刻系统总销售额的 34%。 中美确实

    英特尔进军比特币挖矿设备市场

    英特尔进军比特币挖矿设备市场

    本文由半导体产业纵横综合   英特尔总部位于加利福尼亚州圣克拉拉   英特尔公司的新比特币挖矿芯片可能会成为多年来主导市场的中国挖矿设备制造商的第一个主要挑战者。   这家总部位于加利福尼亚州圣克拉拉的芯片制造巨头本月早些时候公布了其加密挖矿计划,并于1月份推出了第一代Bonanza Mine芯片。Jack Dorsey 的数字支付公司Block Inc.以及两家矿业公司Griid Infrastructure 和Argo Blockchain将在今年晚些时候收到第一批芯片。 &nbs

    浅谈铁电存储器:如何实现下一代内存计算?

    浅谈铁电存储器:如何实现下一代内存计算?

    本文由半导体产业纵横编译自technews 因应人工智能、物联网、5G、车载等新兴科技所迎来的巨量资讯分析需求,近年来各国政府及国际知名大厂皆积极地投注大量资源,加速开发兼具提升运算速度以及降低耗能的下世代存储器。而新兴存储器技术选项中,当属铁电存储器最被看好,其原理、技术挑战与未来机会为何?(本文出自中国台湾清华大学工程与系统科学系巫勇贤教授,于闳康科技“科技新航道合作专栏”介绍《铁电存储器的原理、挑战与展望》文稿,经科技新报修编为上下两篇,此篇为上篇。)    Memory-Centric
    企业存储后端开发

    中美贸易大战,半导体遭重创

    2018-4-7 14:09:40

    企业存储后端开发

    (阅后即焚)赵伟国辞任董事长:中国芯片产业“紫光模式”被终结

    2018-4-9 15:56:53

    0 条回复 A文章作者 M管理员
      暂无讨论,说说你的看法吧
    个人中心
    购物车
    优惠劵
    今日签到
    有新私信 私信列表
    搜索