本文简单介绍了企业级SSD选型时需要考虑的9个因素,包括接口、扩展、物理设计、寿命、芯片、错误处理和数据保护、功耗、性能、监控管理等。
一、接口选项
主流接口选项有三种:SAS、SATA和PCIe。
接口会影响价格、性能、容量、寿命和物理大小等因素。如下图所示。
从软件栈上比较来看,考虑企业级应用中延时的重要性,PCIe在降低IO等待时间、提升CPU利用率、单个SSD上启用更多用户/进程等方面更有优势。
Gen3 PCIe每条链路带宽8Gb/s。
SATA/AHCI和PCIe/NVMe之间的区别如下。
二、SSD性能扩展
关注每个IOPS的成本。
多个SAS/SATA接口SSD可能不如一块PCIe SSD。随着工作负载或线程数量增加,SATA和SAS的延时会放大,软件性能瓶颈可能出现,从而影响设备的聚合性能。下图是测试对比。
三、物理设计
例如3.5英寸磁盘/2.5英寸磁盘/扩展卡等,会影响数量、可维护性等因素。
现在服务器厂商开始提高PCIe闪存卡的hot-swap等可维护性,可像磁盘一样从服务器前端维护,无需打开服务器。
四、寿命
指标一:Drive Writes per Day (DWPD)。需要注意DWPD如何去算的,有些指标实在最佳场景下得出来的,如全盘写。对应的,4KB随机写就是比较不友好的场景。
指标二:Terabytes Written (TBW)。
两者联系如下:
TBW =DWD * Warranty * 365 * Capacity/1024
其中,1024是GB到TB之间的转换。
五、NAND芯片
SLC/MLC/TLC/QLC,3D NAND等
六、ECC错误处理和数据保护
七、功耗
PCIe SSD往往功耗更高些,高端NVMe兼容的PCIe SSD(Gen3 x4)最大功耗25W左右。有些PCIe SSD功耗较低,性能也相对较差。
有的产品可以对功耗选项进行设定,建议针对功耗/性能进行调试确认。
八、性能
性能测量指标包括IOPS、吞吐带宽、延迟、QoS等。
IOPS和吞吐带宽
SSD厂商的数据表里,IOPS指标性能值通常基于4KB块大小负载,吞吐带宽指标性能通常基于128KB大小负载。实际应用负载极有可能不同,读写比例、进程数、用户数等都可能有影响。
如下是几个厂商NVMe PCIe SSD产品在4KB块随机(读写比例70/30)情况下随着进程数变化时的性能测试情况,性能差异可能达到2倍。
延迟
IOPS、带宽、延迟等指标会影响用户体验、CPU使用率、CPU核心数量、软件授权许可数量、应用的服务器数量等因素。其中,延迟的影响作用也很大。
SSD厂商的数据表里,延迟指标性能值通常基于100%读比例4KB块大小负载,实际负载情况很可能区别很大。
如下是几个厂商NVMe PCIe SSD产品在4KB块随机(读写比例70/30)和特定IOPS情况下的延迟性能测试情况。
QoS
在关键应用环境中,SSD性能的一致性非常重要。控制器的垃圾回收、磨损均衡等后端处理任务与IO流量并发时,可能会影响实际性能。部分厂商会发布QoS测试情况。
建议关注如下两方面的QoS:
- 宏观QoS(在特定队列深度和时间间隔中的IOPS和吞吐带宽的一致性);
- 微观QwS(在特定负载和时间间隔中的命令完成的累积统计情况).
如下是宏观QoS和微观QoS的示例。
九、监控和管理
健康状况/性能/使用/AD集成/自动化告警/寿命报告等等
以上是 企业级SSD选型考虑 要注意的几个要点,希望对您的产品选型有帮助!
文章评论