铠侠BiCS6 3D NAND不再层数至上,PCIe Gen5时代SSD有新玩法
嘉宾专访 2021-09-23 10:33 电子工程专辑
由于在平面工艺上继续提升容量遇到了瓶颈,闪存生产商转向在垂直方向上提升容量,这导致近年来3D NAND成为大热的话题。据介绍,BiCS Flash的层数不断增加,从48层到64层、96层、112层到了现在的162层,未来甚至会更高。同时存储单元的比特位也从SLC,MLC提升到现在的TLC和QLC。那么3D NAND的层数会不会一直增加?如果垂直方向层数一直增加,是否会导致芯片厚度越来越大?
9月初,日媒传出铠侠(Kioxia Holdings Corp)将于11月进行首次公开发行(IPO)。而就在8月底,《华尔街日报》援引消息人士的话报道称,西部数据(Western Digital)在与铠侠就可能的并购事宜进行早期洽谈,交易规模可能高达200亿美元。
IPO一直是最优选,在等待合适时机
作为世界第二大闪存芯片制造商,铠侠究竟会选择IPO还是与西部数据合并,牵动着整个半导体乃至电子行业的心。在日前举办的2021闪存峰会(CFMS)上,多位铠侠高管在接受《电子工程专辑》采访时对这一问题进行了回应。
接受采访的铠侠电子(中国)有限公司高管,由左到右依次为:闪存颗粒技术统括部总经理兼首席技术总监 森计三,业务企划统括部副总经理 天野竜二,董事长兼总裁 岡本成之,SSD事业统括部首席技术顾问 户谷得之,SSD事业统括部总经理 谭弘
早在今年3月,业界已有关于西部数据并购铠侠的风声传出,但铠侠电子(中国)有限公司董事长兼总裁岡本成之表示,“(并购一事)不管是业界传说还是新闻,都不是铠侠官方发表。而我们要IPO这件事情从去年开始到现在一直没变,只是在选择一个合适的时间点。“
3D NAND没必要一味追求层数
由于在平面工艺上继续提升容量遇到了瓶颈,闪存生产商转向在垂直方向上提升容量,这导致近年来3D NAND成为大热的话题。作为闪存的发明者,铠侠从2016年开始生产3D闪存,其BiCS Flash品牌3D闪存已经使用在汽车、数据中心、智能手机、PC、平板电脑、企业级以及消费游戏类等诸多应用中。
据介绍,BiCS Flash的层数不断增加,从48层到64层、96层、112层到了现在的162层,未来甚至会更高。同时存储单元的比特位也从SLC,MLC提升到现在的TLC和QLC。
那么3D NAND的层数会不会一直增加?如果垂直方向层数一直增加,是否会导致芯片厚度越来越大?铠侠方面表示,也许大家觉得层数是3D闪存容量最关键的参数,但这并不完全正确,因为层数增加会带来制造成本的直线上升,而业界对性价比型的闪存需求一直存在。
上图左侧展示的是3D闪存的发展世代,垂直轴代表层数。从相关性可以看出,没有必要通过增加厚度来增加层数,因为晶圆厂的生产时间和存储阵列的厚度同比例的增长。这也意味着,单纯的增加层数并不能降低生产成本。
铠侠认为,即使在3D闪存时代,平面密度也是闪存技术的关键区分因素。近期铠侠发布的UFS 3.1嵌入式闪存,封装厚度大大降低,256G的颗粒高度仅仅0.8mm,随机读写性能也提高了30%以上,如上图右侧展示了如何提升平面方向上的存储密度。“直到第5代BiCS(BiCS5)铠侠都使用CNA结构,即CMOS电路布置在存储阵列旁边。因为这种配置可以最大程度缩短生成时间,并优化晶圆厂的产出。”
BiCS 6中会采用的新技术
由于目前160层以上的存储阵列和CMOS电路相比已经足够小。铠侠决定在162层第六代BiCS (BiCS6)中采用CUA结构,即CMOS电路配置在存储阵列下方。尽管这样,芯片厚度会大于CNA,生产时间也会更长,但是从单片晶圆中产出的芯片数量的增加可以弥补生产时间变长的影响。
“为缩短生产时间,增加层数,铠侠会引入CBA结构,即CMOS/存储阵列键合。”铠侠表示,“在CBA结构中,存储阵列和周边电路会分别生产。最终,将两片晶圆键合在一起以形成一个存储器芯片。“这样做能够在垂直和水平上缩小Die尺寸,与BiC5相比Die Size能下降40%。
此外,铠侠还将进一步研究PLC,5位存储单元,为单一存储单元内存放更多位数据。并且利用“孪生”BiCS (TWIN BiCS)实现更高的平面密度。
这些技术铠侠曾在2019年CFMS中介绍过,预计在未来几年中大家会看到实际的存储产品。
铠侠SSD业务一览
SSD业务方面,铠侠从企业级SAS SSD开始起步,至今已有10多年的历史。2012年,铠侠生产了第一台SAS 12G SSD;从2017年起,从SSD硬件,扩展到Kumoscale软件;2020年交付的新产品包括——第一个PCIe Gen4企业级SSD、第一个SAS 24G SSD、第一个EDSFF E3S和E1S SSD;2021年,发布了低延迟SSD。
从铠侠既有的产品划分看来,SSD有3个细分市场,分别是企业级PM6和CM6、数据中心级CD6和XD6以及消费级XG7、XG6和BG4。“铠侠通过全面的SSD产品线覆盖了这三个细分市场。”铠侠说到。
以2.5英寸FF的以太网SSD为例,上图曾在2019年的CFMS上作为“开发中”的技术被介绍,这是一款原生以太网NVMe-oF SSD,它能提供超高性能和更低的功耗,如今它将与EBOF系统一起,在今年推出。
据铠侠介绍,他们正在与2家伙伴Acton和Foxconn合作,开发原生的NVMe-oF SSD EBOF。这些EBOF具有支持RoCEv2之上的DRAM协议的以太网背板,以太网SSD可以通过地址目录连接到以太网背板。由于不像PCIe SSD常规JBOF那样的CPU数据传输处理,EBOF和以太网SSD能够实现非常高的带宽和更低的功耗。
填补DRAM和闪存之间空白的新型存储器
如上图所示,左边是内存的层次结构, 第一行是连接到CPU核心目录的SRAM,第二行是连接到CPU总线的DRAM DIMM。底部是TLC和QLC闪存。由于DRAM和闪存之间存在缺口,SCM成为了填补DRAM和闪存之间空白的新型存储器。
铠侠表示,现在公司正在生产新的SCM级SSD,名为FL6。这是一种基于PCIe Gen4 SSD,容量从800GB到3.2TB,耐久性为60 DWPD(每天写入数据量)。 上图是CM6和FL6的比较,FL6的记录介质是使用NAND闪存技术作为SCM开发的低延迟闪存。
两者的特点有所不同,CM6是针对企业市场的PCIe Gen4 TLC SSD;FL6的随机读取性能受PCIe Gen4总线速度限制,但随机写入、读取延迟、写入延迟,显示出明显优于CM6的能力。
FL6 的60x DWPD是无法由TLC SSD实现的。如上图所示,此图表显示每个设备的延迟和队列深度,左边更好。左下角是DRAM,显示非常低的延迟,价格比其他设备高。SCM使用交叉点内存,价格也很高,因为需要对新技术进行晶圆厂投资,目前还没有大规模经济效益。
“而FL6没有在所有队列深度上显示低延迟,在高队列深度区域显示类似的延迟,是因为FL6是基于与TLC NAND闪存SSD类似的架构。“铠侠表示,”我们不直接说价格,但利用低延迟闪存,不需要晶圆厂投资,你可以很容易地想象大规模NAND闪存的经济性。“
上图是交叉点型SCM和FL6之间的比较,需要注意的是,后者在成本和价格上有很大优势。左页是Postgre SQL,右页是TPC-C,他们性能差别很小,没有价格差大这凸显了FL6具有的经济优势。
PCIe强势,但SAS SSD仍有大量市场
铠侠的PM6是首款SAS 24G SSD,面对强势的以PCIe为基础的NVMe,铠侠仍投入更新SAS产品线。纠其原因,铠侠表示,即使PCIe SSD的市场正在增长,但主要集中在企业级应用上,基于SCSI应用的高性能SAS SSD的市场仍然很大。“铠侠在SAS市场的占有率高达30%以上,会持续提供新标准接口产品,例如最新的SAS4,比SAS3带宽提升了一倍。PM6可以采用SAS 12G(SAS3)和24G(SAS4),与传统平台保持兼容性,并在连接到SAS 24G平台时实现双倍性能。PM6涵盖了所有传统需求,400GB至30TB容量,1、3和10DWPD,以及9W、12W、14W和18W的功耗。”
上图是PM5和PM6之间的性能比较,橙色条是PM5,蓝色条是PM6,浅蓝色是SAS 12G的PM6,深蓝色是SAS 24G的PM6。PM5是使用BiCS闪存Gen3的SAS 12G SSD,而PM6不仅是从第三代BiCS闪存提升到第四代,也是SAS 12G到24G的提升。
可以看出,SAS 12G的PM6性能与PM5几乎相似,但SAS 24G大幅提升,铠侠表示,SAS 24G x2总线比PCIe Gen3x4更快,还可以避免从SCSI更改为NVMe的软件开发投资——这是SCSI应用软件用户的痛苦。现在SCSI应用程序可以在具有PM6的SAS 24G性能加倍的情况下运行。
在数据中心用SSD产品上, CD6也迎来了下一代产品CD7。据悉,从CD5开始,CD6就使用了与CM5、CM6相同的16通道控制器。而CD7使用了根据市场需求优化的8通道控制器,也是PCIe Gen4产品,容量从960GB到15TB,具有1和3 DWPD。
CD6和CD7都是PCIe Gen4 x4 SSD,从两者的比较可以看出,即使控制器从16通道变为8通道,但CD7所有的写性能指标都优于CD6,特别是随机写入IOPS明显优于CD6,写入延迟也提升了。
SSD行业即将迎来PCIe Gen5时代
如今,整个SSD行业正在迎来PCIe时代的变革, PCIe Gen5 SSD即将推出,Gen5将大幅度改善各类的应用性能。
铠侠也在顺应这个大趋势,即将于今年第四季度推出基于PCIe Gen5 的CD7系列SSD。鉴于当前SSD的体量已足够大,无需使用与HDD兼容的外形尺寸,所以新品外形尺寸采用最新开发的EDSFF E3S,这也是为开发PCIe Gen5潜力而优化的外形尺寸,考虑了散热、信号完整性和容量密度等问题。
除了针对数据中心应用提供8通道控制器版本,铠侠表示,还将针对企业级应用提供16通道控制器版本的Gen5 SSD。EDSFF和2.5英寸U.2都即将在明年第二季度上市,容量为1.6TB至30TB,以及1和3 DWPD。
铠侠还畅想了使用16通道控制器的PCIe Gen5 SSD带来的提升。如前所述,使用第5代PCIe SSD取代第4代SSD,可以将存储节点性能提高一倍。即使PCIe Gen4已经很好,但如上图所示,所有PCIe Gen5的性能指标更加可观。即便如此,铠侠也表示,PCIe Gen4并不是一个过渡性技术,预计到2022年Gen5才会逐渐被市场接受,还需要5到6个月时间在服务器厂商做测试认证。在这之前Gen4仍是最成熟、性能最高的。
铠侠表示,“如今,摩尔定律在CPU和DRAM技术上都已失效,但在PCIe时钟速率上仍然有效。2015年是PCIe第3代,2019年是第4代,2022年将是第5代。人们就算花巨资,也没办法再通过翻倍CPU节点来提升系统性能,但只需购买Gen5 SSD而不是Gen4 SSD,就可以大大提高系统性能。”
闪存市场展望
从整个闪存市场来看,铠侠认为未来几年都将处于上升期。在与手机厂商合作时他们发现,由于5G手机对容量的需求不断增长,对NAND Flash颗粒的容量提出了新需求。同时,铠侠表示,疫情带来的在线办公、购物和学习正在成为消费者的新习惯,疫情结束后大家也会习惯于便利的线上操作,再加上数据中心对于SSD需求持续增加,所以预期疫情结束后NAND Flash和SSD市场也不会大幅度回调。
汽车市场则是NAND Flash的新增长点,尤其是自动驾驶和高级辅助驾驶功能对存储容量需求比原来的车载产品更高。铠侠表示,针对这个市场,铠侠已经开始提供大容量车规级eMMC、UFS闪存,“尤其是在L4、L5自动驾驶功能的发展,需要处理速度更快、容量更大的UFS闪存,原本市面上的车规级UFS产品的容量是不够的。所以铠侠正与一些头部厂商合作开发车规级的SSD产品,预计不久就会有产品投入市场。”
铠侠在供货上的实力和努力
资料显示,铠侠总部位于日本东京,拥有世界最大闪存产能的四日市工厂,位于东京以西约300公里。当前四日市工厂还在新建Y6,Y7 两栋厂房,专门生产3D闪存。位于东京以北大约400公里还有北上工厂,其K1栋厂房也专门生产3D闪存。
四日市工厂鸟瞰图,共5栋无尘厂房,N-Y2, Y3, Y4, Y5, Y6。另外北上工厂K1厂房的建筑规模比四日市厂房要更大。对于目前整个半导体行业的缺货现象,铠侠表示,会持续在产线和设备等固定资产上持续投入,随着新厂的建成投产,会根据市场的需求及时提供产品支持,尽力满足客户的要求。