
【导读】AI已经经进入了以天生式AI、智能体AI的成长阶段。依赖年夜语言模子,用户可以经由过程AI完成智能决议计划及信息流程处置惩罚主动化。于AI与GPU协同运作的经典场景中,高带宽内存HBM(High Bandwidth Memor)为GPU高频拜候数据提供高速毗连通道,尤其是模子权重、KV Cache等高频拜候数据需要年夜量HBM,但直接扩容成本昂扬且存于物理限定。 可以这么说,HBM的容量直接决议了AI体系可否满意多使命需求,例如可撑持的模子范围上限、模子可处置惩罚的上下文窗口长度,或者是可同时撑持的用户数。但实际也是骨感的,因为AI运用的连续增加,再加之今朝AI体系过在依靠HBM,致使HBM容量需求爬升,而昂扬成本的HBM不是说想扩容就扩容的,因为制造工艺极度繁杂、供给链高度集中、物理空间受限三重因素叠加,于短期内解决扩容问题不太实际。 作为存储行业引领者,铠侠敏锐的不雅察到SSD有巨年夜的潜力,可以或许帮忙GPU与AI减缓对于HBM容量的需求。经由过程开源的Big Accelerator Memory(BaM)框架,答应GPU直接拜候SSD数据,无需颠末CPU或者者体系内存,为GPU级另外数据传输能力奠基了基础。 而从存储层面来看,假如想紧跟GPU成长节拍,依赖现成的SSD产物是远远不敷的。为此,铠侠专门打造一款超高速IOPS SSD,帮忙AI体系于极小数据块场景下实现单盘机能的冲破性晋升,从而满意AI运用不停进级的需求。 于FMS 2025上,铠侠初次预报了这款超高IOPS SSD存于,512B随机读取机能可冲破1亿IOPS,同时也验证了这套方案于BaM架构下实现的可能性,为后续产物化奠基了基础。1亿IOPS SSD象征着,可以有用分管原本仅能由HBM负担的高频拜候负载,并得到远比HBM更年夜的容量,从而构建出一套依托年夜容量、高机能 GPU 直连存储池的全新架构。 这套方案很快收到了业内的存眷,于配合努力下,基在BaM架构的解决方案蓬勃成长。例如NVIDIA推出了NVIDIA Storage-Next™技能,只于NVMe™ SSD 深度集成至 GPU I/O 链路的解决方案。于本年GTC 2026上,铠侠缭绕这项技能正式推出了全新的KIOXIA GP系列SSD,向1亿IOPS SSD产物化迈出了坚定的一步。 撑持1亿IOPS暗地里的技能源自在铠侠对于XL-FLASH™技能的矫捷运用。XL-FLASH™是铠侠开发的一种具备极低延迟、高机能特征的闪存,于很永劫间中作为存储级内存(Storage Class Memory,SCM)利用。全新的KIOXIA GP系列SSD恰是基在XL-FLASH™技能的不停演进,让企业级SSD的随机读写操作机能,由600万摆布IOPS,晋升至在1亿IOPS,这是一场很是夸张的超过,也证实了这项技能将来的广漠远景。 超高IOPS可以进一步帮忙体系晋升相应敏捷度。尤其是于当下,现代AI办事器配备年夜量昂贵GPU,但如果存储层没法快速提供海量小数据块的随机拜候(推理阶段的典型负载),GPU算力将被迫余暇等候。拥有超高IOPS的GP系列SSD经由过程极致随机读取机能消弭这一瓶颈,晋升AI基础举措措施总体效率。也进而解决GPU饥饿(GPU Starvation)的焦点问题。 不仅云云,GP系列已经经开启了不停进化的征程,初代GP系列SSD基在 PCIe® 6.0 尺度研发,第二代产物则对准 PCIe® 7.0 尺度结构,将 1 亿 IOPS 的机能里程碑酿成实际。 于现阶段,GP系列已经经于模仿情况实现了验证。下图左边传统 SSD 的机能约为 1300 万 IOPS,而模仿的超高 IOPS SSD(左起第三张图)机能则一举冲破 1.07 亿 IOPS。依附该技能,开发者可提早接触这款下一代存储装备,提早完成软件栈适配与优化,从而充实开释超高 IOPS SSD 带来的史无前例的速率潜力。铠侠规划在 2026 年底启动 KIOXIA GP 系列初代产物的样品交付,并在 2027 年内推出第二代产物。 铠侠GP系列SSD的降生,也标记着存储脚色从数据堆栈向AI算力扩大内存改变——SSD再也不只是存放冷数据,而是成为GPU的热数据缓存层,与HBM协同组成分级存储架构,以更低成本支撑更年夜模子、更长上下文窗口及更多并发用户。同时,铠侠也将不停努力,与行业互助伙伴联袂,将XL-FLASH™技能等前沿技能推向市场,配合晋升AI体系的运行效率。 





