根据韩媒报导,韩国科学技术院(KAIST)电机工程系教授 Kim Joung-ho(在韩国媒体中被誉为“HBM 之父”)表示,高频宽快闪记忆体(High Bandwidth Flash,HBF)有望成为下一代 AI 时代的重要记忆体技术,将与高频宽记忆体(HBM)并行发展,共同推动芯片大厂的业绩成长。
HBF 的设计概念与 HBM 相似,皆透过硅穿孔(TSV)将多层芯片堆叠连接。差别在于 HBM 以 DRAM 为核心,而 HBF 则采用 NAND 快闪记忆体进行堆叠,具备“容量更大、成本更具优势”的特点。Kim Joung-ho 指出,虽然 NAND 的速度不及 DRAM,但容量往往高出 10 倍以上,若以数百层乃至数千层堆叠方式建构,将能有效满足 AI 模型对庞大储存的需求,可望成为 NAND 版本的 HBM。
目前生成式 AI 模型正急速扩张,单一模型的输入 token 已达百万级别,处理过程需要 TB 级数据。在每秒数千次的读写过程中,若记忆体频宽不足,就会出现瓶颈,导致 ChatGPT、Google Gemini 等大型语言模型(LLM)的反应速度明显下降。
Kim Joung-ho 强调,这种限制来自现行的冯诺依曼架构,由于 GPU 与记忆体是分离设计,数据传输频宽决定了效能上限,“即便将 GPU 规模扩大一倍,如果频宽不足也毫无意义”。
他预测,未来 GPU 将同时搭载 HBM 与 HBF,形成互补架构:HBM 做为高速快取,负责即时运算数据,而 HBF 则承担大容量储存,直接存放完整的 AI 模型。这将有助于突破记忆体瓶颈,使 GPU 能处理更庞大的生成式 AI,甚至涵盖长篇影片等複杂内容。Kim Joung-ho 表示:“未来 AI 将不仅限于文字与图像,而能生成如电影般的长片,届时所需的记忆体容量将是现有的 1,000 倍以上。”
Tips
文章来源于 Technews,详情:click here.
文章评论