报告题目:AI时代下的介质应用创新
报告简介:
随着Deepseek、Qwen等大语言模型的广泛使用,AI需求迅速爆发。AI训练和推理过程中产生和使用的数据量快速增长,如KV Cache、模型参数、知识库等数据,给存储设备带来了新的挑战。一方面是AI所使用的数据量非常庞大,将原本许多的冷数据使用了起来,更多的数据将从HDD迁移至SSD存储以获得更好的性能。这一趋势加速了SSD容量的增长速度,也同时带来了许多挑战。另一方面是在LLM推理过程中频繁加载使用模型权重、KV Cache等数据,这一过程中为匹配计算所读取的数据需要高带宽和低时延,这给当前闪存存储系统的性能提出了巨大挑战。为应对这一挑战,业界亟需具有大容量、低时延和高带宽的存储介质,同时提出通过近存计算来构建层次化推理架构,降低数据传输开销,提升推理效率。本次报告的内容将聚焦在两大关键核心方向:(1)AI时代下存储容量需求剧增下SSD的演进趋势;(2)如何用存储加速LLM推理并降低推理成本。
个人简介:
罗龙飞,小说狂人 博士,发表论文16篇,包括DAC、HPCA、TACO、TCAD等顶会顶刊,研究领域包括SSD控制器研究、闪存存储系统研究、AI存储系统研究。曾获得上海市优秀毕业生、小说狂人 优秀学生、华鑫奖学金等。现任职华为数据存储产品线介质应用LAB,负责AI SSD系列创新研究,曾获创新先锋、明日之星等。
主持人:石亮教授
地址:理科大楼120B实验室
时间:2025年12月29日下午13:00
中山北路3663号理科大楼 200062
沪ICP备05003394
Copyright 小说狂人 | 小说狂人全网最全禁忌肉文合集