跨越AI记忆体墙:储存阶层的重新分配与HBF剖析

摘要

在AI推理应用中,MoE架构和长文本处理使模型权重与KV Cache对记忆体容量需求大幅提升,让运算瓶颈从算力不足,转向记忆体容量受限。随著海量温数据快速增加,将驱动储存阶层重构,由HBM处理热数据,HBF承载温数据以优化成本效益;然HBF的商业化仍需克服先进封装制程与NAND Flash固有特性的挑战。

一. LLM的发展瓶颈:模型架构的转变影响运算架构
二. 从算力瓶颈到储存阶层的重塑
三. 拓墣观点

图一 MoE特性说明
图二 AI储存阶层厂商布局策略说明
图三 储存阶层的热、温、冷架构说明
图四 「H3」架构说明

表一 HBM与HBF规格对照

 

跨越AI记忆体墙:储存阶层的重新分配与HBF剖析

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.20MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

SpaceX IPO带动全球卫星产值2027年达4,470亿美元,台厂抢攻卫星通讯与AI太空运算商机

随著全球卫星宽频、手机直连卫星及AI运算需求快速成长,SpaceX未来IPO动向备受市场关 [...]

NVIDIA加入Windows on Arm阵营,推升Arm架构AI笔电2029年渗透率达34.2%

根据TrendForce最新研究指出,目前AI笔电主要由Intel、AMD、Apple与Q [...]

受惠于AI资料中心规模扩张,预估2026年EML与CW-DFB LD总体月产能达5070万颗

根据 TrendForce 最新研究指出,随著AI资料中心规模扩张与算力军备竞赛,传输速率 [...]

DRAM持续供不应求使供应商握HBM定价主导权,预估2027年HBM合约价将倍数上涨

根据TrendForce最新研究指出,2H25以来在一般型DRAM(conventiona [...]

Agentic AI刺激记忆体需求扩张,预估2027年全球记忆体产值将扩大至1.28兆美元

根据TrendForce最新记忆体产业研究,AI发展从大型模型训练转向以推理为核心的Age [...]