AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

摘要

2025年随著AI Inference需求大幅扩展,各大GPU供应商接连推出针对Inference Prefill阶段设计的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中国华为也推出Prefill专用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference应用的ASIC,仍未推出针对Prefill阶段的ASIC。

因此本篇报告主要深度解析:(1)目前ASIC开发进度;(2) ASIC与GPU能效比较;(3) Inference对AI晶片的规格要求;(4)目前Inference Prefill晶片发展;(5) Inference应用的ASIC技术规格展望。期能为厂商与投资人解析在Inference应用扩增背景下ASIC的市场发展方向。

一. 目前ASIC开发进度
二. ASIC与GPU能效比较
三. Inference对AI晶片规格要求
四. 目前Inference Prefill晶片发展
五. Inference应用的ASIC技术规格展望
六. 拓墣观点

图一 AI晶片能效比趋势
图二 Scaling Law三阶段
图三 SPAD架构示意图
图四 NVIDIA Rubin CPX结构
图五 VR NVL144 CPX Compute Tray
图六 华为Ascend 950PR
图七 Intel Crescent Island
图八 Qualcomm AI200

表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC设计服务商预计取得专案
表三 主要AI晶片算力与能效比
表四 Prefill与Decode比较
表五 目前已公布Inference AI晶片列表
表六 AI晶片规格演进

 

AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.33MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

晶圆代工、封测成本齐涨,DDIC供应商酝酿上调报价

根据TrendForce最新调查,由于2025年起半导体晶圆代工、后段封装测试成本逐步提高 [...]

2025年全球OLED监视器出货量年增92%,ASUS站稳领先地位

根据TrendForce最新调查,2025年全球OLED监视器出货量达273.5万台,年增 [...]

低容量NAND Flash供给紧缩、品牌推动AI革新,预估2026年智慧手机平均容量年增4.8%

根据TrendForce最新记忆体产业研究,尽管2026年全球智慧手机品牌面临NAND F [...]

AI动能稳健,预估2026年晶圆代工产值年增24.8%,零星涨价浮现

根据TrendForce最新晶圆代工产业研究,2026年由于北美云端服务供应商(CSP)、 [...]

NVIDIA多元产品分攻AI训练、推理需求,迎战CSP自研ASIC规模升级

根据TrendForce最新AI server研究,在大型云端服务供应商(CSP)加大自研 [...]