AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

摘要

2025年随著AI Inference需求大幅扩展,各大GPU供应商接连推出针对Inference Prefill阶段设计的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中国华为也推出Prefill专用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference应用的ASIC,仍未推出针对Prefill阶段的ASIC。

因此本篇报告主要深度解析:(1)目前ASIC开发进度;(2) ASIC与GPU能效比较;(3) Inference对AI晶片的规格要求;(4)目前Inference Prefill晶片发展;(5) Inference应用的ASIC技术规格展望。期能为厂商与投资人解析在Inference应用扩增背景下ASIC的市场发展方向。

一. 目前ASIC开发进度
二. ASIC与GPU能效比较
三. Inference对AI晶片规格要求
四. 目前Inference Prefill晶片发展
五. Inference应用的ASIC技术规格展望
六. 拓墣观点

图一 AI晶片能效比趋势
图二 Scaling Law三阶段
图三 SPAD架构示意图
图四 NVIDIA Rubin CPX结构
图五 VR NVL144 CPX Compute Tray
图六 华为Ascend 950PR
图七 Intel Crescent Island
图八 Qualcomm AI200

表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC设计服务商预计取得专案
表三 主要AI晶片算力与能效比
表四 Prefill与Decode比较
表五 目前已公布Inference AI晶片列表
表六 AI晶片规格演进

 

AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.33MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

华星光电IJP OLED将于2026下半年导入品牌监视器及笔电产品,韩系主导格局迎来挑战

根据TrendForce表示,华星光电力推IJP OLED技术,希望以此切入监视器以及笔电 [...]

CSP自研ASIC浪潮加速MLCC规格集中,2H26高阶特规品恐面临结构性短缺

根据TrendForce最新MLCC产业研究,随著全球云端服务供应商(CSP)AI军备竞赛 [...]

TSMC加速布局CoPoS,台湾面板厂及相关材料、设备商藉FOPLP卡位Glass Core Substrate先机

AI半导体需求爆发驱动先进封装技术快速演进,面板级封装(FOPLP)成为各方角力的新战场。 [...]

光互连成AI Factory扩张关键,预估2030年CPO/NPO市场规模将破390亿美元

根据TrendForce最新矽光子产业研究,随著AI训练与推论需求快速扩张,AI 资料中心 [...]

AI续强、消费供应链提前备货发酵,第一季全球前十大晶圆代工营收季增3.7%

根据TrendForce最新晶圆代工产业研究,除了AI HPC与相关周边订单仍如火如荼出货 [...]