AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

摘要

2025年随著AI Inference需求大幅扩展,各大GPU供应商接连推出针对Inference Prefill阶段设计的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中国华为也推出Prefill专用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference应用的ASIC,仍未推出针对Prefill阶段的ASIC。

因此本篇报告主要深度解析:(1)目前ASIC开发进度;(2) ASIC与GPU能效比较;(3) Inference对AI晶片的规格要求;(4)目前Inference Prefill晶片发展;(5) Inference应用的ASIC技术规格展望。期能为厂商与投资人解析在Inference应用扩增背景下ASIC的市场发展方向。

一. 目前ASIC开发进度
二. ASIC与GPU能效比较
三. Inference对AI晶片规格要求
四. 目前Inference Prefill晶片发展
五. Inference应用的ASIC技术规格展望
六. 拓墣观点

图一 AI晶片能效比趋势
图二 Scaling Law三阶段
图三 SPAD架构示意图
图四 NVIDIA Rubin CPX结构
图五 VR NVL144 CPX Compute Tray
图六 华为Ascend 950PR
图七 Intel Crescent Island
图八 Qualcomm AI200

表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC设计服务商预计取得专案
表三 主要AI晶片算力与能效比
表四 Prefill与Decode比较
表五 目前已公布Inference AI晶片列表
表六 AI晶片规格演进

 

AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.33MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

北美厂商扩大投资AI资料中心助力, 2026年全球九大CSP资本支出上调至8,300亿美元

根据TrendForce最新AI产业研究,由于多数北美主要云端服务供应商(CSP)近日再度 [...]

AI光互连商机促美系厂商扩大东南亚外包,科技厂凭半导体优势跨界抢市

根据TrendForce最新AI Infra研究,全球光收发模组出货量将从2023年的2, [...]

AI竞争成供应链军备赛,先进封装、3nm制程同步紧缺

根据TrendForce最新晶圆代工产业研究,AI需求自2023年起急速成长,导致3nm至 [...]

AI需求稳健、消费类承压,MLCC供应商定价现分歧

根据TrendForce最新研究,2026年第二季MLCC市场呈现「AI应用强、消费需求弱 [...]

预估2026年全球手机直连卫星市场规模将年增49%,供应链迎新机遇

随著全球行动通讯标准3GPP Release 17与Release 18持续将卫星通讯纳入 [...]