成立逾35年來始終專注於晶片智慧財產授權的Arm,於舊金山舉辦的「Arm Everywhere」活動上宣布一項歷史性轉變:首次跨足實體晶片業務,正式推出Arm AGI資料中心級CPU,以Neoverse V3架構結合先進高速通道,專為新一代代理式AI基礎設施需求量身打造。此舉不僅打破Arm長達35年的商業模式,更標誌著AI算力競賽進入全新階段。Meta、OpenAI、SAP與SK Telecom等主要科技企業均已簽署採用合約,生態系規模迅速擴張。
現象觀察:Arm為何在此時跨足實體晶片市場?
Arm長期以來扮演「幕後推手」的角色,透過授權指令集架構(ISA)與晶片設計IP,間接支撐全球數十億顆處理器的運作。然而,AI資料中心對算力密度與能源效率的需求急遽攀升,既有的IP授權模式已難以完整回應市場需求。Arm選擇在此時推出實體晶片,本質上是對「架構設計者」與「系統整合者」之間鴻溝的一次主動填補。
值得關注的是,Arm AGI CPU並非孤立的產品決策,而是建立在超過50家跨領域生態夥伴的廣泛支持之上,涵蓋超大規模雲端運算、晶片設計、記憶體、網路、軟體、系統設計與製造等多個垂直領域。這種「先建生態、再推產品」的策略,顯示Arm對市場進入時機有相當縝密的評估。
「Arm AGI CPU的推出,使Arm客戶可提供自客製化晶片到整合平台方案,再到部署Arm設計的處理器等豐富的選擇,生態夥伴可因應需求選擇合宜的解決方案。」——Arm官方聲明
原因剖析:Arm AGI CPU的技術架構與設計邏輯
Arm AGI CPU採用3奈米製程製造,熱設計功耗(TDP)為300W,內建136個運行頻率達3.7GHz的Arm Neoverse V3核心,每個核心配備2MB L2快取。在I/O擴展能力方面,該晶片支援96條PCIe Gen 6通道、CXL 3.0記憶體擴展協定,以及適用於未來晶片與加速器架構的AMBA CHI擴展介面。記憶體規格方面,支援最高DDR5-8800,每個晶片提供6GB記憶體頻寬,最大容量可達6TB。
Arm AGI CPU是與Meta共同開發的成果,設計上與Meta自研的訓練與推論加速器晶片MTIA(Meta Training and Inference Accelerator)協同運作,可在大規模AI系統中實現更高效率的任務排程。這種「CPU與加速器協同設計」的思路,正是當前AI基礎設施架構演進的核心方向之一。
在系統參考設計層面,Arm規劃符合開放運算專案(OCP)與Arm System Ready規範的1OU雙節點伺服器設計,並將公開貢獻相關設計文件、配套韌體、系統架構規範、診斷與驗證工具,以加速Arm伺服器生態的普及。
影響評估:機架級部署效能與資本支出的實質差異
依據Arm展示的10OU雙節點刀鋒伺服器設計,每個刀鋒伺服器搭載2顆Arm AGI CPU,每顆晶片各有獨立的記憶體與I/O控制,使單一刀鋒伺服器具備272個核心,並支援高達12條64GB DDR5記憶體模組。以一個標準36kW風冷機架裝載30個刀鋒伺服器計算,單一機架可提供共8,160個CPU核心。
Arm進一步與Supermicro共同開發200kW液冷設計,可容納336顆Arm AGI CPU,提供高達45,000個CPU核心。這一規模對於大型語言模型的分散式訓練與推論任務而言,具有顯著的擴展優勢。
根據Arm的參考設計數據,Arm AGI CPU的每個機架效能較x86架構高出2倍;在每GW AI資料中心的規模下,可減少高達100億美元的資本支出。
此外,Arm強調相較於x86伺服器因核心間記憶體競爭而影響持續效能的問題,Arm AGI CPU更高的記憶體頻寬有助於每個機架執行更多有效執行緒,而底層的Neoverse V3架構亦在單執行緒能耗效能方面優於傳統x86設計。永擎、聯想、廣達與Supermicro已作為系統商,開始接受搭載Arm AGI CPU的系統訂單。
趨勢預測:Arm生態系的長期演進方向
Arm明確表示,後續產品將持續在效能、擴展性與能源效率三個維度追求業界頂尖水準,同時將持續推進Arm Neoverse CSS產品路線,確保以不同方式與Arm合作的資料中心客戶,在平台架構與軟體相容性方面能夠持續並進。這意味著Arm並非以實體晶片取代既有的IP授權業務,而是在原有商業模式之上新增一個更高層次的市場切入點。
從更宏觀的視角來看,Arm此次進入實體晶片市場,實質上是對「AI基礎設施重新定義」這一命題的直接回應。當代理式AI工作負載要求系統能夠並行處理數千個核心、同時維持出色的單執行緒任務效能時,傳統x86架構的設計假設已面臨根本性的挑戰。Arm AGI CPU的問世,或許正是這場算力典範轉移中,一個具有指標意義的里程碑。
Arm AGI CPU相關常見問題
Arm AGI CPU是什麼?與一般Arm晶片有何不同?
Arm AGI CPU是Arm首款實體晶片產品,由Arm與Meta共同開發,採用3奈米製程,內建136個Neoverse V3核心,專為大規模AI資料中心的代理式AI工作負載設計。與Arm過去僅授權IP的模式不同,此次Arm直接提供完整的實體處理器產品,並規劃符合OCP標準的參考伺服器設計。
哪些企業已宣布採用Arm AGI CPU?
目前已宣布採用或簽署合約的企業包括Meta、OpenAI、Cerebras、Cloudflare、F5、Positron、Rebellions、SAP以及SK Telecom等。系統商方面,永擎、聯想、廣達與Supermicro已開始接受搭載Arm AGI CPU的系統訂單。
Arm AGI CPU在效能上相較x86架構有何優勢?
根據Arm的參考設計數據,Arm AGI CPU的每機架效能較x86高出2倍,在每GW AI資料中心規模下可減少100億美元資本支出。此外,其更高的記憶體頻寬可有效避免x86架構中核心間記憶體競爭的問題,在持續高負載情境下維持更穩定的執行緒執行效率。

