通常配備2個(gè)CPU,具備更加綜合的計(jì)算能力、存儲(chǔ)能力和網(wǎng)絡(luò)能力,以滿足各種數(shù)據(jù)的處理和計(jì)算需求,往往用于傳統(tǒng)的計(jì)算任務(wù)和網(wǎng)絡(luò)應(yīng)用。
圖源:華為官網(wǎng)
通常采用異構(gòu)形式,除了2個(gè)CPU之外還需配備4-8張加速卡,例如CPU+GPU、CPU+TPU、CPU+其他的加速卡等,AI服務(wù)器具備大量的并行計(jì)算能力,因此需要采用更高性能的處理器、大量的內(nèi)存和存儲(chǔ)資源以及適用于AI計(jì)算的加速卡。
在應(yīng)用場景方面,AI服務(wù)器主要針對大數(shù)據(jù)、科學(xué)計(jì)算、人工智能等計(jì)算密度較高、數(shù)據(jù)處理龐大的場景。
圖源:華為官網(wǎng)
GPU加速卡(OAM),主要由GPU芯片、內(nèi)存芯片、電源模塊、散熱器等部件組成,通過PCB來連接和傳輸信號。
GPU加速卡可以分為兩種類型:SXM版本和PCIE版本。SXM版本是指使用NVIDIA公司開發(fā)的SXM接口連接GPU芯片和主板的加速卡;PCIE版本是指使用標(biāo)準(zhǔn)的PCIE接口連接GPU芯片和主板的加速卡。
SXM版本 VS PCIE版本
SXM版本相比PCIE版本具有更高的帶寬和更低的延遲,但也需要更高級別的PCB和散熱系統(tǒng)。
GPU加速卡是目前PCB行業(yè)中高端且昂貴的產(chǎn)品之一,對制造工藝要求非常高,一般會(huì)用到5-7階HDI,層數(shù)在20-26層。
GPU加速卡對PCB的要求主要有以下幾點(diǎn):
BGA芯片高密度布局
GPU和內(nèi)存BGA芯片有很多引腳很多,需要多層和多階HDI工藝來實(shí)現(xiàn)互聯(lián)。
高速信號傳輸
由于GPU加速卡上有很多組高速信號,為了保證信號的低損耗傳輸需要選擇具有較低的介電常數(shù)(Dk)、介電損耗(Df)、表面粗糙度(Rz)等參數(shù)的高速板材進(jìn)行加工。
可靠性
由于GPU加速卡需要長期穩(wěn)定運(yùn)行,因此在選用板材的時(shí)候需要板材具有較高的導(dǎo)熱系數(shù)(K)和較低的熱膨脹系數(shù)(CTE)保證PCB的熱穩(wěn)定性。
同時(shí)需要板材具有較高的玻璃化轉(zhuǎn)變溫度(Tg)、較低的水分吸收率(MOT)、較強(qiáng)的機(jī)械強(qiáng)度和耐化學(xué)腐蝕性。
7階HDI 26層 GPU加速卡(局部圖)
明陽電路生產(chǎn)
GPU模組板(UBB),即Unit Base Board,用于搭載多個(gè)GPU整合為矩陣平臺(tái),為GPU之間和GPU與CPU之間,提供高速的數(shù)據(jù)交換能力。
GPU模組板(UBB) 與 GPU加速卡(OAM)
The NVIDIA DGX A100 GPU Board
GPU加速卡,是一種基于開放標(biāo)準(zhǔn)(Open Accelerator Module)設(shè)計(jì)的GPU模塊,可以插入到GPU模組板上。
GPU模組板(UBB) 對PCB的要求主要有以下幾點(diǎn):
層數(shù)
由于GPU模組板需要通過交換芯片連接多個(gè)GPU加速卡,并且需要多個(gè)電壓的電源分配網(wǎng)絡(luò)(PDN),因此層數(shù)一般在16層以上。
孔結(jié)構(gòu)
由于GPU模組板的面積比較大,因此可以直接使用通孔來實(shí)現(xiàn)不同層之間的互聯(lián),針對高速信號的過孔可以使用背鉆工藝來減少stub帶來的信號反射。
高速信號傳輸
GPU模組板上的交換芯片和GPU模組之間有大量的高速信號線,為了保證信號的低損耗傳輸板材需要選擇PPO等高性能樹脂材料。
熱穩(wěn)定性
GPU模組板有大量的電源分配網(wǎng)絡(luò)(PDN),同時(shí)還要受到多個(gè)GPU模組和CPU母版的熱傳導(dǎo),需要選擇有較高的導(dǎo)熱系數(shù)(K) 和較低的熱膨脹系數(shù)(CTE)的板材。
CPU母板組件包括CPU、CPU主板、內(nèi)存條、PCIe交換機(jī)、網(wǎng)卡、擴(kuò)展卡和存儲(chǔ)板。以DGX A100 CPU母板為例:
DGX A100 CPU母板
圖源:fibermall
CPU主板
負(fù)責(zé)安裝CPU芯片、PCIE Switch芯片、TPM模塊以及各種功能卡,CPU主板支持AMD Rome 64核 CPU和PCIE 4.0總線,PCB層數(shù)一般為12-16層,采用通孔設(shè)計(jì),使用低損耗板材。
CPU內(nèi)存條
32個(gè)內(nèi)存條,最大支持2TB RAM。
網(wǎng)卡
Mellanox ConnectX系列有10種型號(8個(gè)單端口200Gb/s IB和2個(gè)雙端口200Gb/s以太網(wǎng))。
Riser卡
用于擴(kuò)展PCIe接口。
硬盤板
裝有兩個(gè) 1.92TB M.2 NVMe 硬盤。
AI服務(wù)器/EGS平臺(tái)升級拉動(dòng)高速PCB需求,高速PCB產(chǎn)業(yè)鏈解析-安信證券