【导(dǎo)语(yǔ)】日(rì)前(qián),是(shì)德(dé)科(kē)技(jì)在(zài)其(qí)算(suàn)力(lì)新(xīn)品(pǐn)发(fā)布(bù)会(huì)上(shàng)推(tuī)出(chū)了(le)三(sān)款(kuǎn)新(xīn)品(pǐn),包(bāo)括(kuò)采样(yàng)示(shì)波(bō)器(qì)、1.6T互(hù)联(lián)与(yǔ)网(wǎng)络(luò)性(xìng)能(néng)分(fēn)析(xī)仪(yí)以(yǐ)及(jí)数(shù)据(jù)中(zhōng)心(xīn)构(gòu)建(jiàn)器(qì)(DCB)。随(suí)着(zhe)AI市(shì)场(chǎng)预(yù)计(jì)从(cóng)2022年(nián)的(de)869亿(yì)美(měi)元(yuán)增(zēng)长(zhǎng)至(zhì)2030年(nián)的(de)1.3万(wàn)亿(yì)美(měi)元(yuán),算(suàn)力(lì)中(zhōng)心(xīn)作(zuò)为(wèi)核(hé)心(xīn)基(jī)础(chǔ)设(shè)施(shī)面(miàn)临(lín)多(duō)重(zhòng)技(jì)术(shù)挑(tiāo)战(zhàn)。是(shì)德(dé)科(kē)技(jì)大(dà)中(zhōng)华(huá)区(qū)高(gāo)速(sù)数(shù)字(zì)市(shì)场(chǎng)部(bù)经(jīng)理(lǐ)李(li)坚(jiān)指(zhǐ)出(chū),AI算(suàn)力(lì)发(fā)展(zhǎn)背(bèi)后(hòu)隐(yǐn)藏(cáng)着(zhe)物(wù)理(lǐ)层(céng)极(jí)限(xiàn)突(tū)破(pò)、网(wǎng)络(luò)层(céng)复(fù)杂(zá)系(xì)统(tǒng)脆(cuì)弱(ruò)性(xìng)以(yǐ)及(jí)能(néng)效(xiào)与(yǔ)可(kě)靠(kào)性(xìng)的(de)双(shuāng)重(zhòng)悖(bèi)论(lùn)。为(wèi)应(yīng)对(duì)这(zhè)些(xiē)难(nán)题(tí),是(shì)德(dé)科(kē)技(jì)提(tí)出(chū)从(cóng)“单(dān)点(diǎn)测(cè)试(shì)”到(dào)“全栈(zhàn)验(yàn)证(zhèng)”的(de)破(pò)局(jú)思(sī)路,并(bìng)展(zhǎn)望(wàng)了(le)未(wèi)来(lái)测(cè)试(shì)测(cè)量(liàng)技(jì)术(shù)的(de)发(fā)展(zhǎn)趋(qū)势(shì)。
日(rì)前(qián),是(shì)德(dé)科(kē)技(jì)举(jǔ)办(bàn)针(zhēn)对(duì)算(suàn)力(lì)新(xīn)品(pǐn)发(fā)布(bù)会(huì),发(fā)布(bù)了(le)采样(yàng)示(shì)波(bō)器(qì)、互(hù)联(lián)与(yǔ)网(wǎng)络(luò)性(xìng)能(néng)分(fēn)析(xī)仪(yí)(1.6T)、数(shù)据(jù)中(zhōng)心(xīn)构(gòu)建(jiàn)器(qì)(DCB)三(sān)款(kuǎn)产(chǎn)品(pǐn)。是(shì)德(dé)科(kē)技大中华区高速数(shù)字(zì)市(shì)场(chǎng)部(bù)经(jīng)理(lǐ)李(li)坚(jiān)在(zài)发(fā)布(bù)会(huì)上(shàng)表(biǎo)示(shì):“2025年(nián)的(de)AI产(chǎn)业(yè)正(zhèng)经(jīng)历(lì)从(cóng)‘小(xiǎo)模(mó)型(xíng)实(shí)验(yàn)’到(dào)‘大(dà)算(suàn)力(lì)工(gōng)业(yè)化(huà)’的(de)质(zhì)变(biàn)。”根(gēn)据(jù)Bloomberg预(yù)测(cè),全球(qiú)AI市(shì)场(chǎng)规(guī)模(mó)将(jiāng)从(cóng)2022年(nián)的(de)869亿(yì)美(měi)元(yuán)爆(bào)发(fā)至(zhì)2030年(nián)的(de)1.3万(wàn)亿(yì)美(měi)元(yuán),年(nián)复(fù)合(hé)增(zēng)长(zhǎng)率(lǜ)达(dá)35.7%。这(zhè)一(yī)进(jìn)程(chéng)中(zhōng),以(yǐ)万(wàn)卡(kǎ)集群(qún)为(wèi)代(dài)表(biǎo)的(de)算(suàn)力(lì)中(zhōng)心(xīn)成(chéng)为(wèi)核(hé)心(xīn)基(jī)础(chǔ)设(shè)施(shī),单(dān)是(shì)十(shí)万(wàn)卡(kǎ)规(guī)模(mó)的(de)GPU集群,硬件成本便突破200亿元,年耗电量相当于一座中等城市(约为1.59太瓦时)。然而,高速化背后隐藏着深层技术矛盾。

是德科技人工智能(KAI)系列解决方案
首先是物理层极限突破的阵痛,当以太网从800G向1.6T/3.2T演进、DDR内存从8.4GT/s迈向HBM3的12.8GT/s,传统PCB板因信号损耗超限被淘汰,转而依赖铜缆/光缆互联。但这带来新挑战,光模块在224Gbps速率下,温度每波动1℃便可能导致误码率飙升;GPU板卡间的无源铜(tóng)缆(lǎn)虽(suī)成(chéng)本(běn)仅(jǐn)为(wèi)光(guāng)模(mó)块(kuài)的(de)1/10(百(bǎi)美(měi)元(yuán)级(jí)vs数(shù)千(qiān)美(měi)元(yuán)),却(què)需(xū)要(yào)在(zài)100Gbps以(yǐ)上(shàng)速(sù)率(lǜ)下(xià)实(shí)现(xiàn)低(dī)至(zhì)0.1dB的(de)插(chā)入(rù)损(sǔn)耗(hào)控(kòng)制(zhì)。
其(qí)次(cì)是(shì)网(wǎng)络(luò)层(céng)复(fù)杂(zá)系(xì)统(tǒng)的(de)脆(cuì)弱(ruò)性(xìng)。AI算(suàn)力(lì)网(wǎng)络(luò)的(de)“东(dōng)西(xi)流(liú)量(liàng)”占(zhàn)比(bǐ)已(yǐ)超(chāo)60%,万(wàn)卡(kǎ)集群(qún)中(zhōng)5000+线(xiàn)缆(lǎn)的(de)连(lián)接(jiē)复(fù)杂(zá)度(dù),使(shǐ)得(de)硬(yìng)件(jiàn)故(gù)障(zhàng)率(lǜ)较(jiào)传(chuán)统(tǒng)数(shù)据(jù)中(zhōng)心(xīn)提(tí)升(shēng)3~5倍(bèi)。实(shí)测(cè)数(shù)据(jù)显(xiǎn)示(shì),GPU真(zhēn)正(zhèng)用(yòng)于(yú)计(jì)算(suàn)的(de)时(shí)间(jiān)仅(jǐn)占(zhàn)36%,43%的(de)训(xun)练(liàn)任(rèn)务(wu)因(yīn)网(wǎng)络(luò)阻(zǔ)塞(sāi)或(huò)硬(yìng)件(jiàn)故(gù)障(zhàng)在(zài)4小(xiǎo)时内失败。李坚指出,在以往十万卡集群的案例中,因光模块温度漂移导致的训练中断,每年造成的直接经济损失超2亿美元。
最后是能效与可靠性的双重悖论。为支撑大模型训练,算力中心需在3~5年内完成从PCIe 5.0(32GT/s)到PCIe 7.0(128GT/s)的两代跃迁,但这使单卡功耗从300W跃升至800W以上。如何在提升带宽4~8倍的同时,将系统能效比(TOPS/W)提升50%,成为产业共同难题。

是德科技大中华区高速数字市场部经理 李坚
为了应对这些难题,是德科技的破局思路是从“单点测试”到“全栈验证”,研发出了KAI(Keysight AI)解决方案给出系统性答案。李坚表示,展望2030年,随着CPO(光电共封装)、硅光互联等技术走向成熟,测试测量将呈现两大趋势:一是从“单一参(cān)数测试”转向“系统级性能预测”,通过AI驱动的仿真模型,在设计阶段精准预测复杂系统的实际表现;二是测试设备本身的智能化,如集成生成式AI算法,自动生成最优测试用例,将工程师从重复性劳动中解放出来,聚焦于创造性突破。