2025-11-26 09:31:45

英特尔公司副总裁、英特尔中国研究院院长宋继强:异构AI基础设施是未来发展趋势

  • 分享至
  • 分享到微信
  • 分享到微博

【导语】11月23日,第二十二届中国国际半导体博览会开幕,英特尔中国研究院院长宋继强在同期大会上称,AI计算重心转向推理应用,未来80%的AI计算用于此,智能体AI算力需求将大增,异构AI基础设施是趋势,还介绍了英特尔在制程、封装技术等方面的实践创新及对未来定制芯片的设想。

11月23日,第二十二届中国国际半导体博览会(IC China 2025)在北京国家会议中心开幕。在同期举行的第七届全球IC企业家大会上,英特尔公司副总裁、英特尔中国研究院院长宋继强发表演讲。他表示,当前,AI计算的重心已从通用基座大模型扩展至推理应用。未来,80%的AI计算将用于推理领域。异构的AI基础设施是未来发展的趋势。

640 - 2025-11-26T091521.158.jpg

宋继强表示,智能体AI是推理领域真正产生客(kè)户(hù)价(jià)值(zhí)的(de)部(bù)分(fēn),其(qí)算(suàn)力(lì)需(xū)求(qiú)将(jiāng)从(cóng)2025年(nián)起(qǐ)逐(zhú)步(bù)上(shàng)升(shēng),并(bìng)超(chāo)越(yuè)用(yòng)于(yú)训(xun)练(liàn)基(jī)座(zuò)大(dà)模(mó)型(xíng)与(yǔ)微(wēi)调(diào)大(dà)模(mó)型(xíng)的(de)规(guī)模(mó),今(jīn)年(nián),其(qí)规(guī)模(mó)已(yǐ)有(yǒu)140倍(bèi)的(de)增(zēng)长(zhǎng),达(dá)到(dào)每(měi)月(yuè)1400万(wàn)亿(yì)Token的(de)使(shǐ)用(yòng)量(liàng)。为(wèi)应(yīng)对(duì)智(zhì)能(néng)体(tǐ)AI的(de)高(gāo)速(sù)增(zēng)长(zhǎng)需(xū)求(qiú),算(suàn)力(lì)支(zhī)持(chí)是(shì)首(shǒu)要(yào)的(de),算(suàn)力(lì)基(jī)础(chǔ)设(shè)施(shī)的(de)带(dài)宽(kuān)、存(cún)储(chǔ)等(děng)都(dōu)要(yào)跟(gēn)上(shàng)。Token服(fú)务(wu)供(gōng)应(yīng)商(shāng),如(rú)云(yún)服(fú)务(wu)和(hé)数(shù)据(jù)中(zhōng)心(xīn)供(gōng)应(yīng)商(shāng)也(yě)需(xū)对(duì)构(gòu)造(zào)成(chéng)本(běn)结(jié)构(gòu)的(de)方(fāng)式(shì)进(jìn)行(xíng)系(xì)统(tǒng)级(jí)的(de)优(yōu)化(huà)。

宋(sòng)继强指出,早期的智能体AI在中间层专门对应某一种语言模型,在底层(céng)则(zé)与(yǔ)具(jù)体(tǐ)的(de)硬(yìng)件(jiàn)和(hé)软(ruǎn)件(jiàn)组(zǔ)合(hé)相(xiāng)对(duì)应(yīng),是(shì)在(zài)某(mǒu)种(zhǒng)专(zhuān)门(mén)的(de)应(yīng)用(yòng)架(jià)构(gòu)上(shàng)调(diào)优(yōu)出(chū)来(lái)的(de),扩(kuò)展(zhǎn)比(bǐ)较(jiào)受(shòu)限(xiàn)。新(xīn)出(chū)现(xiàn)的(de)思(sī)维(wéi)链(liàn)技(jì)术(shù)得(de)以(yǐ)支(zhī)撑(chēng)更广泛、更高级别的能力,但也需要更多的执行步骤、更多不同的模型,运用思维链方式完成一个问题使用的Token数比之前多10倍。而智能体内部(bù)不(bù)止(zhǐ)一(yī)个(gè)思(sī)维(wéi)链(liàn),对(duì)Token的(de)使(shǐ)用(yòng)量(liàng)与(yǔ)调(diào)用(yòng)复(fù)杂(zá)度将增长百倍以上。

因此,宋继强强调,异构的AI基础设施一定是未来发展的趋势,既能提高当前应用的性能、效率和成本效益,也能够保持对于未来智能体AI应用的长期有效性。

他表示,这样的计算架构需要至少三个维度的技术支撑。

第一,在硬件层,为避免受限于特定架构或供应商,必须构建异构的硬件架构基础。这也是目前算力中心与公有云服务建设中常常讨论并采纳的方式。

第二,在中间的系统级,越来越多的推理应用存在于某一个企业的工作范围内,所以一定要对企业应用开发、服务器部署友好。要针对企业所(suǒ)需(xū)要、所能够支持的尺寸交付算力,对于互联互通也需要采用开放的、基于以太网方式的能力规模扩展方案。

第三,是更开放的软件栈和软件框架,需要具备可编程性、可调配组合,能支持多种AI框架。

宋继强进(jìn)一步分享(xiǎng)了(le)英特尔的一系列实践与创新案例。例如,制程技术方面,要提供更高能效比、更高性能、生产制造更灵活的方案。今年10月,英特尔公布了其最新的制程节点Intel 18A的技术细节,同时使用了RibbonFET全环绕栅极晶体管和背面供电技术PowerVia,可以提供更高晶体管密度、提升每瓦性能、降低功耗,为英特尔未来至少三代客户端与服务器产品提供支撑。

封装技术方面,宋继强表示,英特尔持续演进先进技术:从传统的二维封装到2.5D的EMIB嵌入式多芯片互联桥接方案、Foveros 2.5D和3D技术,再到Foveros Direct 3D,在先进封装技术的加持下,芯片Bump间距已经降到了10微米以下。

宋继强还分享了英特尔对未来定制芯片的设想,他指出,未来的定制芯片内部既可以有英特尔的主计算单元,也可以有客户(hù)的计算单元,并能够通过3D技术将两者封装在一起。在灵活构造的基础上,加上EMIB 2.5D、TSV等技术加持,将大大地提升芯片尺寸,目前最大能实现相当于十几个光罩尺寸大芯片规模,这将给可定制的未来处理器或AI加速器新的机会。他表示,针对未来多元的应用需求,希望有更多能效比优先,具备定制化特点的芯片方案。