2025-11-26 09:31:45

英特尔公司副总裁、英特尔中国研究院院长宋继强：异构AI基础设施是未来发展趋势

【导语】11月23日，第二十二届中国国际半导体博览会开幕，英特尔中国研究院院长宋继强在同期大会上称，AI计算重心转向推理应用，未来80%的AI计算用于此，智能体AI算力需求将大增，异构AI基础设施是趋势，还介绍了英特尔在制程、封装技术等方面的实践创新及对未来定制芯片的设想。

11月23日，第二十二届中国国际半导体博览会（IC China 2025）在北京国家会议中心开幕。在同期举行的第七届全球IC企业家大会上，英特尔公司副总裁、英特尔中国研究院院长宋继强发表演讲。他表示，当前，AI计算的重心已从通用基座大模型扩展至推理应用。未来，80%的AI计算将用于推理领域。异构的AI基础设施是未来发展的趋势。

640 - 2025-11-26T091521.158.jpg

宋继强表示，智能体AI是推理领域真正产生客(kè)户(hù)价(jià)值(zhí)的(de)部(bù)分(fēn)，其(qí)算(suàn)力(lì)需(xū)求(qiú)将(jiāng)从(cóng)2025年(nián)起(qǐ)逐(zhú)步(bù)上(shàng)升(shēng)，并(bìng)超(chāo)越(yuè)用(yòng)于(yú)训(xun)练(liàn)基(jī)座(zuò)大(dà)模(mó)型(xíng)与(yǔ)微(wēi)调(diào)大(dà)模(mó)型(xíng)的(de)规(guī)模(mó)，今(jīn)年(nián)，其(qí)规(guī)模(mó)已(yǐ)有(yǒu)140倍(bèi)的(de)增(zēng)长(zhǎng)，达(dá)到(dào)每(měi)月(yuè)1400万(wàn)亿(yì)Token的(de)使(shǐ)用(yòng)量(liàng)。为(wèi)应(yīng)对(duì)智(zhì)能(néng)体(tǐ)AI的(de)高(gāo)速(sù)增(zēng)长(zhǎng)需(xū)求(qiú)，算(suàn)力(lì)支(zhī)持(chí)是(shì)首(shǒu)要(yào)的(de)，算(suàn)力(lì)基(jī)础(chǔ)设(shè)施(shī)的(de)带(dài)宽(kuān)、存(cún)储(chǔ)等(děng)都(dōu)要(yào)跟(gēn)上(shàng)。Token服(fú)务(wu)供(gōng)应(yīng)商(shāng)，如(rú)云(yún)服(fú)务(wu)和(hé)数(shù)据(jù)中(zhōng)心(xīn)供(gōng)应(yīng)商(shāng)也(yě)需(xū)对(duì)构(gòu)造(zào)成(chéng)本(běn)结(jié)构(gòu)的(de)方(fāng)式(shì)进(jìn)行(xíng)系(xì)统(tǒng)级(jí)的(de)优(yōu)化(huà)。

宋(sòng)继强指出，早期的智能体AI在中间层专门对应某一种语言模型，在底层(céng)则(zé)与(yǔ)具(jù)体(tǐ)的(de)硬(yìng)件(jiàn)和(hé)软(ruǎn)件(jiàn)组(zǔ)合(hé)相(xiāng)对(duì)应(yīng)，是(shì)在(zài)某(mǒu)种(zhǒng)专(zhuān)门(mén)的(de)应(yīng)用(yòng)架(jià)构(gòu)上(shàng)调(diào)优(yōu)出(chū)来(lái)的(de)，扩(kuò)展(zhǎn)比(bǐ)较(jiào)受(shòu)限(xiàn)。新(xīn)出(chū)现(xiàn)的(de)思(sī)维(wéi)链(liàn)技(jì)术(shù)得(de)以(yǐ)支(zhī)撑(chēng)更广泛、更高级别的能力，但也需要更多的执行步骤、更多不同的模型，运用思维链方式完成一个问题使用的Token数比之前多10倍。而智能体内部(bù)不(bù)止(zhǐ)一(yī)个(gè)思(sī)维(wéi)链(liàn)，对(duì)Token的(de)使(shǐ)用(yòng)量(liàng)与(yǔ)调(diào)用(yòng)复(fù)杂(zá)度将增长百倍以上。

因此，宋继强强调，异构的AI基础设施一定是未来发展的趋势，既能提高当前应用的性能、效率和成本效益，也能够保持对于未来智能体AI应用的长期有效性。

他表示，这样的计算架构需要至少三个维度的技术支撑。

第一，在硬件层，为避免受限于特定架构或供应商，必须构建异构的硬件架构基础。这也是目前算力中心与公有云服务建设中常常讨论并采纳的方式。

第二，在中间的系统级，越来越多的推理应用存在于某一个企业的工作范围内，所以一定要对企业应用开发、服务器部署友好。要针对企业所(suǒ)需(xū)要、所能够支持的尺寸交付算力，对于互联互通也需要采用开放的、基于以太网方式的能力规模扩展方案。

第三，是更开放的软件栈和软件框架，需要具备可编程性、可调配组合，能支持多种AI框架。

宋继强进(jìn)一步分享(xiǎng)了(le)英特尔的一系列实践与创新案例。例如，制程技术方面，要提供更高能效比、更高性能、生产制造更灵活的方案。今年10月，英特尔公布了其最新的制程节点Intel 18A的技术细节，同时使用了RibbonFET全环绕栅极晶体管和背面供电技术PowerVia，可以提供更高晶体管密度、提升每瓦性能、降低功耗，为英特尔未来至少三代客户端与服务器产品提供支撑。

封装技术方面，宋继强表示，英特尔持续演进先进技术：从传统的二维封装到2.5D的EMIB嵌入式多芯片互联桥接方案、Foveros 2.5D和3D技术，再到Foveros Direct 3D，在先进封装技术的加持下，芯片Bump间距已经降到了10微米以下。

宋继强还分享了英特尔对未来定制芯片的设想，他指出，未来的定制芯片内部既可以有英特尔的主计算单元，也可以有客户(hù)的计算单元，并能够通过3D技术将两者封装在一起。在灵活构造的基础上，加上EMIB 2.5D、TSV等技术加持，将大大地提升芯片尺寸，目前最大能实现相当于十几个光罩尺寸大芯片规模，这将给可定制的未来处理器或AI加速器新的机会。他表示，针对未来多元的应用需求，希望有更多能效比优先，具备定制化特点的芯片方案。