2025-02-20 11:03:28

DeepSeek成国内半导体产业链新引擎？

在(zài)人(rén)工(gōng)智(zhì)能(néng)领(lǐng)域，人(rén)们(men)对(duì)训(xun)练(liàn)模(mó)型(xíng)的(de)固(gù)有(yǒu)印(yìn)象(xiàng)就(jiù)是(shì)对(duì)算(suàn)力(lì)的(de)需(xū)求(qiú)极(jí)大(dà)。因(yīn)此(cǐ)，长(zhǎng)期(qī)以(yǐ)来(lái)，诸(zhū)如(rú)英(yīng)伟(wěi)达(dá)H100 GPU等(děng)高算力芯片(piàn)几(jǐ)乎(hu)成(chéng)为(wèi)行(xíng)业(yè)标(biāo)配(pèi)，使(shǐ)得(de)国(guó)内(nèi)芯(xīn)片(piàn)厂(chǎng)商(shāng)难(nán)以(yǐ)施(shī)展(zhǎn)拳(quán)脚(jiǎo)，也(yě)制(zhì)约(yuē)了(le)我(wǒ)国(guó)人(rén)工(gōng)智(zhì)能(néng)的(de)在(zài)地(de)化(huà)发(fā)展(zhǎn)。而(ér)DeepSeek的(de)出(chū)现(xiàn)打(dǎ)破(pò)了(le)这(zhè)一(yī)困(kùn)境(jìng)，使(shǐ)尖(jiān)端(duān)GPU不(bù)再(zài)是(shì)大(dà)模型训练的唯一解法，让越来越多(duō)的(de)的(de)国(guó)内(nèi)半(bàn)导(dǎo)体(tǐ)厂(chǎng)商(shāng)有(yǒu)机(jī)会(huì)与(yǔ)全球(qiú)领(lǐng)先(xiān)的(de)AI模(mó)型(xíng)适(shì)配(pèi)，有(yǒu)望(wàng)成(chéng)为(wèi)驱(qū)动(dòng)国(guó)内(nèi)半(bàn)导(dǎo)体(tǐ)全产(chǎn)业(yè)链(liàn)发(fā)展(zhǎn)的(de)新(xīn)引(yǐn)擎(qíng)。

当(dāng)前(qián)，每(měi)天(tiān)都(dōu)有(yǒu)像(xiàng)华(huá)为(wèi)昇(shēng)腾(téng)、沐曦、天数智芯、燧原科技、昆仑芯等国内半导体厂商宣布与DeepSeek旗下不同模型展开适配工作的消息，据不完全统计，参与其中的国内厂商已经超过了20家。

DeepSeek提供技术验证“实练场”

对于国内芯片行业来说，缺乏实际应用场景和技术验证机会是其发展过程中的一大难题。而DeepSeek为国内芯片提供了宝贵的技术验证场景。

据了解，DeepSeek在架构创新方面，采用了(le)经(jīng)DeepSeek-V2验(yàn)证(zhèng)的(de)MLA和(hé)DeepSeekMoE技(jì)术(shù)，并(bìng)引(yǐn)入(rù)了(le)无(wú)辅(fǔ)助(zhù)损(sǔn)失(shī)负(fù)载(zài)均(jūn)衡(héng)策(cè)略(è)。这(zhè)种(zhǒng)架(jià)构(gòu)优(yōu)化(huà)使(shǐ)得(de)模(mó)型(xíng)在(zài)训(xun)练(liàn)过(guò)程(chéng)中(zhōng)能(néng)够(gòu)更(gèng)高(gāo)效(xiào)地(de)利(lì)用(yòng)计(jì)算(suàn)资(zī)源(yuán)，减(jiǎn)少(shǎo)了(le)对(duì)特(tè)定(dìng)高端芯片的依(yī)赖(lài)。同(tóng)时(shí)，在(zài)训(xun)练(liàn)效(xiào)率(lǜ)上(shàng)，DeepSeek设(shè)计(jì)了(le)专(zhuān)门(mén)的(de)FP8训(xun)练(liàn)混(hùn)合(hé)精(jīng)度(dù)框(kuāng)架(jià)，以(yǐ)实(shí)现(xiàn)训(xun)练(liàn)效(xiào)率(lǜ)和(hé)数(shù)值(zhí)稳(wěn)定(dìng)性(xìng)的(de)平(píng)衡(héng)，还(hái)开(kāi)发(fā)了(le)DualPipe算(suàn)法(fǎ)实(shí)现(xiàn)高(gāo)效(xiào)的(de)流(liú)水(shuǐ)线(xiàn)并(bìng)行(xíng)处(chù)理(lǐ)，降(jiàng)低(dī)训(xun)练(liàn)过(guò)程(chéng)中(zhōng)的(de)通(tōng)信(xìn)开(kāi)销(xiāo)。

业(yè)内(nèi)专(zhuān)家(jiā)表(biǎo)示(shì)，这(zhè)些(xiē)技(jì)术(shù)创(chuàng)新(xīn)使(shǐ)得(de)DeepSeek能(néng)够(gòu)适(shì)配(pèi)国(guó)内(nèi)芯(xīn)片(piàn)架(jià)构(gòu)，并(bìng)且(qiě)在(zài)适(shì)配(pèi)过(guò)程(chéng)中(zhōng)，国(guó)内(nèi)芯(xīn)片(piàn)企(qǐ)业(yè)可(kě)以(yǐ)深(shēn)入(rù)了(le)解(jiě)模(mó)型(xíng)对(duì)芯(xīn)片(piàn)性(xìng)能(néng)的(de)需(xū)求(qiú)，从(cóng)而(ér)针(zhēn)对性地进行优化和改进。例如，通过观察DeepSeek模型在国产芯片上的运行情况，芯片企业可以发现芯片在计算速度、能耗、稳定性等方面存在的问题，并及时调整研发方向，改进芯片设计和制造工艺。这种实际应用中的反馈和优化，对于国内芯片技术的提升至关重要。

目前，华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯等厂商，相继宣布适配或上架DeepSeek模型服务，让国内芯片能够在实际应用中发挥作用，展示自身的性能和潜力。

例如，天数智芯和合作伙伴仅用时一天，便完成了与DeepSeek R1的适配工作，并且已正式上线多款大模型服务，包括15亿、70亿、140亿参数的蒸馏版Qwen模型等。天数智芯表示，适配完成之后，公司将重点推(tuī)动(dòng)基(jī)于(yú)国(guó)内(nèi)算力资源的DeepSeek大模型应用落地：一是持续优化软硬件，开发高性能、高性价比的算力产品方案，支持合作伙伴在平台上推出(chū)DeepSeek各(gè)大(dà)模(mó)型(xíng)在(zài)线(xiàn)服(fú)务(wu)，广(guǎng)泛(fàn)提(tí)供(gōng)预(yù)训(xun)练(liàn)、微(wēi)调(diào)和(hé)推(tuī)理(lǐ)服(fú)务(wu)；二(èr)是(shì)与(yǔ)合(hé)作(zuò)伙(huǒ)伴(bàn)开(kāi)发(fā)基(jī)于(yú)DeepSeek模(mó)型(xíng)的(de)一(yī)体(tǐ)机(jī)、工(gōng)作(zuò)站(zhàn)，将DeepSeek模型接入到各类AI应用服务，提供更多个性化、边侧、端侧的服务。当然，天数智芯始终将通用GPU创新突破作为首要任务，发挥自主通用芯片架构优势，根据(jù)DeepSeek带(dài)动(dòng)的(de)需(xū)求(qiú)变(biàn)化(huà)来(lái)研(yán)发(fā)更(gèng)高(gāo)算(suàn)效(xiào)的(de)通(tōng)用GPU产品。

燧原科技和壁仞科技则是已完成对DeepSeek全系列模型的优化，支持从1.5B到70B参数规模的DeepSeek R1蒸馏模型推理部署，覆盖能源、金融等垂直场景。在这些实际应用场景中，国内芯片的性能得到了充分验证，也为其在更多领域的应用积累了经验。通过与DeepSeek的合作，国内芯片在技术验证和优化方面取得了显著进展，为其未来的发展奠定了坚实基础。

2月2日，Gitee AI宣布上线1.5B、7B、14B、32B四个尺寸的DeepSeek R1模型，均部署在沐曦曦云GPU上。2月5日，又确认DeepSeek-V3全精度满血版(671B)可在沐曦训推一体GPU上成功运行，并将V3满血版上线到平台。沐曦通过与DeepSeek的适配，不仅验证了自身芯片在AI推理中的性能，也让更多AI应用开发者看到本土GPU支持大规模模型运行的潜力。

寒武纪作为国内知名的AI芯片厂商，与南京智算中心合作，借(jiè)助(zhù)DeepSeek实(shí)现(xiàn)了(le)技(jì)术(shù)与(yǔ)应(yīng)用(yòng)场(chǎng)景(jǐng)的(de)有(yǒu)效(xiào)对(duì)接(jiē)。通(tōng)过(guò)在(zài)零(líng)售(shòu)业(yè)务(wu)场(chǎng)景(jǐng)中(zhōng)的(de)应(yīng)用(yòng)，寒(hán)武(wǔ)纪(jì)芯(xīn)片(piàn)的(de)性(xìng)能(néng)得(de)到(dào)了(le)实(shí)际检验，也为其进一步优化产品、拓展市场提供了宝贵经验。

华为昇腾、海光信息、龙芯中科等GPU/CPU厂商也在积极行动，通过参与DeepSeek模型的训练优化，提升产品在AI推理市场的竞争力。

同时，DeepSeek的开源特性也为国内芯片的技术验证提供了便利。众多开发者基于DeepSeek模型进行二次开发和应用探索，使国内芯片可以在不同的应用场景、不同的算法需求等多样化的环境下接受检验，从而不断完善自身的性能和功能。

上海天数智芯半导体股份有限公司副总裁郭为告诉《中国电子报》记者，从行业角度看，以DeepSeek为代表的自主大模型创新突破，有助于推动国内算力技术的发展。国内GPU厂商已相继完成与DeepSeek的适配，实现了深度学习框架与国内硬件的融合，以进一步发挥算力优势。在适配过程中，AI产业链中的芯片厂商与模型开发者之间加强合作，促进了上下游企业的协同发展，共同构建从硬件到软件的完整生态闭环，完善了库和框架等工具，有助于构建更加完整、健康的自主AI产业生态。DeepSeek的开源特性可降低开发门槛，吸引更多开发者和上下游企业加入，降低了AI应用开发的(de)门(mén)槛(kǎn)和(hé)成(chéng)本(běn)，促(cù)进(jìn)AI技(jì)术(shù)在(zài)更(gèng)多(duō)行(xíng)业(yè)的(de)落(luò)地(de)和(hé)普(pǔ)及(jí)。

带(dài)动(dòng)供(gōng)应(yīng)链(liàn)创(chuàng)新(xīn)发(fā)展(zhǎn)

DeepSeek也(yě)助(zhù)推(tuī)了(le)边(biān)缘(yuán)计(jì)算(suàn)与(yǔ)低(dī)成(chéng)本芯片的发展。它推出的小型模型，如7B参数版本，可在笔记本电脑运行，且性能接近大模型。这种“小而美”模式的兴起，使得端侧小模型迎来了快速发展，也带动了低功耗、高能效芯片的市场需求。

以手机、平板电脑、蓝牙耳机和智能眼镜等智能终端设备为例，为了满足用户对AI语音交互、图像识别等功能的(de)需(xū)求(qiú)，这些设备需要搭载具备一定算力的芯片。而DeepSeek的应用，使得这些设备能够更好地运行端侧小模型，实现更高效的AI处理。这就促使了设备制造商加大对国内算力芯片(piàn)和(hé)存(cún)储(chǔ)芯(xīn)片(piàn)的(de)采购(gòu)，推(tuī)动(dòng)了(le)国(guó)内(nèi)芯(xīn)片(piàn)在(zài)智(zhì)能(néng)终(zhōng)端(duān)市(shì)场(chǎng)的(de)应(yīng)用(yòng)。

在(zài)服(fú)务(wu)器(qì)领域，随着企业加速开发和部署人工智能应用，如智能客服、智慧政府、数据分析等，对服务器的算力要求也越来越高。DeepSeek的出现，让企业能够在国内算力芯片的支持下，构建高效的人工智能服务平台，有望带动国内算力芯片在服务器市场的发展。

半导体行业专家池宪念表示，目前引发的对国内算力需求的增长，如同一条强有力的纽带，将半导体产业链上的各个环节紧密联系在一起。从芯片设计、制造到封装测试，再到最终的应用市场，每个环节都因DeepSeek的出现而获得了新的发展动力。未来，整个国内半导体供应链将在DeepSeek的带动下，形成一个良性循环。但这一趋势也对国内半导体厂商提出了更多挑战。从技术迭代角度来看，人工智能技术发展日新月异，新的模型和算法不断涌现。DeepSeek需要不断优化自身模型，以保持技术领先地位。国内芯片技术也需要加速升级、及时适配，确保模型与芯片之间的协同效应。