2025-03-14 10:30:47

端侧AI起飞,芯片行业的红利来了

  • 分享至
  • 分享到微信
  • 分享到微博

两年前,ChatGPT点燃了全球生成式AI技术研发热潮,端侧AI应运而生。近两个月以来,DeepSeek以开源之姿,再次在全球人工智能领域掀起一股AI新潮。在AI大潮的诸多“弄潮儿”中,端侧AI率先冲刺,助推AI应用进一步落地。

就在端侧AI发展黄金期到来之际,作为硬件基础的芯片,通过算力优化和场景适配成为其中的核心驱动力;与此同时,率先布局的相关企业将有望吃到端侧AI爆发的第一波红利。

苹果M3 Ultra机型可为大语(yǔ)言(yán)模(mó)型(xíng)导(dǎo)入(rù)庞(páng)大(dà)数(shù)据(jù)集

端(duān)侧(cè)AI奏(zòu)响(xiǎng)“集结(jié)号(hào)”

近(jìn)期(qī),端(duān)侧(cè)AI在(zài)多(duō)领(lǐng)域落(luò)地(de)的(de)动(dòng)作(zuò)不(bù)断(duàn)。消(xiāo)费(fèi)电(diàn)子(zi)领(lǐng)域,联(lián)想(xiǎng)于(yú)2月(yuè)25日(rì)发(fā)布(bù)其(qí)AI PC新(xīn)品(pǐn)YOGA 2025系(xì)列(liè),本(běn)地(de)部(bù)署(shǔ)DeepSeek-7B,成(chéng)为(wèi)全球(qiú)首(shǒu)家(jiā)在(zài)终(zhōng)端设备上部署此规模大模型的厂商。3月5日,苹果时隔两年重磅更新的Mac Studio配备了全新M3 Ultra和M4 Max芯片两个版本,苹果宣称 M3 Ultra 版本 Mac Studio 支持本地部署 6000亿参数的AI大模型运行。此外,近日华为的AI PC也传出新消息,预计其自研商用AI笔记本将在四月发布,除了搭载全面集成的DeepSeek大模型,其芯片及零部件或将实现全自研。

汽车领域,小米SU7 Ultra于2月27日上市,雷军通过微博宣布Xiaomi HAD端到端全场景智驾开启全量推送,小米SU7 Ultra出厂即搭载该智驾系统。吉利在3月3日的AI智能科技发布会上宣布完成全域AI智能化布局,其中阶跃星辰提供通用大模型技术,与吉利联合开源多模态交互框架,实现文本、语音、图像数据的融合理解。此外,吉利自研的超级智算中心2.0,算力资源超越万卡,综(zōng)合(hé)算(suàn)力(lì)达(dá)到(dào)23.5EFLOPS。

事(shì)实(shí)上(shàng),除(chú)了(le)上述高热度的领域,端侧AI还在涉及面更加广阔的IoT等领域加速落地。例如,今(jīn)年(nián)2月(yuè),深(shēn)思(sī)考(kǎo)人(rén)工(gōng)智(zhì)能(néng)在(zài)全球(qiú)开(kāi)发(fā)者(zhě)大(dà)会(huì)上(shàng)正(zhèng)式(shì)发(fā)布(bù)鸿(hóng)蒙(méng)系(xì)统(tǒng)TinyDongni& deepseek超(chāo)小(xiǎo)端(duān)侧(cè)多(duō)模(mó)态(tài)大(dà)模(mó)型(xíng)及(jí)硬(yìng)件(jiàn)模(mó)组(zǔ),并(bìng)联(lián)合(hé)国(guó)产(chǎn)模(mó)组(zǔ)厂(chǎng)商(shāng)推(tuī)出(chū)两(liǎng)大(dà)解(jiě)决(jué)方(fāng)案(àn),一(yī)方(fāng)面(miàn)为(wèi)车(chē)载(zài)、机(jī)器(qì)人(rén)等(děng)场(chǎng)景(jǐng)提(tí)供(gōng)实(shí)时(shí)AI处(chù)理(lǐ)能(néng)力(lì),另(lìng)一(yī)方(fāng)面(miàn)赋(fù)能(néng)工(gōng)业(yè)检(jiǎn)测(cè)、AI摄(shè)像(xiàng)头(tóu)等(děng)高(gāo)精(jīng)度(dù)场(chǎng)景(jǐng)。深(shēn)思(sī)考(kǎo)创(chuàng)始(shǐ)人(rén)& CEO杨(yáng)志(zhì)明(míng)表(biǎo)示(shì),超(chāo)小(xiǎo)端(duān)侧(cè)多(duō)模(mó)态(tài)大(dà)模(mó)型(xíng)及(jí)硬(yìng)件(jiàn)模(mó)组(zǔ)的(de)发(fā)布(bù),不(bù)仅(jǐn)是(shì)技(jì)术(shù)的(de)突(tū)破(pò),更(gèng)是(shì)端(duān)侧(cè)AI普(pǔ)惠(huì)化(huà)的(de)里程碑。未来将持续优化多(duō)模(mó)态(tài)交互能力,推动AI在医疗、工业、消费等领域的深度应用。

“得益于算力与模型优化,端侧人工智能的进步速度将呈现指数级跃升。”联想集团(tuán)董(dǒng)事长兼CEO 杨元庆认为,两者进步的叠加效应有望在未来12个月实现3倍的整体性能提升。

联想三折叠AI PC概念机

高质量AI模型是普及关键

大模型纷纷部署于端侧之际,科技企业高调发力端侧AI,相关产品和应用纷纷上市。这背后的动作并不算新鲜,但根本动力却与以往大不相同。那么,端侧AI落地,时机是否已经成熟?

在AI百模大战的时代,焦点在云数据中心的集中式训练,但AI释放价值的关键更多在于推理。

“AI推理将从云端下沉到我们身边,无处不在。”Arm物联网事业部业务拓展副总裁马健告诉记者解释道,如果我们生活在连接带宽无限大、延时无限低、成本接近零的世界,那么AI部署在集中式数据中心是最有效的。但是这个假设并不成立,来自海量传感器、摄像头的视觉、声音等数据都回传到云端是不现实的,尤其是在对延时、隐私以及可靠性有严格要求的场景,边缘AI势在必行。

以DeepSeek为代表的开源模型,加速了AI从云走向端的进程,其带来的影响之一就是支持边缘设备,使得高性能AI应用能够在边缘设备上顺利运行。达摩院首席科学家、知合计算CEO孟建熠指出,大模型在云端的话,实施成本比较高,只有有限的企业可能在部分领域应用,而一旦到了端侧,就有大量的应用都会发展起来。

从目前的一些趋势来看,终端AI模型的质量、性能和效率正在显著提高。为此,高通高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)以及市场资深经理Jerry Chang在其博文中从以下四方面进行了总结。

首先,当前先进的AI小模型已具有卓越性能。模型蒸馏和新颖的AI网络架构等新技术能够在不影响质量的情况下简化开发流程,让新模型的表现超越一年前推出的仅能在云端运行的更大模型。其次,模型参数规模正在快速缩小。先进的量化和剪枝技术使开发者能够在不对准确性产生实质影响的情况下,缩小模型参数规(guī)模。第三,开发者能够在边缘侧打造更丰富的应用。高质量AI模型快速激增,意味着文本摘要、编程助手和实时翻译等特性在智能手机等终端上的普及,让AI能够支持跨边缘侧规模化部署的商用应用。第四,AI正在成为新的UI。个性化多模态AI智能体将简化交互,高效地跨越各种应用完成任务。

搭载瑞芯微SOC芯片的桌面机器人可作为智能家居的主控中心

芯片是新周期核心(xīn)驱(qū)动(dòng)力(lì)

虽(suī)然(rán)DeepSeek等(děng)大(dà)模(mó)型(xíng)通(tōng)过(guò)技(jì)术(shù)革(gé)新(xīn)降(jiàng)低(dī)了(le)端(duān)侧(cè)AI的(de)门槛,但不足以构成端侧AI起飞的充分条件。作为硬件基础的芯片,通过算力优化和场景适配成为端侧AI落地的核心驱动力。

对于硬件玩家来说,端(duān)侧(cè)形态各异的设备与丰富应用,蕴藏着巨大的市场空间。为此,相关芯片企业争相(xiāng)在(zài)端(duān)侧(cè)AI领(lǐng)域布(bù)局(jú)。

大(dà)模(mó)型(xíng)、智(zhì)能(néng)体(tǐ)在(zài)边(biān)缘(yuán)侧(cè)的(de)落(luò)地(de)需(xū)要(yào)具(jù)备(bèi)更(gèng)高(gāo)性(xìng)能(néng)和(hé)能(néng)效(xiào)的(de)边(biān)缘(yuán)计(jì)算(suàn)平(píng)台(tái)。2月(yuè)底(dǐ),Arm发(fā)布(bù)新(xīn)一(yī)代(dài)边(biān)缘(yuán)AI计(jì)算(suàn)平(píng)台(tái)Armv9,可(kě)运(yùn)行(xíng)超(chāo)10亿(yì)参(cān)数(shù)的(de)端(duān)侧(cè)AI模(mó)型(xíng)。此(cǐ)外(wài),Arm近(jìn)日(rì)与阿里巴巴合作,通过 KleidiAI 与通义千问模型的集成,加速端侧多模态AI体验。多年前高通就已经为此做了准备。高通早在十五年前就开始在终端侧开展针对AI的研究,其AI引擎已迭代到第十代;去年3月推出AI HUB,帮助不同开发者优化模型,使其部署在不同平台上。

对于芯片企业而言,通过硬件创新推动端侧AI市场向上攀升的同时,也让自身吃到更多红利。以我国AIoT芯片领域的代表性企业瑞芯微为例,其在端侧AI方面可提供从0.2TOPs到6TOPs的不同算力水平的AIoT芯片。据悉,当前已有多个领域的客户基于瑞芯微主控芯片研发在端侧支持AI大模型的新硬件(jiàn),如(rú)教(jiào)育(yù)平(píng)板(bǎn)、AI 玩(wán)具(jù)、桌(zhuō)面(miàn)机(jī)器(qì)人(rén)、算(suàn)力(lì)终(zhōng)端、会议主机等产品。根据瑞芯微公布的2024年业绩预告,预计其2024年营收31亿元到31.5亿元,同比增长45.23%到47.57%;预计实现净利润5.5亿到6.3亿元,同比增长307.75%到367.06%。业绩增长背后,是AI技术快速发展、应用场景不断拓展对AIoT业务的(de)带(dài)动(dòng)。

业(yè)内(nèi)人(rén)士(shì)向(xiàng)记(jì)者(zhě)表(biǎo)示(shì),端(duān)侧(cè)AI芯(xīn)片的核心需求包括低功耗(hào)、高(gāo)能(néng)效(xiào)比(bǐ)和灵活适配多样化场景。伴随端侧AI发展黄金期的到来,芯片行业在推动AI应用普及的同时,将拥有更多成长机会。