2025-05-02 00:04:43

首创AI芯片新架构中星微成功实现单芯片运行通用大模型

【导语】4月30日，中星微在数字中国建设峰会上宣布，其最新AI芯片“星光智能五号”成功运行DeepSeek大模型，成为首款全自主可控、能同时运行通用语言和多模态大模型的AI芯片。该芯片支持本地化部署和嵌入式应用，突破算力瓶颈，可更好地服务于数字中国建设和新质生产力发展。通过采用多核异构GP-XPU新架构，“星光智能五号”实现了算力与存储资源的高效利用，推动端侧、边缘侧智能化升级，大幅减少对云端算力资源的依赖，并保障数据安全。

4月30日，中星微在第八届数字中国(guó)建(jiàn)设(shè)峰(fēng)会(huì)上(shàng)宣(xuān)布(bù)，采用(yòng)其(qí)首(shǒu)创(chuàng)多(duō)核(hé)异(yì)构(gòu)GP-XPU新(xīn)架(jià)构(gòu)的(de)最(zuì)新(xīn)AI芯(xīn)片(piàn)“星(xīng)光(guāng)智(zhì)能(néng)五(wǔ)号(hào)”已(yǐ)成(chéng)功(gōng)运(yùn)行(xíng)DeepSeek 7B/8B/16B大(dà)模(mó)型(xíng)，成(chéng)为(wèi)首(shǒu)款(kuǎn)全自(zì)主可(kě)控(kòng)、可(kě)单(dān)芯(xīn)片(piàn)同(tóng)时(shí)运(yùn)行(xíng)通(tōng)用语言大模型和“万物识别”多模态大模型的AI芯片。该芯片可支持本地化部署和嵌入式应用，通过8颗芯片级联并行计算，可支持“满血版”671B参数DeepSeek大模型及其它多模态大模型运行，突破本地化端侧算力瓶颈限制，可更好服务于数字中国建设和新质生产力发展。

据介绍，“星光智能五号”通过采用GP-XPU架构，集成高性能的RISC-V CPU、GP-GPU、NPU，以及面向智能感知领域的图像信号处理器（ISP）、视频编解码器（VPU）、加解密处理器（ECU）等多核心模块，通过专用的HCP（异构计算池）任务调度单元和安全内存管理系统，实现多异构内核之间的算力与存储资源的实时调度与动态共享，大幅提升了算力利用效率和数据吞吐率，从而首次实现了在单芯片上部署运行DeepSeek 1.5B、7B、8B、16B等通用大模型及视觉大模型的能力。

在仅约一张名片大小的处理板中，单颗“星光智能五号”既满足复杂场景下的视频实时检测、识别与跟踪需求，又能实现自然语言处理、任务规划、知识管理、自动控制等智能体功能；通过8颗芯片联合部署，能够支持“满血版”671B参数DeepSeek大模型和视觉大模型运行，彻底打破边缘端算力瓶颈。

中星微技术CEO张韵东介绍，“星光智能五号”将推动端侧、边缘侧智能化升级，大幅减少对云端算力资源的依赖，节省系统建设成本，探索了一条符合中国国情的人工智能技术路线。

据了解，传统依赖云端的AI推理流程常面临响应延迟大、成本高、受制于网络环境等问题，而该芯片通过本地化算力与内生安全机制，使大模型推理可直接在边端侧内完成闭环，既节省了云端传输与存储成本，同时极(jí)大(dà)提(tí)升(shēng)了(le)响(xiǎng)应(yīng)速(sù)度(dù)，可(kě)实(shí)现(xiàn)毫(háo)秒(miǎo)级(jí)响(xiǎng)应(yīng)，同(tóng)时(shí)以(yǐ)信(xìn)源(yuán)级(jí)密(mì)码(mǎ)机(jī)制(zhì)保(bǎo)障(zhàng)数(shù)据(jù)全生(shēng)命(mìng)周(zhōu)期(qī)安(ān)全。

首创AI芯片新架构 中星微成功实现单芯片运行通用大模型

首创AI芯片新架构中星微成功实现单芯片运行通用大模型