2025-02-24 15:00:38

DeepSeek利好英伟达?黄仁勋首次回应……

  • 分享至
  • 分享到微信
  • 分享到微博

在英伟达股价因受DeepSeek影响而经历了一轮过山车般的起伏后,黄仁勋终于站了出来。

2月21日,一段黄仁勋的受访视频出现在其合作伙伴DataDirect Networksg公司举办的线上活动。在访谈中,他首次公开回应了DeepSeek是否利好英伟达的相关话题。

图为英伟达CEO黄仁勋访谈画面

“R1让实际情况恰恰相反”

“DeepSeep-R1作为全球首个开源的推理模型,令人十分兴奋。R1模型的开源,让全球的热情也变得非常高涨。”黄仁勋表示。

他首先否定了一个既有认知:从投资者的角度来看,有这样一种思维定式:AI世界就是先做预训练,然后就是推理。而“推理”就是给(gěi)AI提(tí)出(chū)一(yī)个(gè)问(wèn)题(tí),它(tā)立(lì)刻(kè)给(gěi)出(chū)答(dá)案(àn)。

“虽(suī)然(rán)不(bù)知(zhī)道(dào)这(zhè)种(zhǒng)思(sī)维(wéi)源(yuán)自(zì)哪(nǎ)里(lǐ),但(dàn)它(tā)显(xiǎn)然(rán)是(shì)错(cuò)误(wù)的(de)。”黄仁勋强调。

为此,黄仁勋给出了详细的解释:正确的模式是先进行预训练,让模型对信息有一个基础的理解,预训练后要持续保持严谨。第二个阶段是最为重要的后训练(post training),也就是模型学会解决问题的过程。在这一阶段,模型已经有了基础的信息,而后运用这些基础知识去解决实际问题。后训练阶段与一系列不同的学习范式相关。在这些范(fàn)式(shì)的(de)推(tuī)动(dòng)下(xià),AI技(jì)术(shù)在(zài)过(guò)去(qù)五(wǔ)年(nián)发(fā)展(zhǎn)得(de)非(fēi)常(cháng)迅(xùn)猛(měng),计(jì)算(suàn)需(xū)求也因而变得极为密集。“大家会觉得预训练要少得多,但是他们忘记了预训练之后的第二部分——后训练其实(计算需求量)是相当大的。”他表示。

黄仁勋提到了第三条缩放定律(scaling law)。推理越多,回答问题前思考得就越多,推理效果就会越好,这是一个计算量相当大的过程。

“所以市场对DeepSeek R1问世的反应是‘天呐,AI到头了!’,就好像有了它,我们便不再需要进行任何计算了,但实际情况恰恰相反。”黄仁勋表示。

市场是否“买单”?

2025年1月,DeepSeek推出低算力成本的开源大语言模型R1,以仅560万美元的训练成本实现了与OpenAIo1等闭源模型相当的性能。这一成果挑战了传统AI训练依赖高算力芯片堆料的商业模式。

受此影响,英伟达市值曾一度下跌,尤其在1月27日跌去近17%,一夜蒸发近6000亿美元,创美股单日市值蒸发纪录。当时,投资者们担忧AI行业对英伟达芯片的需求可能大幅减少,导致市场对算力泡沫的恐慌。

事实上,英伟达官方在股价暴跌后迅速发声,指出DeepSeek的成功恰恰证明了其芯片的实用性,并强调“推理阶段需要大量英伟达GPU和高性能网络”,未来市场需求将随着(zhe)AI应(yīng)用(yòng)扩(kuò)展(zhǎn)而(ér)增(zēng)长(zhǎng)。但(dàn)当(dāng)时(shí)的(de)发(fā)声(shēng)并(bìng)未(wèi)对(duì)其(qí)股(gǔ)价(jià)回(huí)升(shēng)起到实际效果。

随后市场逐渐认识到,DeepSeek的创新可(kě)能(néng)推(tuī)动(dòng)更(gèng)多(duō)中(zhōng)小(xiǎo)型(xíng)企(qǐ)业(yè)进(jìn)入(rù)AI领(lǐng)域,反(fǎn)而(ér)刺(cì)激(jī)对(duì)GPU等(děng)算(suàn)力(lì)芯(xīn)片(piàn)的(de)增(zēng)量(liàng)需(xū)求(qiú)。英(yīng)伟(wěi)达(dá)股(gǔ)价(jià)在(zài)接(jiē)下(xià)来(lái)近(jìn)一(yī)个(gè)月(yuè)里(lǐ)震(zhèn)荡(dàng)回(huí)升,目前已逐渐“收复失地”。

值得关注的是,此次黄仁勋的发声在英伟达财报公布之前,2月26日美股盘后,英伟达将公布四季度财报。虽然此次黄仁勋正面表达了对于DeepSeek问世将利好英伟达未来的信心,但市场的真正反映将有赖于其财报给出的关键数据。