2025-02-24 15:00:38

DeepSeek利好英伟达？黄仁勋首次回应……

在英伟达股价因受DeepSeek影响而经历了一轮过山车般的起伏后，黄仁勋终于站了出来。

2月21日，一段黄仁勋的受访视频出现在其合作伙伴DataDirect Networksg公司举办的线上活动。在访谈中，他首次公开回应了DeepSeek是否利好英伟达的相关话题。

图为英伟达CEO黄仁勋访谈画面

“R1让实际情况恰恰相反”

“DeepSeep-R1作为全球首个开源的推理模型，令人十分兴奋。R1模型的开源，让全球的热情也变得非常高涨。”黄仁勋表示。

他首先否定了一个既有认知：从投资者的角度来看，有这样一种思维定式：AI世界就是先做预训练，然后就是推理。而“推理”就是给(gěi)AI提(tí)出(chū)一(yī)个(gè)问(wèn)题(tí)，它(tā)立(lì)刻(kè)给(gěi)出(chū)答(dá)案(àn)。

“虽(suī)然(rán)不(bù)知(zhī)道(dào)这(zhè)种(zhǒng)思(sī)维(wéi)源(yuán)自(zì)哪(nǎ)里(lǐ)，但(dàn)它(tā)显(xiǎn)然(rán)是(shì)错(cuò)误(wù)的(de)。”黄仁勋强调。

为此，黄仁勋给出了详细的解释：正确的模式是先进行预训练，让模型对信息有一个基础的理解，预训练后要持续保持严谨。第二个阶段是最为重要的后训练（post training），也就是模型学会解决问题的过程。在这一阶段，模型已经有了基础的信息，而后运用这些基础知识去解决实际问题。后训练阶段与一系列不同的学习范式相关。在这些范(fàn)式(shì)的(de)推(tuī)动(dòng)下(xià)，AI技(jì)术(shù)在(zài)过(guò)去(qù)五(wǔ)年(nián)发(fā)展(zhǎn)得(de)非(fēi)常(cháng)迅(xùn)猛(měng)，计(jì)算(suàn)需(xū)求也因而变得极为密集。“大家会觉得预训练要少得多，但是他们忘记了预训练之后的第二部分——后训练其实（计算需求量）是相当大的。”他表示。

黄仁勋提到了第三条缩放定律（scaling law)。推理越多，回答问题前思考得就越多，推理效果就会越好，这是一个计算量相当大的过程。

“所以市场对DeepSeek R1问世的反应是‘天呐，AI到头了！’，就好像有了它,我们便不再需要进行任何计算了，但实际情况恰恰相反。”黄仁勋表示。

市场是否“买单”？

2025年1月，DeepSeek推出低算力成本的开源大语言模型R1，以仅560万美元的训练成本实现了与OpenAIo1等闭源模型相当的性能。这一成果挑战了传统AI训练依赖高算力芯片堆料的商业模式。

受此影响，英伟达市值曾一度下跌，尤其在1月27日跌去近17%，一夜蒸发近6000亿美元，创美股单日市值蒸发纪录。当时，投资者们担忧AI行业对英伟达芯片的需求可能大幅减少，导致市场对算力泡沫的恐慌。

事实上，英伟达官方在股价暴跌后迅速发声，指出DeepSeek的成功恰恰证明了其芯片的实用性，并强调“推理阶段需要大量英伟达GPU和高性能网络”，未来市场需求将随着(zhe)AI应(yīng)用(yòng)扩(kuò)展(zhǎn)而(ér)增(zēng)长(zhǎng)。但(dàn)当(dāng)时(shí)的(de)发(fā)声(shēng)并(bìng)未(wèi)对(duì)其(qí)股(gǔ)价(jià)回(huí)升(shēng)起到实际效果。

随后市场逐渐认识到，DeepSeek的创新可(kě)能(néng)推(tuī)动(dòng)更(gèng)多(duō)中(zhōng)小(xiǎo)型(xíng)企(qǐ)业(yè)进(jìn)入(rù)AI领(lǐng)域，反(fǎn)而(ér)刺(cì)激(jī)对(duì)GPU等(děng)算(suàn)力(lì)芯(xīn)片(piàn)的(de)增(zēng)量(liàng)需(xū)求(qiú)。英(yīng)伟(wěi)达(dá)股(gǔ)价(jià)在(zài)接(jiē)下(xià)来(lái)近(jìn)一(yī)个(gè)月(yuè)里(lǐ)震(zhèn)荡(dàng)回(huí)升，目前已逐渐“收复失地”。

值得关注的是，此次黄仁勋的发声在英伟达财报公布之前，2月26日美股盘后，英伟达将公布四季度财报。虽然此次黄仁勋正面表达了对于DeepSeek问世将利好英伟达未来的信心，但市场的真正反映将有赖于其财报给出的关键数据。