DeepSeek火爆后，會發(fā)生什么

時間：2025年03月04日熱線：0311-85290821 來源：中國新聞周刊

　　2025年開年，國內深度求索(DeepSeek)公司推出大語言模型DeepSeek R1引發(fā)全球轟動。這款開源模型在有限算力條件下，復現(xiàn)出OpenAI最先進的閉源o1模型的能力，讓社會各界感受到AI富有“靈性”的深度思考能力，這是邁向通用人工智能的重要一步。

　　從技術角度看，DeepSeek實現(xiàn)了算法創(chuàng)新驅動的效率革命。DeepSeek團隊在缺乏參考的情況下，成功復現(xiàn)媲美 OpenAI o1 模型的深度推理能力，而且應用程序接口(API)價格僅為后者的 1/30；此前DeepSeek V3 模型通過模型架構和基礎軟硬件的深度集成優(yōu)化，實現(xiàn)與 GPT-4o 相當模型能力的同時，單次訓練成本僅為同水平模型的 1/10。這些均證明國內團隊已具備頂尖的算法創(chuàng)新能力，可以讓大模型的訓練和推理更加高效。

　　此外，開源生態(tài)與普惠AI成為中國技術突圍的戰(zhàn)略支點。如果說2023年Meta開源大模型LLaMA為全球開發(fā)者帶來ChatGPT水平的智能，那么DeepSeek R1則為大家?guī)鞳penAI o1水平的智能。DeepSeek不僅公開模型并制定寬松的使用協(xié)議，還發(fā)布詳盡的技術報告介紹實現(xiàn)方案，這種開源精神帶來的“普惠沖擊波”，打破了OpenAI嘗試通過閉源建立的技術壁壘。開源生態(tài)將成為算法創(chuàng)新的加速器，推動全球開發(fā)者共同探索高效化路徑。中國若能持續(xù)發(fā)揮開源優(yōu)勢，有望在AI普惠化進程中占據(jù)先機。

　　但值得注意的是，盡管DeepSeek R1模型效果媲美世界最先進的OpenAI o1并在計算效率上擁有巨大優(yōu)勢，但是OpenAI隨后發(fā)布了o3模型，顯著增強了在STEM(科學、技術、工程和數(shù)學)方面的高階推理能力，這說明我國在大模型技術方面總體仍處于追趕狀態(tài)。盡管中美 AI 差距不斷縮小，但需要警惕諸如“中國AI已超越美國”“DeepSeek羞辱OpenAI”等極端樂觀的說法。事實上，AGI新技術正處于快速演進期，未來發(fā)展路徑尚不明朗，我們雖不再望塵莫及，但在人才儲備、算力資源和創(chuàng)新生態(tài)等方面仍有差距，需要保持頭腦清醒，走好后面更有挑戰(zhàn)的路。

　　關于通向AGI的未來之路，DeepSeek的啟示直指AI發(fā)展的兩大命題：其一，高效和普惠是智能革命的必然選擇。要讓 AI 服務全人類實現(xiàn) “人人可用”，高效性至關重要。DeepSeek通過模型架構、算法和算力的協(xié)同創(chuàng)新，成為大模型普惠AI發(fā)展的重要里程碑。芯片行業(yè)在“摩爾定律”的指引下，不斷推進芯片制程提升芯片電路密度，從而實現(xiàn)計算設備的小型化和普惠化，推動實現(xiàn)信息革命�，F(xiàn)有研究表明，大模型發(fā)展也呈現(xiàn)出類似摩爾定律的“密度定律”，根據(jù)統(tǒng)計，2023年以來大模型的能力密度大約每100天翻一倍，即每過100天只需要一半的算力和一半的參數(shù)就能實現(xiàn)相同的能力。最近，OpenAI的CEO 山姆·奧特曼也給出了類似的觀察，“使用特定水平AI，成本每年大約變?yōu)樵瓉淼氖种弧�。面向未來，追求更高能力密度、以更低成本實現(xiàn)大模型高效發(fā)展，將是實現(xiàn)智能革命的關鍵路徑。

　　其二，自主創(chuàng)新需“結硬寨，打呆仗”。DeepSeek模型的極致高效，需要建立在高水平科研隊伍、長期的研究和實驗驗證的基礎上。DeepSeek有著一批極客式的優(yōu)秀研發(fā)隊伍，有充足的研發(fā)預算，專注研究和技術，沒有商業(yè)化壓力，算力資源也十分充足。這種專注和投入是自主創(chuàng)新的關鍵。未來AI創(chuàng)新發(fā)展需在三大方向發(fā)力：首先，探索人工智能的科學化技術方案，為極致高效實現(xiàn)人工智能提供理論指導。其次，推動計算系統(tǒng)的智能化，將大模型與底層芯片、操作系統(tǒng)、數(shù)據(jù)管理、編程開發(fā)、網(wǎng)絡通信等軟硬件深度融合，在計算層面以更低的成本更通用地將大模型應用于各個領域。最后，在各個領域探索人工智能的創(chuàng)新應用，服務高精尖制造、科學發(fā)現(xiàn)等高度專業(yè)化場景。

　　DeepSeek的成功讓我們看到，用“小米加步槍”中國AI依然能夠取得不錯的進展。然而，AGI技術仍在快速演進，我們需發(fā)揮開源和工程創(chuàng)新優(yōu)勢，補齊基礎研究短板，走出一條人工智能高質量發(fā)展之路，讓 DeepSeek點燃的火種，成為推動智能革命的熊熊烈火。

　　(作者系清華大學計算機系長聘副教授、面壁智能首席科學家)

　　發(fā)于2025.2.24總第1176期《中國新聞周刊》雜志

　　雜志標題：高效普惠是人工智能革命的必然選擇

　　作者：劉知遠

　　編輯：杜瑋

編輯：【李玉素】