DeepSeek火爆后,會(huì)發(fā)生什么

時(shí)間:2025年03月04日    熱線:0311-85290821   來源:中國新聞周刊

  2025年開年,國內(nèi)深度求索(DeepSeek)公司推出大語言模型DeepSeek R1引發(fā)全球轟動(dòng)。這款開源模型在有限算力條件下,復(fù)現(xiàn)出OpenAI最先進(jìn)的閉源o1模型的能力,讓社會(huì)各界感受到AI富有“靈性”的深度思考能力,這是邁向通用人工智能的重要一步。

  從技術(shù)角度看,DeepSeek實(shí)現(xiàn)了算法創(chuàng)新驅(qū)動(dòng)的效率革命。DeepSeek團(tuán)隊(duì)在缺乏參考的情況下,成功復(fù)現(xiàn)媲美 OpenAI o1 模型的深度推理能力,而且應(yīng)用程序接口(API)價(jià)格僅為后者的 1/30;此前DeepSeek V3 模型通過模型架構(gòu)和基礎(chǔ)軟硬件的深度集成優(yōu)化,實(shí)現(xiàn)與 GPT-4o 相當(dāng)模型能力的同時(shí),單次訓(xùn)練成本僅為同水平模型的 1/10。這些均證明國內(nèi)團(tuán)隊(duì)已具備頂尖的算法創(chuàng)新能力,可以讓大模型的訓(xùn)練和推理更加高效。

  此外,開源生態(tài)與普惠AI成為中國技術(shù)突圍的戰(zhàn)略支點(diǎn)。如果說2023年Meta開源大模型LLaMA為全球開發(fā)者帶來ChatGPT水平的智能,那么DeepSeek R1則為大家?guī)鞳penAI o1水平的智能。DeepSeek不僅公開模型并制定寬松的使用協(xié)議,還發(fā)布詳盡的技術(shù)報(bào)告介紹實(shí)現(xiàn)方案,這種開源精神帶來的“普惠沖擊波”,打破了OpenAI嘗試通過閉源建立的技術(shù)壁壘。開源生態(tài)將成為算法創(chuàng)新的加速器,推動(dòng)全球開發(fā)者共同探索高效化路徑。中國若能持續(xù)發(fā)揮開源優(yōu)勢,有望在AI普惠化進(jìn)程中占據(jù)先機(jī)。

  但值得注意的是,盡管DeepSeek R1模型效果媲美世界最先進(jìn)的OpenAI o1并在計(jì)算效率上擁有巨大優(yōu)勢,但是OpenAI隨后發(fā)布了o3模型,顯著增強(qiáng)了在STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))方面的高階推理能力,這說明我國在大模型技術(shù)方面總體仍處于追趕狀態(tài)。盡管中美 AI 差距不斷縮小,但需要警惕諸如“中國AI已超越美國”“DeepSeek羞辱OpenAI”等極端樂觀的說法。事實(shí)上,AGI新技術(shù)正處于快速演進(jìn)期,未來發(fā)展路徑尚不明朗,我們雖不再望塵莫及,但在人才儲(chǔ)備、算力資源和創(chuàng)新生態(tài)等方面仍有差距,需要保持頭腦清醒,走好后面更有挑戰(zhàn)的路。

  關(guān)于通向AGI的未來之路,DeepSeek的啟示直指AI發(fā)展的兩大命題:其一,高效和普惠是智能革命的必然選擇。要讓 AI 服務(wù)全人類實(shí)現(xiàn) “人人可用”,高效性至關(guān)重要。DeepSeek通過模型架構(gòu)、算法和算力的協(xié)同創(chuàng)新,成為大模型普惠AI發(fā)展的重要里程碑。芯片行業(yè)在“摩爾定律”的指引下,不斷推進(jìn)芯片制程提升芯片電路密度,從而實(shí)現(xiàn)計(jì)算設(shè)備的小型化和普惠化,推動(dòng)實(shí)現(xiàn)信息革命�,F(xiàn)有研究表明,大模型發(fā)展也呈現(xiàn)出類似摩爾定律的“密度定律”,根據(jù)統(tǒng)計(jì),2023年以來大模型的能力密度大約每100天翻一倍,即每過100天只需要一半的算力和一半的參數(shù)就能實(shí)現(xiàn)相同的能力。最近,OpenAI的CEO 山姆·奧特曼也給出了類似的觀察,“使用特定水平AI,成本每年大約變?yōu)樵瓉淼氖种弧�。面向未來,追求更高能力密度、以更低成本�?shí)現(xiàn)大模型高效發(fā)展,將是實(shí)現(xiàn)智能革命的關(guān)鍵路徑。

  其二,自主創(chuàng)新需“結(jié)硬寨,打呆仗”。DeepSeek模型的極致高效,需要建立在高水平科研隊(duì)伍、長期的研究和實(shí)驗(yàn)驗(yàn)證的基礎(chǔ)上。DeepSeek有著一批極客式的優(yōu)秀研發(fā)隊(duì)伍,有充足的研發(fā)預(yù)算,專注研究和技術(shù),沒有商業(yè)化壓力,算力資源也十分充足。這種專注和投入是自主創(chuàng)新的關(guān)鍵。未來AI創(chuàng)新發(fā)展需在三大方向發(fā)力:首先,探索人工智能的科學(xué)化技術(shù)方案,為極致高效實(shí)現(xiàn)人工智能提供理論指導(dǎo)。其次,推動(dòng)計(jì)算系統(tǒng)的智能化,將大模型與底層芯片、操作系統(tǒng)、數(shù)據(jù)管理、編程開發(fā)、網(wǎng)絡(luò)通信等軟硬件深度融合,在計(jì)算層面以更低的成本更通用地將大模型應(yīng)用于各個(gè)領(lǐng)域。最后,在各個(gè)領(lǐng)域探索人工智能的創(chuàng)新應(yīng)用,服務(wù)高精尖制造、科學(xué)發(fā)現(xiàn)等高度專業(yè)化場景。

  DeepSeek的成功讓我們看到,用“小米加步槍”中國AI依然能夠取得不錯(cuò)的進(jìn)展。然而,AGI技術(shù)仍在快速演進(jìn),我們需發(fā)揮開源和工程創(chuàng)新優(yōu)勢,補(bǔ)齊基礎(chǔ)研究短板,走出一條人工智能高質(zhì)量發(fā)展之路,讓 DeepSeek點(diǎn)燃的火種,成為推動(dòng)智能革命的熊熊烈火。

  (作者系清華大學(xué)計(jì)算機(jī)系長聘副教授、面壁智能首席科學(xué)家)

  發(fā)于2025.2.24總第1176期《中國新聞周刊》雜志

  雜志標(biāo)題:高效普惠是人工智能革命的必然選擇

  作者:劉知遠(yuǎn)

  編輯:杜瑋

編輯:【李玉素】
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
Copyright ?1999-2024 chinanews.com. All Rights Reserved