DeepSeek席卷美國,OpenAI坐不住了
作者:錢童心 責編:李娜
中國AI初創公司DeepSeek所展示的突破性技術進展正在將中國創新輸出全球,就連美國公司都在爭相效仿,試圖復刻R1模型的能力。
有觀點認為,DeepSeek的出現為“中國創新,美國模仿”時代的開啟,稱這將顛覆人們對兩國之間的“長期偏見”。
現在美國政府和業界正在仔細對DeepSeek的技術進行分析。人們突然發現,構建AI其實不需要那么多資金。這一技術突破如果被業內廣泛采用,將很快迎來人工智能成本下降的拐點。
這對于人工智能開發商OpenAI這樣靠高價銷售來實現盈利的AI企業的打擊將是災難性的,因為DeepSeek的成功證明了OpenAI的“護城河”并沒有那么深。
在高成本投入之下,OpenAI仍在不斷通過一輪又一輪融資來推高估值。DeepSeek的模式可能讓OpenAI的價值大幅縮水。
就在DeepSeek挑戰人們對開發和部署人工智能成本的預期時,業內突然傳出消息稱,軟銀集團正在洽談牽頭對OpenAI進行高達400億美元的融資,使其估值翻番達到3000億美元。目前這一融資傳言尚未得到證實。
自兩年前推出ChatGPT以來,OpenAI首席執行官奧爾特曼(Sam Altman)一直堅稱,他的業務由幾個關鍵因素推動:芯片、數據和資金。人們向他的公司投入的這三個元素越多,就像向蒸汽火車的熔爐里投入煤炭一樣,它產生的人工智能就越強大。他的這一假設基于著名的“卷尺定律”。
但DeepSeek打破了奧爾特曼的公式,它不僅以大幅少于OpenAI的資源構建了一個同樣強大的模型,而且還將這一技術開源了,這引起了OpenAI的恐慌。
在全球各地,DeepSeek的開源模型正在被大量的初創公司模仿,其中也包括美國的AI公司Hugging Face。如果便宜得多甚至免費的開源模型被證明能夠完成OpenAI模型希望解決的任務,那么OpenAI的市場份額將會被蠶食。
OpenAI的GPT模型是一個封閉的系統,它實現盈利的途徑主要是以更高的價格出售基礎模型的使用權。此前,Meta以構建開源的Llama系統挑戰了OpenAI的地位。而在最新一輪的競爭中,DeepSeek的崛起有望將開源模式的發展推向下一個階段。
Hugging Face的高管已經表示,DeepSeek的技術已被該領域的其他人所理解,預計很多團隊可以重復這項工作。因為“智能的秘訣非常簡單”,也就是擁有一個非常強大的預訓練模型,然后擁有非常好的基礎設施來大規模進行強化學習過程。
DeepSeek通過開源模型,向其他人提供了復制和改進該模型的關鍵模型參數,而不像OpenAI那樣將其模型“鎖在黑匣子里”,這受到業內的稱贊。Meta等公司的工程師們已經在仔細研究這些細節,未來可能會看到這些公司發布效率更高的新AI模型。
紐約大學名譽教授Gary Marcus長期以來一直抱怨OpenAI的不透明性,并警告AI市場泡沫。在DeepSeek的R1模型發布后,他公開表示:“DeepSeek關于R1模型的論文比我自GPT-3以來從OpenAI看到的任何內容都更加透明。”
盡管奧爾特曼稱對競爭表示興奮,但他告訴媒體DeepSeek使用了OpenAI的數據來構建自己的模型。這一所謂的“蒸餾技術”在業內被廣泛使用,尤其是缺乏資源的小型AI企業,它為AI模型的開發提供了一種高效廉價的方式。
另一方面,奧爾特曼正在積極游說美國政府繼續向AI基礎設施投入大量資金,以支持未來AI技術的發展。他在1月30日的華盛頓的一個政府閉門會上表示,人工智能開發人員正在轉向開發能“完成越來越復雜任務”的AI服務,這需要更多的算力來改進人工智能模型,支持日益增長的使用量。
美國政府上周宣布,將推動OpenAI、軟銀集團和甲骨文公司打造的一項投入1000億美元的AI基礎設施項目“星際之門”,以保持在AI競賽中的領先地位。
但“大衛與歌利亞的故事”已經開始。“打造強大的人工智能需要資源,但更需要智慧。未來也許不屬于那些花錢最多的人,而是屬于那些敢于與世界分享自己工作成果的人。”一位AI專家這樣評論道。