快訊

【一文看懂】登場即震撼 DeepSeek與ChatGPT哪裡不同?資安呢?

2025-01-28 16:05 / 作者 林宜萱
2025年1月28日,中國新創公司DeepSeek推出的聊天機器人介面。美聯社
中國新創公司「深度求索」(DeepSeek)近日推出的同名人工智慧(AI)聊天機器人,一登場就在美國科技、股市和政治上引發震撼,讓晶片大廠輝達27日股價暴跌近17%、市值蒸發5930億美元。但這款聊天機器人和先前爆紅的ChatGPT有何不同?資安狀況又如何?本文根據《華盛頓郵報》一文解釋。

DeepSeek的應用程式在上週末成為美國Apple Store下載榜首,能力受到矽谷肯定。最重要的是,DeepSeek上週一篇技術論文顯示,其語言模型的開發成本不到600萬美元,使用的是輝達相對低端的H800晶片,讓投資人懷疑未來是否還需要在AI開發上投資鉅額,也質疑美國對中國的晶片出口管制究竟有沒有效用。

DeepSeek公司的背景?

總部中國杭州的DeepSeek是一家AI領域新創公司,由量化對沖基金「幻方量化」(High-Flyer)創辦人梁文峰於2023年創立,運用AI演算預測市場波動。據公司表示,其AI軟體在多個領域上能夠媲美美國ChatGPT母公司OpenAI、或搜尋引擎龍頭谷歌的軟體,但開發和運作成本相對低很多。

DeepSeek上週發布其中一個模型DeepSeek-R1的技術論文,指出開發過程只用了約2000個輝達H800晶片,成本和上月發布的V3模型差不多,大概就560萬美元。不過這個成本指的是模型的訓練成本,前置作業(例如設計訓練方式)的成本可能會更多。

H800是輝達因應美國出口管制而推出的中國特供版,其效能受到限制。這推翻了美國AI產業和政策制定者的一大假設,也就是要開發最先進的AI需要即先進、而且昂貴的半導體。若真如此,美國政府先前對中國祭出的尖端晶片禁令,殺傷力就會不如預期。

DeepSeek如何運作?

DeepSeek的應用程式介面,和ChatGPT這類聊天機器人都差不多,就是輸入問題或要求,機器人會以文字回答,DeepSeek目前還沒有公開推出圖像生成功能。

2025年1月28日,中國新創公司DeepSeek推出的聊天機器人介面。美聯社

無論手機是iOS或Android系統,現階段都可以免費使用,任何想試用的人都可以下載。

與其他生成式AI模型一樣,DeepSeek是透過輸入大量資訊來建構其回應,其模型接收的最新資料是到去年7月,所以它可以回答這個時間點之前的問題,它不知道最近發生的事件,但有搜尋選項可讓使用者自己去找最新資訊和頭條新聞。

資安如何?

和大多數App一樣,DeepSeek可以收集和儲存大量個資,包含使用者和DeepSeek機器人進行的任何對話,以及使用者手機、網路連接的技術資訊。而中國政府可以取得這些數據,因為中國政府對於中國企業有廣泛的干預權。

DeepSeek似乎也依據中國的網路審查來調整回應,例如提到有關1989年六四天安門事件的問題,它會建議使用者聊點別的話題。

DeepSeek是如何開發成功的?

這是目前最大的謎。DeepSeek使用了相對不先進的晶片來開發AI模型,這對中國政府和科技業來說可能都是個大新聞,畢竟美國對尖端晶片出口到中國實施了全面限制,就是要減緩中國AI領域的發展。

DeepSeek上月論文指出,其V3模型是使用2048個輝達H800晶片來訓練,成本560萬美元。不過如前文所述,這不是全部的開發成本,只是模型訓練成本,沒有計入基礎設施和其他前置作業成本。

2家美國AI實驗室告訴路透社,訓練費用往往只佔總成本的冰山一角,設計訓練方式的成本通常更高。在基礎建設方面,分析師估計美國大型雲端公司今年在AI基礎設施上的支出就達到2500億美元。

撇除成本的問題,最謎的應該是DeepSeek究竟如何用效能相對低的H800訓練出和ChatGPT並駕齊驅的AI。

DeepSeek與ChatGPT、或其他類似機器人有什麼不同?

其實沒有太大不同。DeepSeek的功能和ChatGPT、谷歌的Gemini、Meta的Llama、Anthropic的Claude都差不多。雖然DeepSeek的研究人員強調他們已經開發出讓模型訓練更有效率的技術,不過這種老王賣瓜的推銷手法大家都會。

DeepSeek和CharGPT應用程式圖標。美聯社

DeepSeek免費提供AI模型供人下載和修改,代表其他公司可以用他們的技術來提升自己的AI。這也不新鮮,Meta的Llama模型也採用這個策略;反之,OpenAI 選擇保留ChatGP的技術,一般企業想用的話就需要用買的。

市場對DeepSeek的反應為何這麼大?

ChatGPT爆紅後,AI類股在過去兩年來股價竄升新高,DeepSeek的出現讓一些投資人懷疑,如果AI開發可以如此有效率,輝達這些晶片公司是否還能賣出大量晶片。

因此以科技公司為主的那斯達克指數27日跌3%。輝達大跌17%,市值蒸發近6000億美元,雖然仍是全球最有價值的公司之一,畢竟市值還有2.9兆美元。

為輝達生產晶片的台積電ADR股價跌逾14%,安謀(ARM)、英特爾也全部都跌。分析師指出,市場的反應顯示人們對AI炒作的質疑終於浮上檯面,懷疑那能否真正轉化為賺錢的商品、以及那種可以大賺的商品還要多久才會出現。

一些AI產業領袖則不認為高效開發出了AI就代表晶片不重要。輝達27日在聲明中表示,DeepSeek代表優秀的AI開發進步,而這也顯示DeepSeek未來需要更多輝達的晶片來為廣大使用者提供服務;微軟執行長納德拉(Satya Nadella)也在社群平台表示,隨著AI開發更高效、更容易應用,「我們會看到它的應用倍增,成為我們永遠覺得不夠用的大宗商品」。

一些分析師則認為,27日的拋售是市場太快恐慌,因為一直以來都是美國企業主導AI創新,突然冒出一個中國企業就受驚了。

美國政府下一步?

美中都將AI視為國家優先發展項目,中國曾表明希望2030年能成為全球AI領頭羊,雙方都對AI資料中心和開發投入了鉅額,而美國拜登政府也出手限制對中國出口尖端晶片和半導體設備。

《華郵》指出,在某些情況下,中國可能還是有能力從其他國家買到AI晶片來繞過美國這些管制。

不過,輝達H800晶片符合美國目前的出口條件,如果DeepSeek確實是用H800訓練出來的,川普政府可能要考慮對AI晶片實施更嚴格的管制,雖然目前不確定他會否這樣做。

面對DeepSeek的震撼,白宮27日是先指責拜登政府讓中國在AI領域追上美國;川普則表示,這對美國是一道警鐘,提醒大家要更集中精力在這場競爭,但對於「有一家公司找到了更快、更便宜的人工智慧開發方式」,川普說這很好,「因為不用花那麼多錢,是一種優勢」,大家跟著做就可以期望得到相同的成果。
林宜萱 收藏文章

本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見