輝達晶片。路透社
英國《金融時報》報導指出,美國去年積極限制中國發展應用在軍事目的的人工智能(Artificial Intelligence,AI)的能力,限制大部分最先進的AI技術出口至中國 。
由於訓練生成式AI的晶片大有進展,這意味著現在中國市場上最先進的美國技術,勝過於之前所有的技術。儘管這些晶片在中國市場上已經被刻意限制能力,跟世界其他地方相比效率較差。
這種情形導致中國大買美國先進的晶片處理器。報導提到,中國企業已經向輝達下單高達50億美元的晶片,其圖像處理器已經成為訓練大型AI模組的主力。
這股訂單熱潮除了反映中國市場對於改良後晶片的需求,用於訓練科技公司最新大型語言模組,另一方面也是出於擔憂,擔心未來美國政府可能進一步收緊出口管制,可能連目前市面上功能受限的晶片也會買不到。
輝達位於台北總部。路透社
輝達(Nvidia)首席科學達利(Bill Dally)認為,美國的出口管制在未來影響更大,「隨著大部分先進的AI系統的訓練需求,每6至12個月就加倍,在中國販售的晶片和世界上其他的晶片的差距就會快速拉大」。
限制晶片速度美國去年對晶片的出口控制,其中部分包括阻止中國客戶購買製造先進晶片的設備。
華府限制在中國販售的晶片處理器速度,以及晶片傳送數據的速度,而這正是訓練大型AI模組的關鍵因素。AI是重度數據的工作,需要把大量的晶片連結在一起。
當時輝達的對策就是減少其當時最頂尖的A100晶片的傳輸速度,特別為中國量身打造一款A800的產品,以符合出口限制。
今年,輝達的H100晶片也遵守了數據傳輸的限制,這是一種全新、也更強大的處理器,特別用來訓練大型的語言模型,也針對中國市場特製一款同等級的產品H800。
輝達並未公開為中國特製晶片的規格,但是電腦製造商知道。中國電腦大廠聯想就宣稱,使用H800的伺服器就等於使用H100的伺服器,唯一不同的就是傳輸速度只有400GB/秒。
這低於美國設定出口給中國的限制600GB/秒。但是相較之下,輝達宣稱今年才出貨的H100,傳輸速度是900GB/秒。
中國版晶片的傳輸速度比較慢,代表使用者必須要花比較多的時間訓練AI系統,而隨著AI模型的數目倍增,這將會是一大限制。
訓練時間越長,就越耗成本,因為需要更多電力,而這也是大型模組最大的支出之一。
不過儘管有這些限制,輝達為中國特製的H800,還是比之前賣的所有產品都更強大,所以市場需求還是很強勁。
H800的速度已經是輝達之前最先進的晶片A100的5倍以上。
這意味著現在使用出口管制之前購買的頂尖晶片的中國網路公司,如果買更新的產品,還是可以看到性能大有改善。
市場研究公司Moor Insights & Strategy美國晶片分析師莫爾黑德(Patrick Moorhead)認為,美國政府顯然不是要斷絕中國發展AI,只是要讓這變得更難。
成本效益目前中國的科技公司訓練大型語言模組,仍處於初期階段,這非常消耗圖形處理器晶片的效能,需要比較好的傳輸速度。
中國AI工程師說,只有輝達的晶片可以提供初期訓練的效能,為中國特製的H800雖然傳輸速度比較慢,但仍優於市場其她產品。
一名工程師表示,「輝達的圖形處理器看起還很貴,但其實是最省錢的選擇」。