AI大模型非常昂貴 只有大企業(yè)和超級富豪才能玩得轉

極客網·人工智能4月6日 ChatGPT大火帶動AI又一波熱潮,不過業(yè)界普遍認為,當AI 步入大模型時代,只有大企業(yè)和超級富有的企業(yè)才玩得起AI,因為AI大模型的打造非常昂貴。

首先是計算昂貴。多倫多大學市場營銷教授Avi Goldfarb說:“如果你想創(chuàng)辦一家企業(yè),自己開發(fā)大語言模型,自己計算,成本太高了。OpenAI是很貴的,要數以十億計的美元?!弊赓U計算當然會便宜不少,但企業(yè)仍然要向AWS等企業(yè)支付昂貴費用。

其次是數據昂貴。訓練模型需要海量數據,有時數據是現成的,有時不是。Common Crawl和LAION等數據可以免費使用,對于此類數據,成本主要來自數據清理和處理,成本變化很大,可能是幾百美元,也可能是幾百萬美元。

Glean公司創(chuàng)始工程師Debarghya Das說,在美國,根據大語言模型論文做一些粗略的數學計算,如果用的是Facebook LLaMA,訓練成本(不考慮迭代或者出錯)大約是400萬美元,如果是谷歌PaLM,大約2700萬美元。

即使用的是免費數據,成本也不低。Hugging Face公司研究人員Sasha Luccioni說:“當你下載容量達到TB的數據,如果想過濾或者以某種特殊方式利用數據,比如用文本-圖片模型處理(研究人會專注于某些數據子集,這樣模型才會變得更好),整個過程相當棘手?!毙枰獜姶蟮挠嬎懔Γ枰罅繉I(yè)人士。

再次,專業(yè)人才的聘請費用也很高。Debarghya Das在做上述估算成本時沒有考慮人力成本。Sasha Luccioni指出:“機器學習專業(yè)人士的薪酬很高,因為要與谷歌及其它科技巨頭爭奪人才,有時一位專業(yè)人才可能要幾百萬美元?!?016年OpenAI最頂級的研究人員薪酬約為190萬美元。

并且,訓練模型、聘請專業(yè)人士的成本不是一次性的,是持續(xù)的。例如,如果開發(fā)的是客服聊天機器人,每周或者每幾周就要優(yōu)化。模型還要經受壓力測試,確保它生成的答案不出錯。正如Sasha Luccioni所解釋:“最貴的成本來自持續(xù)性工作,必須持續(xù)測試模型,必須確保AI所做的和預期一樣?!?/p>

最后,持續(xù)運轉費用也不低。當一切準備妥當,模型向公眾開放,每天要接受成千上萬次詢問,此時要確保模型可擴展、高度穩(wěn)定,維護成本也很高,且需要專業(yè)人士來處理。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2023-04-06
AI大模型非常昂貴 只有大企業(yè)和超級富豪才能玩得轉
ChatGPT大火帶動AI又一波熱潮,不過業(yè)界普遍認為,當AI 步入大模型時代,只有大企業(yè)和超級富有的企業(yè)才玩得起AI,因為AI大模型的打造非常昂貴。首先是計算昂貴。多倫多大學市場營銷教授Avi Goldfarb說:“如果你想創(chuàng)辦一家企業(yè),自己開發(fā)大語言模型,自己計算,成本太高了。OpenAI...

長按掃碼 閱讀全文