9月14日消息(趙婷婷)在日前召開的2024服貿會通用人工智能算力論壇上,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民發(fā)表題為《構建國產智算系統(tǒng)的關鍵》的主題演講。
鄭緯民表示,當前大模型進入多模態(tài)發(fā)展,不僅限于文本處理,還包括圖像與視頻等多媒體形式;并且大模型的應用領域正在不斷拓展,涵蓋了金融、醫(yī)療、汽車以及智能制造等多個行業(yè)。
隨著AI快速發(fā)展,對算力的需求呈現(xiàn)出爆炸式增長。而大模型的開發(fā)與部署尤其依賴于強大的算力支持。大模型的研發(fā)通常涉及五個關鍵階段:數(shù)據(jù)獲取、數(shù)據(jù)預處理、模型訓練、模型微調以及模型推理,每一個階段都需要大量的計算資源。尤其是在模型訓練與推理過程中,算力消耗分別占據(jù)了整體需求的大約70%與95%。
目前,用于訓練的設備主要包括英偉達的GPU。盡管英偉達的GPU以其出色的硬件性能及成熟的編程生態(tài)體系受到廣泛歡迎,但由于國際供應受限,導致價格高漲且供不應求。在此背景下,算力的國產化勢在必行。目前國內相關企業(yè)已開始自主研發(fā)AI芯片,并取得顯著進展,多家公司如華為、曙光、寒武紀及摩爾線程等均已有產品問世。然而,盡管國產化取得了積極成果,但在實際應用中仍面臨挑戰(zhàn),尤其是軟件生態(tài)系統(tǒng)的建設尚需加強。
鄭緯民指出,為了改善這一狀況,清華大學開發(fā)了一套名為“八卦爐”的核心基礎軟件,包括并行系統(tǒng)、編程框架、AI編譯器、算子庫等十個軟件,旨在優(yōu)化國產智算系統(tǒng)的軟件環(huán)境。該軟件已在多個平臺進行測試,并成功應用于大模型訓練任務,如LLAMA、百川和悟道等,不僅能夠正確完成訓練任務,而且在成本效益方面表現(xiàn)出色,僅英偉達GPU的六分之一。
此外,“八卦爐”還在其他應用場景中展現(xiàn)出了卓越的性能提升能力,例如,在沐曦、燧原、摩爾線程等企業(yè)的實踐中,提升了算力效率,并降低成本。
演講最后,鄭緯民總結道,“發(fā)展人工智能,構建國產智能算力至關重要。智能算力的軟件生態(tài)是當前制約我國人工智能發(fā)展的關鍵因素,優(yōu)秀的系統(tǒng)軟件能夠充分釋放底層硬件算力的潛力。”
- 400G網絡轉型:數(shù)據(jù)中心演進的必由之路
- 可穿戴設備市場的增長動力是什么?
- 全國人大代表、中國鐵塔董事長張志勇:發(fā)力低空基礎設施建設
- MWC25觀察:趁光產業(yè)“三進三退”之勢破浪前行 共贏行業(yè)智能化
- 代表聲音|全國人大代表樓向平:推進“人工智能+”行動,搶占競爭制高點
- 2025年的孿生:為何數(shù)字流程孿生對于運營彈性至關重要
- MWC25觀察|折桂“奧斯卡”,移動通信產業(yè)東升西落
- 800G以太網的出現(xiàn):網絡的新標準
- DeepSeek全球排名第二!中國AI應用強勢崛起 直追ChatGPT
- 人工智能的崛起:加速800G以太網時代的到來
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。