思元 370 是寒武紀首款采用 chiplet(芯粒)技術的 AI 芯片,應該也是國內首顆 chiplet AI 芯片?;谂_積電 7nm 制程工藝,整體集成了 390 億個晶體管,最大算力達到 256TOPS(INT8),這一數據是寒武紀第二代產品思元 270 算力的 2 倍。
憑借寒武紀最新智能芯片架構 MLUarch03,相較于峰值算力的提升,思元 370 實測性能表現非常亮眼:同功率性能超過 T4 兩倍還多,完成同樣的任務,功耗可以是 A10 的一半。
此外,寒武紀還基于思元370智能芯片的技術,通過Chiplet(芯粒)技術,靈活組合產品的特性,適配出符合不同場景需求的三款加速卡,包括:MLU370-S4、MLU370-X4和MLU370-X8。
具體來說,MLU370-S4為半高半長單槽位加速卡,板卡功耗為75W,可面向機器視覺/推理任務,適合于對計算密度要求較高的數據中心場景。
而MLU370-X4為單槽位150W全尺寸加速卡,可提供256TOPS(INT8)推理算力和24TFLOPS(FP32)訓練算力,同時提供FP16、BF16等多種訓練精度,主要面向互聯(lián)網行業(yè)等推理任務或訓推一體場景,適合于對單卡算力需求較高的應用場景。
MLU370-X8則采用雙芯思元370配置,為雙槽位250W全尺寸加速卡,可提供24TFLOPS(FP32)訓練算力和256TOPS(INT8)推理算力,同時提供豐富的FP16、BF16等多種訓練精度,主要面向對算力和帶寬要求較高的訓練任務。在業(yè)界應用廣泛的YOLOv3、Transformer等訓練任務中,8卡計算系統(tǒng)的并行性能平均達到350W RTX GPU的155%。
總而言之,寒武紀在同樣的研發(fā)費用之下,滿足了更多元的市場需求。
據了解,寒武紀是智能芯片領域全球知名的新興公司,主營業(yè)務是各類云服務器、邊緣計算設備、終端設備中人工智能核心芯片的研發(fā)、設計和銷售,通過向客戶提供芯片及加速卡產品、訓練整機、智能計算集群系統(tǒng)、IP授權及軟件獲取業(yè)務收入。
成立以來,寒武紀一直根據市場和客戶的需求,加強研發(fā)創(chuàng)新投入力度,持續(xù)升級迭代云邊端系列化產品及基礎系統(tǒng)軟件平臺,豐富公司的產品矩陣,以適應不同的人工智能應用場景。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )