最近跟一位企業(yè)的CIO交流,對方關(guān)于大模型的認(rèn)知讓我驚呆了,他說,“聽說做私域大模型要兩千萬的軟件投入和兩千萬的算力投入,我們公司沒有這個預(yù)算”。
于是我問道:“那如果按照你們公司的數(shù)據(jù)基礎(chǔ)和業(yè)務(wù)場景,只需要十分之一甚至更少的投入,你愿意做大模型嗎?”
他馬上表示:“這個預(yù)算可以搞!”
如果只關(guān)注基礎(chǔ)模型廠商和賣“鏟子”的英偉達的發(fā)布會,會覺得大模型立馬就可以將企業(yè)用戶“帶飛”。事實上,很多企業(yè)在應(yīng)用大模型時,還有大量的困惑與難題。
比如以為需要大算力、大投入,要么望而卻步,要么盲目囤了很多卡/服務(wù)器,卻發(fā)現(xiàn)基座模型與業(yè)務(wù)融合的過程漫長且復(fù)雜,涉及大量試錯、調(diào)優(yōu)等工作,后續(xù)訓(xùn)練、推理、部署等環(huán)節(jié)的算力資源消耗與浪費情況,是容易被忽略的隱藏問題。
這有點像我們要去一個地形復(fù)雜、風(fēng)景優(yōu)美的陌生城市旅游,提前按照攻略買好了各種機酒門票,但實際行程卻總被意外情況拖慢,無法高效地推進,導(dǎo)致很多資源都被浪費掉了。
企業(yè)做大模型也是如此。大模型開發(fā),涉及一個相當(dāng)漫長且復(fù)雜的產(chǎn)業(yè)鏈,每個環(huán)節(jié)對于企業(yè)用戶來說,都有相對陌生的地方,難以將稀缺昂貴的算力發(fā)揮出最大價值。
企業(yè)能否落地大模型的關(guān)鍵,就在于是否能夠?qū)⒉煌h(huán)節(jié)的技術(shù)、產(chǎn)品整合起來,構(gòu)筑一體化的解決方案。怎么實現(xiàn)呢?
腦極體曾報道過,相比單純售賣AI服務(wù)和API的商業(yè)模式,開箱即用的大模型一體機,能夠縮短部署周期、深度結(jié)合場景、降低落地門檻,是更符合當(dāng)下國內(nèi)大模型產(chǎn)業(yè)現(xiàn)狀的一種選擇,解決企業(yè)在AI落地過程中的最后一公里問題。
最近,我們關(guān)注到潞晨科技也推出了訓(xùn)推一體機,在集成高性能硬件的基礎(chǔ)上,還集成了Colossal-AI加速框架,支持多種微調(diào)fine-tune方式,幫助企業(yè)更輕松地實現(xiàn)AI技術(shù)的深度融合和業(yè)務(wù)創(chuàng)新。
我想,如果開篇中那位CIO更早認(rèn)識了這款產(chǎn)品,肯定不會因軟硬件成本而對大模型望而卻步,可以放心大膽地踏上AI創(chuàng)新之旅。
本文就以潞晨訓(xùn)推一體機為例,聊聊一體機如何將遠方未知的大模型技術(shù),變成企業(yè)身邊的AI風(fēng)景,又如何打磨好“一條龍式”的一站式AI解決方案。
散裝的大模型,在跋涉中折騰的企業(yè)
提到互聯(lián)網(wǎng),我們會想到電商、直播、手機游戲、社交媒體等豐富多彩的應(yīng)用,而不是光纖、網(wǎng)關(guān)、路由器這些底層設(shè)施。但觀察今天的企業(yè),提到大模型,第一時間想到的依然是算卡、API、tokens這些詞,而不是適配業(yè)務(wù)的AI應(yīng)用。盡管企業(yè)迫切希望運用大模型來加速業(yè)務(wù)創(chuàng)新,但在實際操作中卻可能面臨各種各樣的問題。
大模型訓(xùn)練、推理、部署的一系列環(huán)節(jié),都是“散裝”的,不成體系。企業(yè)想用業(yè)務(wù)數(shù)據(jù)做專屬大模型,得一山一水地跋涉,不僅效率低,還會在選型、適配、兼容、迭代等各個階段反復(fù)折騰,走很多彎路,吃不少悶虧。
舉個例子,今天,高端AI算力依然是中小微企業(yè)難以搞定的珍稀資源,好不容易搞來了算卡,一個模型在TensorFlowPyTorch上跑一次好幾天,驗證一次好幾天,發(fā)現(xiàn)問題迭代調(diào)試,流程再來一遍,眼看著友商已經(jīng)用上了AI,只能干著急。這種進度,顯然是追求競爭效率和創(chuàng)新速度的企業(yè)所難以接受的。
所以目前這個階段,大量企業(yè)都不希望“散裝”亂折騰,大模型致用,需要一條龍解決方案,即軟硬件緊耦合的大模型一體機。
目前,有許多國內(nèi)頭部AI廠商和ICT服務(wù)商都推出大模型一體機。為什么我們會關(guān)注到潞晨科技的訓(xùn)推一體機呢?
企業(yè)做大模型,“散裝自由行”有些昂貴和繁瑣,潞晨訓(xùn)推一體機的深度優(yōu)化與打磨,帶來了“訓(xùn)推一條龍”路線圖,在企業(yè)和大模型之間架起了一條效率高速。奔跑在潞晨訓(xùn)推一體機上的企業(yè)大模型之旅,能看到怎樣的風(fēng)景?
第一道風(fēng)景:訓(xùn)推協(xié)同的澎湃算力,助推企業(yè)創(chuàng)新
做大模型,跟旅游一樣,最掃興的情況就是目的地還沒到,隊友已經(jīng)走不動了。大模型訓(xùn)練中,因硬件性能不足、聯(lián)接故障而中斷,會帶來時間成本和機會成本的損失。
高性能硬件的澎湃算力供給,是企業(yè)用好大模型的前提條件,也是潞晨訓(xùn)推一體機帶給企業(yè)的第一道風(fēng)景線。
目前,NVIDIA GPU是AI芯片 “一哥”,在AI訓(xùn)練領(lǐng)域一家獨大,幾乎無敵手。潞晨訓(xùn)推一體機,采用英偉達H20作為底層硬件,每臺一體機配有8張H20卡,每卡有高達96GB的顯存,在單臺設(shè)備上即可完成 32B Qwen1.5 模型的全參數(shù)微調(diào),更可支持單卡 34B Yi1.5模型的推理。
H20采用Hopper架構(gòu),卡間互聯(lián)速度達到了驚人的900GB/s,整機配備4個400GB/s的IB網(wǎng)口,無論是多卡互聯(lián)還是多機互聯(lián),都有極高的效率。這對于需要大規(guī)模并行計算和協(xié)同工作的AI任務(wù)尤為重要,可以減少等待時間,提高開發(fā)效率。
參數(shù)大代表了硬件的“發(fā)動機”強,還需要結(jié)合框架這一“動力引擎”,壓榨出硬件的最優(yōu)性能表現(xiàn)。與硬件適配度更高的框架,協(xié)同更高效,可以帶來更高的訓(xùn)練推理效率。比如,潞晨科技就為這套硬件量身定做了極致優(yōu)化的訓(xùn)推加速方案。
使用Colossal-AI優(yōu)化,在8卡規(guī)模下的上機實測中,平均每卡算力相較原生速度提升21%,大幅度提高效率。微調(diào)Qwen 7B的大模型,僅需半天,即可完成1B數(shù)據(jù)的學(xué)習(xí)與迭代。
總結(jié)一下,潞晨訓(xùn)推一體機性能領(lǐng)先、軟硬協(xié)同、訓(xùn)推一體的緊耦合架構(gòu),降低了使用大模型的門檻和成本。企業(yè)可以減少人力和物力的投入,“輕裝上陣”踏上業(yè)務(wù)創(chuàng)新之旅,探索代表未來的智能世界。
第二道風(fēng)景:內(nèi)置軟件,帶來轉(zhuǎn)型松弛感
算力作為動力,而模型算法才是業(yè)務(wù)價值和競爭力的創(chuàng)造者。企業(yè)探索AI,既要選擇先進的基礎(chǔ)模型,來確保高效、準(zhǔn)確的預(yù)測和決策能力,又要將模型與業(yè)務(wù)深度結(jié)合,確保開發(fā)出來的AI產(chǎn)品能夠滿足業(yè)務(wù)邏輯和需求,為企業(yè)帶來真正的商業(yè)價值。
那么問題來了,如何獲得更適合企業(yè)業(yè)務(wù)需求的先進模型,并輕松上手?
潞晨訓(xùn)推一體機的“一條龍”路線圖,在模型層、平臺層、應(yīng)用層,都內(nèi)置了定制的AI軟件,方便使用。
模型層:潞晨訓(xùn)推一體機集成了眾多精選的優(yōu)質(zhì)開源模型,例如LLaMA3、Mixtral、Qwen等,方便企業(yè)用戶調(diào)用,快速體驗到不同開源模型的能力。同時,借助潞晨訓(xùn)推框架的優(yōu)化,上述模型在一體機上的訓(xùn)練推理效率,會比原生硬件更高。
平臺層:平臺層的軟件工具下接算力、上接應(yīng)用,讓大模型從底層算力到上層應(yīng)用,實現(xiàn)順暢運行和高效協(xié)作。潞晨訓(xùn)推一體機搭載的訓(xùn)推軟件Colossal LLM Studio,配備了直觀易用的UI界面,讓非技術(shù)背景的用戶也能輕松操作,通過低代碼、可視化的方式進行模型訓(xùn)練微調(diào),企業(yè)不再需要付費外包,一個軟件就相當(dāng)于一支大模型訓(xùn)練團隊。
應(yīng)用層:開箱即用的AI應(yīng)用,實用性強,可以將大模型的能力快速集成到企業(yè)現(xiàn)有的業(yè)務(wù)系統(tǒng)或應(yīng)用中,帶來實際的價值和效益。通過潞晨訓(xùn)推一體機,企業(yè)用戶用到潞晨科技推出的Colossal Reader,一款專為提升文檔理解效率而設(shè)計的AI智能助手。一方面,經(jīng)過精細調(diào)整和優(yōu)化的 RAG 流程,具備長文本能力,支持深度解析復(fù)雜文檔,如財務(wù)報表和法律文件,幫助用戶迅速掌握關(guān)鍵信息,實現(xiàn)高效辦公。同時,基于一體機的私有化部署既保證了長期使用的穩(wěn)定,又保障了企業(yè)內(nèi)部文檔等的數(shù)據(jù)安全。
Sora開啟了文生視頻的新階段,展現(xiàn)出AIGC在影視制作、游戲開發(fā)和廣告創(chuàng)意等方面的諸多可能。企業(yè)想在業(yè)務(wù)中引入類Sora能力,潞晨訓(xùn)推一體機上,免費提供Open-Sora開源版本的本地推理部署。
潞晨科技團隊傾力打造的文生視頻大模型Open-Sora,自3月19日登上GitHub Trending榜,受到大量開發(fā)者關(guān)注,星數(shù)持續(xù)增長,熱度僅次于Grok-1。其中LambdaLabs團隊基于Open-Sora模型進行微調(diào)打造了一個具有獨特藝術(shù)風(fēng)格的樂高動畫世界,展現(xiàn)了潞晨科技的技術(shù)領(lǐng)先性和實力。而這一優(yōu)秀模型,潞晨訓(xùn)推一體機的用戶可以直接在本地部署,基于高配硬件,結(jié)合企業(yè)的應(yīng)用場景,將文生視頻能力落地在自身業(yè)務(wù)中。
從模型層、平臺層、應(yīng)用層,潞晨訓(xùn)推一體機完整的AI軟件體系支持,讓企業(yè)不必有“FOMO(害怕錯過)情緒”,快速上手大模型及應(yīng)用。簡單易用的軟件風(fēng)景,為企業(yè)探索大模型營造了難得的松弛感。
第三道風(fēng)景:全周期服務(wù),一路護航
有人會問,數(shù)據(jù)預(yù)處理、特征工程、模型訓(xùn)練、部署與監(jiān)控等一系列復(fù)雜的工程化任務(wù),帶來了大量挑戰(zhàn),企業(yè)是不是要構(gòu)建一支既懂技術(shù)又懂業(yè)務(wù)的團隊?如果吸引不到這樣的人才怎么辦?
讓企業(yè)聚焦在業(yè)務(wù)創(chuàng)新上,需要相應(yīng)的運維服務(wù)及售后服務(wù),免除客戶的后顧之憂。
選擇潞晨訓(xùn)推一體機的企業(yè)客戶,將獲得潞晨科技的技術(shù)團隊提供為期一周的免費專業(yè)咨詢服務(wù),解決數(shù)據(jù)處理和模型選擇等技術(shù)問題,以及最高級別的服務(wù)優(yōu)先權(quán),并將優(yōu)先支持其他付費服務(wù)。
我們知道,任何一個產(chǎn)業(yè)和企業(yè)都有自己的獨特性,即使擁有強大的通用性AI軟硬件,也容易施展不開手腳。讓大模型與行業(yè)特征、企業(yè)周期、業(yè)務(wù)場景相結(jié)合,是最難的一道關(guān)卡,也是潞晨科技希望通過服務(wù)加持助力企業(yè)消除與技術(shù)的隔閡。
獨行快、眾行遠,去陌生的技術(shù)領(lǐng)域探索未知的景色,這個過程中,企業(yè)和潞晨科技的攜手,讓AI風(fēng)景可以長長久久地綿延下去。
一條龍深度游:“導(dǎo)游”潞晨的獨特AI打開方式
算力不折騰,簡單用,放心用,輕松用,潞晨訓(xùn)推一體機改變了大模型開發(fā)的“散裝”流程,用“訓(xùn)推一條龍”,推動大模型深入企業(yè)業(yè)務(wù),加速落地。
從中,我們可以看到潞晨科技帶來的企業(yè)智能打開方式:
1.高集成。企業(yè)能夠在一個平臺上完成從模型訓(xùn)練到部署的全過程,無需在多個系統(tǒng)或工具之間切換,大大提高了工作效率。
2.質(zhì)價比。大模型,可以看做企業(yè)智能的“消費升級”,有望帶來更高的智慧水平。訓(xùn)推一體機,提高算效,讓大模型變得物美價廉??傮w來看,企業(yè)智能的質(zhì)價比正在提高,成為新的競爭力。
3.廣覆蓋。訓(xùn)推一體機降低了大模型應(yīng)用門檻,意味著更多行業(yè)和企業(yè),尤其是缺乏自建智算中心能力的中小企業(yè)和傳統(tǒng)行業(yè),可以在低門檻、輕成本的前提下,快速進入智能階段,提高AI的滲透率和廣覆蓋。
作為企業(yè)智能的“一條龍導(dǎo)游”,潞晨訓(xùn)推一體機,讓大模型從大廠實驗室和論壇峰會的神壇中走下來,進入企業(yè)觸手可及的范圍之內(nèi),變成水、電、網(wǎng)絡(luò)一樣的必需品和常規(guī)消費品。
撬動企業(yè)智能的龐大市場,潞晨訓(xùn)推一體機正在兌現(xiàn)大模型的真正利好。欲知詳情,可移步潞晨科技公眾號。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 騰訊隱身,令人生畏
- 迪卡儂的價格、lululemon的品質(zhì),平替正成為年輕消費者的心頭好
- 三場與AI有關(guān)的死亡
- 100億美元史上最大融資的背后,國內(nèi)外巨頭齊瞄準(zhǔn)Data+AI
- 有一種羨慕叫“別人家的年終獎”:京東采銷平均23薪,全網(wǎng)熱議“人的價值”
- 行業(yè)首個“人機大戰(zhàn)”對壘!AI翻譯已媲美人工
- 蘋果開啟年終大促,降價1200元,被國產(chǎn)手機嚇怕了?
- 1999 元起,OPPO A5 Pro 超防水、超抗摔、超耐用
- 長三角,如何把數(shù)據(jù)要素變成新長江?
- 大模型,在內(nèi)卷中尋找出口
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。