商湯何以跑出大模型落地的「逃逸速度」?

當(dāng)商湯董事長(zhǎng)兼CEO徐立在一面頗具中國(guó)風(fēng)的背景面前發(fā)布全新升級(jí)的「日日新SenseNova 5.0」大模型體系,預(yù)示著商湯成為了首家實(shí)現(xiàn)了云端邊全棧布局的企業(yè),而正是在這樣一面背景之上,赫然寫著「AI大模型時(shí)代 II」。

于是,人們不禁會(huì)問,商湯何以跑出了大模型落地的「逃逸速度」,實(shí)現(xiàn)了大模型性能超越GPT-4 Turbo的呢?

如果我們對(duì)商湯日日新5.0大模型以及商湯背后強(qiáng)大的算力支撐,有一個(gè)全面的了解,便不會(huì)對(duì)此有任何的驚訝。

正如徐立所言,「商湯在尺度定律的指導(dǎo)下,會(huì)持續(xù)探索大模型能力的KRE三層架構(gòu)(知識(shí)-推理-執(zhí)行),不斷突破大模型能力邊界?!挂源藶榛c(diǎn),我們或許能夠找到商湯跑出大模型落地的「逃逸速度」的內(nèi)在邏輯。

商湯日日新5.0性能全面超越GPT-4 Turbo

自去年4月正式上線以來,商湯日日新大模型系統(tǒng)已經(jīng)完成了五大版本的迭代升級(jí)。而此次升級(jí),主要是基于超過10TB tokens訓(xùn)練、覆蓋大量合成數(shù)據(jù),采用混合專家架構(gòu),推理時(shí)上下文窗口可以有效到 200K 左右,以及聚集增強(qiáng)了知識(shí)、數(shù)學(xué)、推理及代碼能力,全面對(duì)標(biāo) GPT-4 Turbo,主流客觀評(píng)測(cè)上達(dá)到或超越 GPT-4 Turbo。

得益于這些更新,日日新5.0的「文科能力」、「理科能力」以及多模態(tài)能力,全面得到了一次質(zhì)的提升。

以日日新5.0和GPT-4回答趣味推理問題為例:“媽媽給圓圓沖了一杯咖啡,圓圓喝了半杯后,將它加滿水,然后她又喝了半杯后,再加滿水,最后全部喝完。問圓圓喝的咖啡多,還是水多?”,日日新5.0回答正確,GPT-4回答錯(cuò)誤。

日日新5.0的這些能力的提升,可以在中文語(yǔ)境下,更好地為用戶進(jìn)行總結(jié)和問答,助力教育、內(nèi)容等行業(yè)場(chǎng)景應(yīng)用的落地。

同時(shí),日日新5.0的數(shù)理能力、代碼能力以及推理能力的大幅度提升,同樣可以為金融、數(shù)據(jù)分析等場(chǎng)景的應(yīng)用,提供有力支撐。

除了「文科能力」、「理科能力」之外,日日新5.0的多模態(tài)能力,同樣表現(xiàn)優(yōu)異。它不僅支持高清長(zhǎng)圖的解析和理解以及文生圖交互式生成,還可以實(shí)現(xiàn)復(fù)雜的跨文檔知識(shí)抽取及總結(jié)問答展示,還具備豐富的多模態(tài)交互能力。

商湯多模態(tài)大模型的圖文感知能力達(dá)到全球領(lǐng)先水平,在多模態(tài)大模型權(quán)威綜合基準(zhǔn)測(cè)試MMBench中綜合得分排名首位,在多個(gè)知名多模態(tài)榜單MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得領(lǐng)先成績(jī)。

可見,商湯日日新5.0在「文科能力」、「理科能力」以及多模態(tài)能力上的突出表現(xiàn),為其更好地助力大模型場(chǎng)景落地打下了堅(jiān)實(shí)的基礎(chǔ)。它不僅在主觀評(píng)測(cè)上全面達(dá)到或者超越了GPT-4 Turbo,更加可以在中文環(huán)境下助力更多本土企業(yè)積極擁抱大模型時(shí)代帶來的紅利。

因此,如果我們要尋找商湯日日新5.0跑出大模型落地的「逃逸速度」的內(nèi)在邏輯的話,文理兼修的全面發(fā)展以及多模態(tài)交互的卓越表現(xiàn),無疑是最值得我們?nèi)リP(guān)注的一個(gè)重要方面。

云端邊全棧布局,商湯打造大模型產(chǎn)品矩陣

隨著AI時(shí)代的來臨,特別是當(dāng)中心化算力需求向端側(cè)擴(kuò)展以及企業(yè)級(jí)邊側(cè)AI需求的不斷增加,只有實(shí)現(xiàn)云、端、邊的高效協(xié)同,才能真正助力大模型的落地。

正是基于這樣一種認(rèn)知,商湯在業(yè)內(nèi)首次推出「云、端、邊」全棧大模型產(chǎn)品矩陣,其中包括應(yīng)用于終端設(shè)備的「商湯端側(cè)大模型」,以及面向金融、代碼、醫(yī)療、政務(wù)等多個(gè)領(lǐng)域的邊緣產(chǎn)品「商湯企業(yè)級(jí)大模型一體機(jī)」。

據(jù)悉,商湯日日新·端側(cè)大語(yǔ)言模型的推理速度達(dá)到了業(yè)內(nèi)最快,可在中端平臺(tái)實(shí)現(xiàn)18.3字/s的平均生成速度,旗艦平臺(tái)更是達(dá)到了78.3字/s。

擴(kuò)散模型同樣可在端側(cè)實(shí)現(xiàn)業(yè)內(nèi)最快的推理速度,端側(cè)LDM-AI擴(kuò)圖技術(shù)在某主流平臺(tái)上,推理速度小于1.5秒,比友商云端app快10倍,支持輸出1200萬像素及以上的高清圖片,支持在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能。

值得一提的是,為了滿足金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的AI應(yīng)用需求,商湯正式推出企業(yè)級(jí)大模型一體機(jī),可同時(shí)支持企業(yè)級(jí)千億模型加速和知識(shí)檢索硬件加速,實(shí)現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負(fù)載50%。

得益于商湯在云、端、邊的全棧布局,商湯可以讓AI大模型在更多的企業(yè)落地,讓每一個(gè)企業(yè)的需求都能夠得到最大限度的滿足。

正因如此,

在辦公領(lǐng)域,商湯基于“日日新”大模型的卓越代碼生成及工具調(diào)用能力,助力WPS 365打造更高效釋放場(chǎng)景能力的辦公新質(zhì)生產(chǎn)力平臺(tái),為企業(yè)構(gòu)建專屬的“企業(yè)大腦”。

在金融領(lǐng)域,海通證券與商湯科技聯(lián)合發(fā)布金融行業(yè)多模態(tài)全棧式大模型,雙方在智能客服、合規(guī)風(fēng)控、代碼輔助、展業(yè)辦公助手等領(lǐng)域助推業(yè)務(wù)落地,并共研智能投顧、輿情監(jiān)控等行業(yè)前沿場(chǎng)景,打通證券行業(yè)大模型落地的全棧式能力。

在出行領(lǐng)域,基于商湯端云大模型解決方案,小米小愛同學(xué)為車主提供智能化交互體驗(yàn)。

可以預(yù)見的是,隨著商湯日日新5.0的云、端、邊全棧布局的不斷深入,我們還將會(huì)看到更多的企業(yè)在商湯的助力之下實(shí)現(xiàn)AI應(yīng)用的快速落地,不斷地去擁抱AI時(shí)代來臨的紅利。

算力加持,商湯找到遵循「尺度定律」的路徑

無論是日日新5.0的全面升級(jí),亦或是商湯基于云端邊的全棧布局,其實(shí)都離不開商湯打造的算力中心的加持與支撐。

正如商湯董事長(zhǎng)兼CEO徐立所說的那樣,商湯持續(xù)尋求最有數(shù)據(jù)配比并建立數(shù)據(jù)質(zhì)量評(píng)價(jià)體系,推動(dòng)自身大模型研發(fā)的同時(shí),也為行業(yè)伙伴提供大模型訓(xùn)練、微調(diào)、部署和各類生成式AI的能力及服務(wù)。

在本次技術(shù)交流日最后環(huán)節(jié),商湯科技董事長(zhǎng)兼CEO徐立還帶來了三段完全由大模型生成的視頻,并強(qiáng)調(diào)文生視頻平臺(tái)對(duì)于人物、動(dòng)作和場(chǎng)景的可控性。

商湯科技在文生視頻平臺(tái)方面也取得了技術(shù)突破,未來,通過輸入一段文字或一個(gè)完整的描述,就可以生成一段視頻,而且人物的服飾、發(fā)型、場(chǎng)景都可以根據(jù)預(yù)先設(shè)定,保持視頻內(nèi)容的連貫性和一致性。

不難看出,商湯的文生視頻,已經(jīng)在路上了。

可以說,商湯找到了遵循「尺度定律」的路徑。

正是基于這樣一個(gè)全新的路徑,商湯才可以不斷地實(shí)現(xiàn)日日新5.0的升級(jí),才可以打造了云、端、邊的全棧布局,才可以滿足越來越多的企業(yè)對(duì)于AI的新需求。

因此,如果我們要尋找商湯跑出大模型落地的「逃逸速度」的內(nèi)在原因的話,商湯智能算力中心在背后的強(qiáng)大加持,無疑是最值得我們?nèi)リP(guān)注的另外一個(gè)重要方面。

結(jié)語(yǔ)

從日日新5.0的知識(shí)、數(shù)學(xué)、推理及代碼能力,全面對(duì)標(biāo) GPT-4 Turbo,主流客觀評(píng)測(cè)上達(dá)到或超越 GPT-4 Turbo,到業(yè)內(nèi)首次實(shí)現(xiàn)云端邊全棧布局,再到商湯對(duì)于合作伙伴的深度賦能,乃至是商湯對(duì)于AGI時(shí)代的全面擁抱,我們都可以看出,商湯著實(shí)跑出了大模型落地的「逃逸速度」。

當(dāng)商湯日日新5.0的性能超越 GPT-4 Turbo,當(dāng)商湯比 GPT-4 Turbo更懂中國(guó)的消費(fèi)者和企業(yè),商湯無疑可以在“尺度定律”路徑逐漸清晰的時(shí)刻,實(shí)現(xiàn)一次彎道超車,助力AI在更多場(chǎng)景落地,真正實(shí)現(xiàn)算法、算力、數(shù)據(jù)、應(yīng)用和場(chǎng)景的全面協(xié)同。

—完—

作者:孟永輝,資深撰稿人,專欄作家,行業(yè)觀察家,知名KOL。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-04-25
商湯何以跑出大模型落地的「逃逸速度」?
商湯何以跑出大模型落地的「逃逸速度」?

長(zhǎng)按掃碼 閱讀全文