極客網(wǎng)·極客觀察(朱飛) 6月16日,在人工智能框架生態(tài)峰會(huì)2023上,“紫東.太初”全模態(tài)大模型重磅發(fā)布,給當(dāng)前“百模大戰(zhàn)”的局面再添一把火。
資料顯示,該大模型是在千億參數(shù)多模態(tài)大模型“紫東.太初”1.0基礎(chǔ)上升級(jí)打造的2.0版本,在語音、圖像和文本三模態(tài)的基礎(chǔ)上,加入了視頻、信號(hào)、3D點(diǎn)云等模態(tài)數(shù)據(jù),研究突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù),具備全模態(tài)理解能力、生成能力和關(guān)聯(lián)能力。
也就是說,不同于以ChatGPT背后的GPT為代表的大型語言模型(LLM),“紫東.太初”2.0實(shí)現(xiàn)了更全的模態(tài)覆蓋,不僅能夠更加擬人,也更能夠模擬機(jī)器人,得以在更多場(chǎng)景實(shí)現(xiàn)更類人的智能。
毋庸諱言,實(shí)現(xiàn)通用人工智能(AGI)一直是全球AI業(yè)界的終極目標(biāo)。“紫東.太初”的迭代升級(jí),實(shí)現(xiàn)了從“一專一能”到“多專多能”再到“全專全能”的持續(xù)進(jìn)化,踏上了通向AGI的快車道。
立足多模態(tài),全模態(tài)進(jìn)化
人類在認(rèn)知世界時(shí),往往同時(shí)涉及語音、圖像、文字等信息。有研究顯示,人類獲取信息有70%靠視覺,20%靠聽覺,10%靠觸覺或其他方式。面向萬物互聯(lián)的智能世界,機(jī)器將是智能的主角,這意味著機(jī)器設(shè)備想要實(shí)現(xiàn)更高水平的智能,就需要像人一樣發(fā)展貫通圖、文、音等多模態(tài)的大模型能力。
有鑒于此,“紫東.太初”自出生開始就立足多模態(tài)發(fā)展。2019年起,中國科學(xué)院自動(dòng)化研究所(以下簡稱“自動(dòng)化所”)即堅(jiān)持以圖、音、文多模態(tài)技術(shù)為核心,確立多模態(tài)大模型布局。通過整合所內(nèi)圖像、文本、語音等研究方向的優(yōu)勢(shì)資源開展攻關(guān),自動(dòng)化所于2021年9月成功打造“紫東太初”1.0多模態(tài)大模型,立志助推人工智能從“一專一能”邁向“多專多能”。
隨著探索的深入,自動(dòng)化所發(fā)現(xiàn)邁入數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)的范疇不斷拓寬,不僅包含人類自身產(chǎn)生的語音、圖像、文字等數(shù)據(jù),還有機(jī)器產(chǎn)生的大量結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù),包括視頻、信號(hào)、3D點(diǎn)云等,大模型需要支持更多的模態(tài),向全模態(tài)持續(xù)進(jìn)化。
以3D點(diǎn)云為例,隨著自動(dòng)駕駛技術(shù)發(fā)展駛?cè)肟燔嚨溃?D傳感器的使用正在變得越來越普遍,激光雷達(dá)、毫米波雷達(dá)、深度相機(jī)、3D掃描儀等3D傳感器可以從現(xiàn)實(shí)世界中獲取物體和環(huán)境的幾何、形狀和比例信息,幫助AI更好地理解現(xiàn)實(shí)環(huán)境。相應(yīng)地,AI大模型需要更好地感知、認(rèn)知和處理這些三維信息,才能幫助汽車實(shí)現(xiàn)更高階的自動(dòng)駕駛能力。
“紫東.太初”2.0正為此而生,其從技術(shù)架構(gòu)上實(shí)現(xiàn)了結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的全模態(tài)開放式接入,突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù),在應(yīng)用場(chǎng)景上支持多輪問答、文本創(chuàng)作、圖像生成、3D理解、信號(hào)分析等跨模態(tài)任務(wù),并具備全模態(tài)智能化標(biāo)注能力,可實(shí)現(xiàn)對(duì)未知目標(biāo)的自動(dòng)發(fā)現(xiàn)。
全棧國產(chǎn)化,打造AGI底座
值得一提的是,在架構(gòu)理念上與GPT天生不同的“紫東.太初”,在技術(shù)也采用了全棧國產(chǎn)化的基礎(chǔ)軟硬件,著力打造全棧國產(chǎn)化的通用人工智能底座,全面滿足數(shù)智化轉(zhuǎn)型升級(jí)浪潮下各行各業(yè)對(duì)安全合規(guī)和數(shù)據(jù)隱私等方面的嚴(yán)格要求。
具體而言,“紫東.太初”2.0以自動(dòng)化所自研算法為核心,以昇騰AI硬件及昇思MindSpore AI框架為基礎(chǔ),依托武漢人工智能計(jì)算中心算力支持,在算法、算力,以及背后關(guān)鍵的AI框架基礎(chǔ)軟件設(shè)施等全維度實(shí)現(xiàn)了全棧國產(chǎn)化。
眾所周知,ChatGPT及其背后的GPT大模型,已經(jīng)先后遭遇歐洲、韓國等國家和地區(qū)的不分政府及企業(yè)禁用,AI大模型安全問題已經(jīng)上升到新的高度?!白蠔|.太初”推動(dòng)國產(chǎn)基礎(chǔ)軟硬件與大模型技術(shù)的適配,協(xié)同構(gòu)建我國通用人工智能自主可控發(fā)展生態(tài),意義不言而喻!
這一點(diǎn)在業(yè)內(nèi)已經(jīng)形成高度共識(shí),就在本次人工智能框架生態(tài)峰會(huì)2023期間,18家AI頂級(jí)企業(yè)、學(xué)會(huì)、高校及科研院所共同發(fā)布《共建人工智能框架生態(tài)倡議》,通過政產(chǎn)學(xué)研用的共同努力,支撐中國人工智能框架生態(tài)走向新高度,推進(jìn)中國人工智能產(chǎn)業(yè)新發(fā)展。
與此同時(shí),上海人工智能研究院、上海市閔行區(qū)政府、臨港集團(tuán)、昇思開源社區(qū)聯(lián)合啟動(dòng)上海昇思AI框架&大模型創(chuàng)新中心,首批吸引22家單位入駐。該中心將攜手產(chǎn)業(yè)伙伴基于昇思MindSpore AI框架,支持全國范圍的AI技術(shù)企業(yè)、高校與科研院所孵化大模型、科學(xué)智能技術(shù)研究,進(jìn)而賦能企業(yè),推動(dòng)產(chǎn)業(yè)集聚。
毋庸諱言,人工智能框架作為AI根技術(shù),可以為開發(fā)者提供強(qiáng)大的工具和資源,在包括大模型在內(nèi)的AI創(chuàng)新背后扮演著至關(guān)重要的角色。昇思MindSpore作為源自中國、全球領(lǐng)先的人工智能框架,目前各項(xiàng)核心指標(biāo)在所有AI框架中已排名中國第一、全球第二,有力推動(dòng)著AI技術(shù)的發(fā)展和創(chuàng)新。
開放服務(wù)平臺(tái),賦能產(chǎn)業(yè)應(yīng)用
業(yè)內(nèi)人士都知道,大模型的訓(xùn)練十分昂貴。尤其是像“紫東.太初”這樣的千億級(jí)參數(shù)的全模態(tài)基礎(chǔ)大模型,訓(xùn)練成本足以讓很多企業(yè)望而止步。正如中科院自動(dòng)化所“紫東太初”大模型研究中心常務(wù)副主任、武漢人工智能研究院院長王金橋所說,“底座大模型成本很高、技術(shù)門檻也高,訓(xùn)練一次基本需要上千萬的電力費(fèi)用?!币虼巳绾卫煤眠@樣的底座大模型,是AI產(chǎn)業(yè)應(yīng)用的重中之重。
在這方面“紫東.太初”也有獨(dú)到之處。通過成立多模態(tài)人工智能產(chǎn)業(yè)聯(lián)合體,打造“紫東.太初”人工智能開放服務(wù)平臺(tái)等一系列舉措,“紫東.太初”構(gòu)建了“平臺(tái)+生態(tài)”的發(fā)展模式,形成了多元主體共同參與“紫東.太初”研究實(shí)踐的協(xié)同機(jī)制,以此提高整個(gè)產(chǎn)業(yè)生態(tài)的創(chuàng)新效率,大幅縮短從AI模型研發(fā)到AI應(yīng)用落地的時(shí)間周期,減少因重復(fù)開發(fā)帶來的資源浪費(fèi)。
此番隨著“紫東.太初”2.0的發(fā)布,基于“紫東.太初”2.0的最新全棧國產(chǎn)化、低代碼一站式開發(fā)的“紫東.太初”開放服務(wù)平臺(tái)已上線。該平臺(tái)支持公有云、私有云一鍵部署,能夠使能行業(yè)大模型高效率開發(fā),面向更多領(lǐng)域發(fā)揮賦能價(jià)值,加速通用人工智能的實(shí)現(xiàn)。
王金橋指出,未來底座大模型的數(shù)量不會(huì)很多,更多的是基于底座模型、圍繞行業(yè)的解決方案。企業(yè)可通過大模型和行業(yè)場(chǎng)景深度的結(jié)合,生產(chǎn)和優(yōu)化自己的模型,實(shí)現(xiàn)低代碼的開發(fā),讓大模型更高效地利用。
資料顯示,目前數(shù)十家企業(yè)基于“紫東.太初”底座大模型,深度結(jié)合自身的行業(yè)知識(shí)(Know-How),已在神經(jīng)外科手術(shù)導(dǎo)航、短視頻內(nèi)容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領(lǐng)域開始了一系列引領(lǐng)性、示范性的應(yīng)用。
寫在最后:
綜上,在“百模大戰(zhàn)”的當(dāng)下,“紫東.太初” 從1.0到2.0,從多模態(tài)向全模態(tài)進(jìn)化,基于全棧國產(chǎn)化技術(shù)打造AGI底座,通過開放服務(wù)平臺(tái)賦能產(chǎn)業(yè)應(yīng)用,走出了一條特色的大模型發(fā)展之道。
這種全模態(tài)大模型通過進(jìn)一步打通感知、認(rèn)知乃至決策的交互屏障,使人工智能進(jìn)一步感知世界、認(rèn)知世界,從而延伸出更加強(qiáng)大的通用能力,實(shí)現(xiàn)更類人的智能,無疑將加速AI產(chǎn)業(yè)落地,加速邁向AGI時(shí)代!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )