123,123,123

極客網(wǎng)·極客觀察（朱飛） 6月16日，在人工智能框架生態(tài)峰會(huì)2023上，“紫東.太初”全模態(tài)大模型重磅發(fā)布，給當(dāng)前“百模大戰(zhàn)”的局面再添一把火。

資料顯示，該大模型是在千億參數(shù)多模態(tài)大模型“紫東.太初”1.0基礎(chǔ)上升級(jí)打造的2.0版本，在語音、圖像和文本三模態(tài)的基礎(chǔ)上，加入了視頻、信號(hào)、3D點(diǎn)云等模態(tài)數(shù)據(jù)，研究突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù)，具備全模態(tài)理解能力、生成能力和關(guān)聯(lián)能力。

也就是說，不同于以ChatGPT背后的GPT為代表的大型語言模型（LLM），“紫東.太初”2.0實(shí)現(xiàn)了更全的模態(tài)覆蓋，不僅能夠更加擬人，也更能夠模擬機(jī)器人，得以在更多場(chǎng)景實(shí)現(xiàn)更類人的智能。

毋庸諱言，實(shí)現(xiàn)通用人工智能（AGI）一直是全球AI業(yè)界的終極目標(biāo)?！白蠔|.太初”的迭代升級(jí)，實(shí)現(xiàn)了從“一專一能”到“多專多能”再到“全專全能”的持續(xù)進(jìn)化，踏上了通向AGI的快車道。

立足多模態(tài)，全模態(tài)進(jìn)化

人類在認(rèn)知世界時(shí)，往往同時(shí)涉及語音、圖像、文字等信息。有研究顯示，人類獲取信息有70%靠視覺，20%靠聽覺，10%靠觸覺或其他方式。面向萬物互聯(lián)的智能世界，機(jī)器將是智能的主角，這意味著機(jī)器設(shè)備想要實(shí)現(xiàn)更高水平的智能，就需要像人一樣發(fā)展貫通圖、文、音等多模態(tài)的大模型能力。

有鑒于此，“紫東.太初”自出生開始就立足多模態(tài)發(fā)展。2019年起，中國科學(xué)院自動(dòng)化研究所（以下簡(jiǎn)稱“自動(dòng)化所”）即堅(jiān)持以圖、音、文多模態(tài)技術(shù)為核心，確立多模態(tài)大模型布局。通過整合所內(nèi)圖像、文本、語音等研究方向的優(yōu)勢(shì)資源開展攻關(guān)，自動(dòng)化所于2021年9月成功打造“紫東太初”1.0多模態(tài)大模型，立志助推人工智能從“一專一能”邁向“多專多能”。

隨著探索的深入，自動(dòng)化所發(fā)現(xiàn)邁入數(shù)字經(jīng)濟(jì)時(shí)代，數(shù)據(jù)的范疇不斷拓寬，不僅包含人類自身產(chǎn)生的語音、圖像、文字等數(shù)據(jù)，還有機(jī)器產(chǎn)生的大量結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)，包括視頻、信號(hào)、3D點(diǎn)云等，大模型需要支持更多的模態(tài)，向全模態(tài)持續(xù)進(jìn)化。

以3D點(diǎn)云為例，隨著自動(dòng)駕駛技術(shù)發(fā)展駛?cè)肟燔嚨溃?D傳感器的使用正在變得越來越普遍，激光雷達(dá)、毫米波雷達(dá)、深度相機(jī)、3D掃描儀等3D傳感器可以從現(xiàn)實(shí)世界中獲取物體和環(huán)境的幾何、形狀和比例信息，幫助AI更好地理解現(xiàn)實(shí)環(huán)境。相應(yīng)地，AI大模型需要更好地感知、認(rèn)知和處理這些三維信息，才能幫助汽車實(shí)現(xiàn)更高階的自動(dòng)駕駛能力。

“紫東.太初”2.0正為此而生，其從技術(shù)架構(gòu)上實(shí)現(xiàn)了結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的全模態(tài)開放式接入，突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù)，在應(yīng)用場(chǎng)景上支持多輪問答、文本創(chuàng)作、圖像生成、3D理解、信號(hào)分析等跨模態(tài)任務(wù)，并具備全模態(tài)智能化標(biāo)注能力，可實(shí)現(xiàn)對(duì)未知目標(biāo)的自動(dòng)發(fā)現(xiàn)。

全棧國產(chǎn)化，打造AGI底座

值得一提的是，在架構(gòu)理念上與GPT天生不同的“紫東.太初”，在技術(shù)也采用了全棧國產(chǎn)化的基礎(chǔ)軟硬件，著力打造全棧國產(chǎn)化的通用人工智能底座，全面滿足數(shù)智化轉(zhuǎn)型升級(jí)浪潮下各行各業(yè)對(duì)安全合規(guī)和數(shù)據(jù)隱私等方面的嚴(yán)格要求。

具體而言，“紫東.太初”2.0以自動(dòng)化所自研算法為核心，以昇騰AI硬件及昇思MindSpore AI框架為基礎(chǔ)，依托武漢人工智能計(jì)算中心算力支持，在算法、算力，以及背后關(guān)鍵的AI框架基礎(chǔ)軟件設(shè)施等全維度實(shí)現(xiàn)了全棧國產(chǎn)化。

眾所周知，ChatGPT及其背后的GPT大模型，已經(jīng)先后遭遇歐洲、韓國等國家和地區(qū)的不分政府及企業(yè)禁用，AI大模型安全問題已經(jīng)上升到新的高度?！白蠔|.太初”推動(dòng)國產(chǎn)基礎(chǔ)軟硬件與大模型技術(shù)的適配，協(xié)同構(gòu)建我國通用人工智能自主可控發(fā)展生態(tài)，意義不言而喻！

這一點(diǎn)在業(yè)內(nèi)已經(jīng)形成高度共識(shí)，就在本次人工智能框架生態(tài)峰會(huì)2023期間，18家AI頂級(jí)企業(yè)、學(xué)會(huì)、高校及科研院所共同發(fā)布《共建人工智能框架生態(tài)倡議》，通過政產(chǎn)學(xué)研用的共同努力，支撐中國人工智能框架生態(tài)走向新高度，推進(jìn)中國人工智能產(chǎn)業(yè)新發(fā)展。

與此同時(shí)，上海人工智能研究院、上海市閔行區(qū)政府、臨港集團(tuán)、昇思開源社區(qū)聯(lián)合啟動(dòng)上海昇思AI框架&大模型創(chuàng)新中心，首批吸引22家單位入駐。該中心將攜手產(chǎn)業(yè)伙伴基于昇思MindSpore AI框架，支持全國范圍的AI技術(shù)企業(yè)、高校與科研院所孵化大模型、科學(xué)智能技術(shù)研究，進(jìn)而賦能企業(yè)，推動(dòng)產(chǎn)業(yè)集聚。

毋庸諱言，人工智能框架作為AI根技術(shù)，可以為開發(fā)者提供強(qiáng)大的工具和資源，在包括大模型在內(nèi)的AI創(chuàng)新背后扮演著至關(guān)重要的角色。昇思MindSpore作為源自中國、全球領(lǐng)先的人工智能框架，目前各項(xiàng)核心指標(biāo)在所有AI框架中已排名中國第一、全球第二，有力推動(dòng)著AI技術(shù)的發(fā)展和創(chuàng)新。

開放服務(wù)平臺(tái)，賦能產(chǎn)業(yè)應(yīng)用

業(yè)內(nèi)人士都知道，大模型的訓(xùn)練十分昂貴。尤其是像“紫東.太初”這樣的千億級(jí)參數(shù)的全模態(tài)基礎(chǔ)大模型，訓(xùn)練成本足以讓很多企業(yè)望而止步。正如中科院自動(dòng)化所“紫東太初”大模型研究中心常務(wù)副主任、武漢人工智能研究院院長(zhǎng)王金橋所說，“底座大模型成本很高、技術(shù)門檻也高，訓(xùn)練一次基本需要上千萬的電力費(fèi)用?！币虼巳绾卫煤眠@樣的底座大模型，是AI產(chǎn)業(yè)應(yīng)用的重中之重。

在這方面“紫東.太初”也有獨(dú)到之處。通過成立多模態(tài)人工智能產(chǎn)業(yè)聯(lián)合體，打造“紫東.太初”人工智能開放服務(wù)平臺(tái)等一系列舉措，“紫東.太初”構(gòu)建了“平臺(tái)+生態(tài)”的發(fā)展模式，形成了多元主體共同參與“紫東.太初”研究實(shí)踐的協(xié)同機(jī)制，以此提高整個(gè)產(chǎn)業(yè)生態(tài)的創(chuàng)新效率，大幅縮短從AI模型研發(fā)到AI應(yīng)用落地的時(shí)間周期，減少因重復(fù)開發(fā)帶來的資源浪費(fèi)。

此番隨著“紫東.太初”2.0的發(fā)布，基于“紫東.太初”2.0的最新全棧國產(chǎn)化、低代碼一站式開發(fā)的“紫東.太初”開放服務(wù)平臺(tái)已上線。該平臺(tái)支持公有云、私有云一鍵部署，能夠使能行業(yè)大模型高效率開發(fā)，面向更多領(lǐng)域發(fā)揮賦能價(jià)值，加速通用人工智能的實(shí)現(xiàn)。

王金橋指出，未來底座大模型的數(shù)量不會(huì)很多，更多的是基于底座模型、圍繞行業(yè)的解決方案。企業(yè)可通過大模型和行業(yè)場(chǎng)景深度的結(jié)合，生產(chǎn)和優(yōu)化自己的模型，實(shí)現(xiàn)低代碼的開發(fā)，讓大模型更高效地利用。

資料顯示，目前數(shù)十家企業(yè)基于“紫東.太初”底座大模型，深度結(jié)合自身的行業(yè)知識(shí)（Know-How），已在神經(jīng)外科手術(shù)導(dǎo)航、短視頻內(nèi)容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領(lǐng)域開始了一系列引領(lǐng)性、示范性的應(yīng)用。

寫在最后：

綜上，在“百模大戰(zhàn)”的當(dāng)下，“紫東.太初” 從1.0到2.0，從多模態(tài)向全模態(tài)進(jìn)化，基于全棧國產(chǎn)化技術(shù)打造AGI底座，通過開放服務(wù)平臺(tái)賦能產(chǎn)業(yè)應(yīng)用，走出了一條特色的大模型發(fā)展之道。

這種全模態(tài)大模型通過進(jìn)一步打通感知、認(rèn)知乃至決策的交互屏障，使人工智能進(jìn)一步感知世界、認(rèn)知世界，從而延伸出更加強(qiáng)大的通用能力，實(shí)現(xiàn)更類人的智能，無疑將加速AI產(chǎn)業(yè)落地，加速邁向AGI時(shí)代！

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）