原標(biāo)題:“盤古”走向產(chǎn)業(yè)山巒,打開了一串AI落地的新腦洞
作為中國神話體系中最古老的神,盤古與其他創(chuàng)世神不同的地方,在于開天辟地之后,將自身化為承載華夏文明的山川江海。
《五運歷年紀(jì)》中記載,盤古氣成風(fēng)云,聲為雷霆,左眼為日,右眼為月,四肢五體為四極五岳,血液為江河,筋脈為地理,肌肉為田土,發(fā)為星辰,皮毛為草木,齒骨為金玉,精髓為珠石,汗流為雨澤。
今天,眾多產(chǎn)業(yè)渴望引入AI來提質(zhì)增效,但傳統(tǒng)行業(yè)AI人才不足、專業(yè)經(jīng)驗與技術(shù)相互適配的磨合難題、產(chǎn)業(yè)智能化改造的探索成本等等,導(dǎo)致AI落地產(chǎn)業(yè)時,很容易面臨需求瑣碎、解決方案繁多、投入效益比不清晰的混沌局面。
這時,預(yù)訓(xùn)練大模型的出現(xiàn),就成為劈開蒙沌的那把“斧子”。
基于預(yù)訓(xùn)練大模型,開發(fā)者和產(chǎn)業(yè)可以通過微調(diào)就能快速開發(fā)出適配不同場景的應(yīng)用,打破AI落地產(chǎn)業(yè)的諸多限制條件。GPT等超大參數(shù)通用模型的迭代,都會引發(fā)學(xué)術(shù)界和產(chǎn)業(yè)界的狂熱關(guān)注。而中國預(yù)訓(xùn)練大模型的技術(shù)標(biāo)桿,大概率要算華為一個。
今年4月,華為云發(fā)布了盤古系列超大預(yù)訓(xùn)練模型。基于大量數(shù)據(jù)打造,具有超大規(guī)模參數(shù)、超高精度的特質(zhì),還提供模型預(yù)訓(xùn)練、微調(diào)、部署和迭代的功能,以減少行業(yè)側(cè)的數(shù)據(jù)標(biāo)注依賴,從而降低人工智能開發(fā)的門檻和成本。
以“盤古”來命名預(yù)訓(xùn)練大模型,來自于華為嚴(yán)肅而又浪漫的思考——為AI走向千行百業(yè)打開新空間,同時將華為的各種技術(shù)能力與產(chǎn)業(yè)融合,讓AI滋養(yǎng)萬物。
AI落地不是奇思妙想的神話,要經(jīng)受現(xiàn)實的種種考驗,盤古大模型真的能夠?qū)崿F(xiàn)技術(shù)目標(biāo)嗎?恰好最近有一個實地探訪“華為云黑科技”的節(jié)目,我們可以通過盤古大模型的探訪視頻,眼見為實地了解一下盤古大模型在實際案例中的能力。
可以看到, AI正在與千行百業(yè)、山川江海凝結(jié)在一起,抵達每一座產(chǎn)業(yè)山巒,勾勒出數(shù)智山河的全新畫卷。
其中,“盤古”都扮演著怎樣的角色呢?
工業(yè)之眼
AI需要望向那些曾被忽視的偏遠角落和產(chǎn)業(yè)難題。電網(wǎng)巡檢,正是這樣的地方。
長期以來,電網(wǎng)員工必須穿行在深山峽谷、荒漠戈壁中,親自去觀察和檢修故障。而現(xiàn)在,盤古大模型也讓AI開始流淌在這些人煙罕至的地方。
在國網(wǎng)重慶永川公司智能電力巡檢項目中,就用無人機替代人力完成巡檢,但是,要當(dāng)好一線生產(chǎn)作業(yè)中的“眼睛”,并不容易。
一來,許多電網(wǎng)環(huán)境和狀況都各有不同,意味著訓(xùn)練數(shù)據(jù)樣本少,傳統(tǒng)開發(fā)方式下很難達到應(yīng)用效果,無法取代人力;二來,電網(wǎng)作為基礎(chǔ)設(shè)施,覆蓋面積大、范圍廣,標(biāo)注海量數(shù)據(jù)需要耗費大量時間和人力成本。這時,盤古預(yù)訓(xùn)練大模型的優(yōu)勢便體現(xiàn)出來了。
首先,盤古CV大模型是目前業(yè)界最大的CV大模型,包含超過30億參數(shù),并且在超過10億張圖像上進行了預(yù)訓(xùn)練,在ImageNet等數(shù)據(jù)集上的小樣本分類精度上排名世界第一,所以能夠滿足無人機智能巡檢系統(tǒng)(缺陷檢測)中的小樣本學(xué)習(xí)、標(biāo)注工作量大等問題,提升訓(xùn)練效率。國網(wǎng)重慶永川項目中,就借助盤古大模型將數(shù)據(jù)篩選效率提升30倍、篩選質(zhì)量提升5倍。
其次,盤古大模型的開發(fā)過程中采用了多項領(lǐng)先技術(shù),比如首次在圖像預(yù)訓(xùn)練流程中加入生成和判別損失,兼顧CV大模型的判別能力和生成能力,保證模型在底層圖像恢復(fù)和高層語義理解的能力,從而保證了最終部署的模型精度能夠滿足作業(yè)的需求。
不難看出,盤古大模型的視覺能力,正在點亮中國大地上一個個能力各異的“工業(yè)之眼”。
醫(yī)療之臂
提到AI醫(yī)療,很多人都會想到疫情防控期間行走在醫(yī)院里的消毒機器人、送餐機器人。很少有人知道,在實驗室中,科研人員同樣需要AI來加速攻關(guān)。
新冠肺炎爆發(fā)后,全球的科研人員短期內(nèi)發(fā)表了大量新冠相關(guān)的文章,時間緊任務(wù)重,要快速從海量文獻中提取出最新最前沿的關(guān)鍵知識和研究成果,給中國醫(yī)療人員帶來了不小的壓力:
靠人工整合,不僅需要大量人員投入,影響防疫效率,還可能出現(xiàn)分析效率低、出現(xiàn)誤差等情況。而且,當(dāng)時所能使用的深度學(xué)習(xí)算法模型,很多沒有生物醫(yī)學(xué)領(lǐng)域語料,在知識提取上表現(xiàn)一般。
這時候,盤古大模型迅速化身為科研人員的左膀右臂。
基于盤古大模型,華為云構(gòu)建了從文獻到知識圖譜的端到端分析流程,用于醫(yī)學(xué)信息的抽取,同時提出了用于醫(yī)學(xué)關(guān)系預(yù)測算法,可以自適應(yīng)地選擇更恰當(dāng)?shù)膶<夷P?,來對輸入的?shù)據(jù)進行預(yù)測。
靈活的模型選擇,使得盤古大模型的知識表征方法比傳統(tǒng)的知識表征方法,準(zhǔn)確度提升了12%。也有效地推動了科研工作的進程。
可能有讀者會問,隨著疫情逐步得到控制,盤古大模型還能在醫(yī)療領(lǐng)域發(fā)光發(fā)熱嗎?實際上,今天AI及盤古大模型已經(jīng)成為生物醫(yī)療創(chuàng)新路上不可或缺的伙伴。
城市之路
智慧城市是目前為止人類對AI能力最恢弘也最全面的落地想象。而城市智慧生活,則是由一個個細分且垂直的算法模型來組成的。
舉個例子,城市指揮交通往往需要成百上千個算法,來分析和處理錯綜復(fù)雜的交通狀況與萬級規(guī)模視頻流數(shù)據(jù)。僅識別領(lǐng)域,就包括號牌遮擋、人車對比、駕駛行為異常等等諸多細節(jié)。
要針對每個AI落地場景都一一開發(fā)、訓(xùn)練,智慧城市可能要等到天荒地老。這時候,盤古大模型就成了智慧城市的一條“加速履帶”,讓創(chuàng)新可以被更快、更簡單地實現(xiàn)。
這條加速履帶,讓AI應(yīng)用之路更寬廣:利用自研的虛擬與現(xiàn)實數(shù)據(jù)混合技術(shù),配合最新研發(fā)的層次化Transformer模塊,盤古大模型能夠?qū)崟r處理數(shù)百路視頻的實時數(shù)據(jù),在無需任何手工標(biāo)注數(shù)據(jù)的情況下,完成交通參與者的識別與分析。這意味著,基于盤古大模型,許多AI能力薄弱的城市也能快速追趕上智能化隊伍。
同時,也讓數(shù)字化建設(shè)變得更集約。一直以來,智慧城市都面臨著數(shù)據(jù)、算力、人才等資源的巨大消耗。而基于盤古的預(yù)訓(xùn)練模型,以及自研的小樣本微調(diào)技術(shù)等等,可以大幅降低人工標(biāo)注量和調(diào)優(yōu)難度,讓AI可以低成本、大規(guī)模復(fù)制。
借助這條履帶,越來越多的城市可以點亮AI之路,智能山河的畫卷正在城市版圖上徐徐展開。
科學(xué)之腦
盤古大模型不僅出現(xiàn)在人間煙火、千行百業(yè)的實踐中,也不忘護航科研創(chuàng)新的星辰大海。
盤古大模型的分身之一科學(xué)計算大模型,正在各種科學(xué)問題中,用AI技術(shù)來促進基礎(chǔ)科學(xué)的發(fā)展。
目前,科學(xué)計算大模型還被應(yīng)用于氣象預(yù)測、分子動力學(xué)預(yù)測、微分方程求解等科學(xué)問題上,助力AI長遠地影響和改變?nèi)祟惿钇焚|(zhì)。
目前,盤古大模型已經(jīng)在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等行業(yè)多個場景中成功驗證。透過這些案例,我們可以窺見盤古大模型為AI描畫的想象空間——為產(chǎn)業(yè)AI開辟新天地,將己身支撐數(shù)智山河的繁榮生長。
在產(chǎn)業(yè)山巒間,描畫AI的指數(shù)級增長曲線
有數(shù)據(jù)顯示,目前AI的滲透率不到10%,產(chǎn)業(yè)AI處在初級階段,帶來巨大的市場增長空間。多快好省,是AI接下來走出指數(shù)級增長曲線不可或缺的環(huán)節(jié)。從盤古大模型的實踐中,我們也可以看到,加速AI落地產(chǎn)業(yè)的幾個前提:
1.標(biāo)準(zhǔn)化。盤古大模型在預(yù)訓(xùn)練階段沉淀了大量的通用知識,四大分身模型以流水線的方式,快速適配和擴展不同場景,實現(xiàn)了AI模型在千行百業(yè)的批量化落地和可復(fù)制性。
2.先進性。只有具備人無我有、降維打擊的技術(shù)能力,預(yù)訓(xùn)練模型才能滿足各行各業(yè)的差異化開發(fā)、訓(xùn)練需求,這也是盤古大模型的價值所在。比如之前業(yè)界的一些預(yù)訓(xùn)練大模型為了追求泛化能力,基本都不調(diào)優(yōu),導(dǎo)致一些細分場景下無法發(fā)揮出最優(yōu)性能。而盤古大模型的基于提示(prompt-based)調(diào)優(yōu)、動態(tài)冰化等一系列技術(shù),則能夠?qū)崿F(xiàn)小樣本訓(xùn)練下的優(yōu)異性能,提升AI的場景普適度。
3.普惠性。減少行業(yè)應(yīng)用者的成本顧慮,也是科技企業(yè)的職責(zé)。華為云通過全棧AI協(xié)同優(yōu)化,幫助盤古大模型實現(xiàn)訓(xùn)練加速,單位比特算力成本最優(yōu)。從算法、算力與數(shù)據(jù)問題,再到與行業(yè)知識的結(jié)合,盤古大模型正在一步步移除AI向產(chǎn)業(yè)世界進發(fā)的種種阻礙。
在AI進入萬物的過程中,如何讓落地變得更加順暢、真正解決產(chǎn)業(yè)問題?技術(shù)與產(chǎn)業(yè),可能需要一個“深情擁抱”。這是科技企業(yè)需要擔(dān)負的時代之責(zé),也是盤古大模型正在寫就的傳奇故事:
讓技術(shù)力量化為三山五岳、雨露甘霖,支撐千行百業(yè)的智能化升級,在產(chǎn)業(yè)土壤中澆灌出千姿百態(tài)的AI之花。
9月23日華為全聯(lián)接線上大會
華為高級副總裁、華為云CEO、
消費者云服務(wù)總裁張平安
將在主題演講中
發(fā)布華為云盤古家族新成員
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 華為研發(fā)中心入駐上海青浦致小鎮(zhèn)房租大漲,帶動周邊租房市場熱潮
- 華為員工涌入蘇滬兩地,房東狂歡:租金幾近翻倍,跨省租房成新常態(tài)
- 制造業(yè)巨頭空客計劃裁員2500人,應(yīng)對航天業(yè)務(wù)虧損與供應(yīng)鏈挑戰(zhàn)
- 科技創(chuàng)新引領(lǐng)產(chǎn)業(yè)發(fā)展:江陰市與清華大學(xué)攜手推進重大科技項目
- 美國或再升級出口管制:考慮限制AI芯片對中東出口
- 劉強東章澤天報案:京東發(fā)言人證實夫婦倆遭有組織造謠,警方已介入
- 東方甄選擬15億出售教育業(yè)務(wù)
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設(shè)立5億元AI創(chuàng)投基金
- 聯(lián)想發(fā)布 ThinkStation P8工作站
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。