最近,美國推動的一系列科技封鎖政策讓人瞠目結舌。我們習以為常的世界科技秩序,毫無疑問正在以肉眼可見的速度被改變甚至重構。
在這樣的話語氛圍下,底層技術自主可控開始成為社會各界的共識與推動方向。而在科技產業(yè)進程里,半導體與計算機操作系統(tǒng)代表著過去有虧欠、今天急于填補的技術門類,也就是我們在今天能夠清晰感受到被“卡脖子”的那些技術。而另一類則是中美大體處在齊頭并進階段,需要積極發(fā)展的“未來技術”。所謂昨日因今日果,如果我們不希望未來再次被卡脖子,那么今天這類技術也必須保持獨立可控,甚至高速發(fā)展反超歐美——AI技術就是這個領域的代表。
(去年GitHub就突然限制克里米亞、古巴、朝鮮、伊朗和敘利亞等國家用戶訪問)
在發(fā)展AI技術的進程里,最關鍵的開發(fā)底座相信讀者已經很熟悉,那就是深度學習框架。在幾年前,我們就專門討論過深度學習框架獨立自主的戰(zhàn)略意義,今天來看已經一一應驗。而國產深度學習框架發(fā)展到今天這個階段,又出現(xiàn)了很多新的動向。在這個階段我們需要的可能就不僅是簡單的中美框架對標與扶持,而是更具有智慧、有策略,有合理產業(yè)節(jié)奏的方式去推動技術底座良性發(fā)展。
在此過程中,盲目執(zhí)行平均主義的資源分配和產業(yè)推動,可能是最大的問題。進入深度學習框架發(fā)展新階段,合適的產業(yè)策略應該是既期待和推動百花齊放,又能找到成為棟梁之材的佳木。
皆木皆花不是景。只有內在系統(tǒng)完善,發(fā)展機制合理的生態(tài)系統(tǒng),才能培育起茁壯的中國AI叢林。
名實陷阱:深度學習框架發(fā)展新階段需要警惕什么?
在產業(yè)AI不斷發(fā)展的今天,AI底層技術工具和平臺受到了社會各界,乃至世界各國的普遍重視。但在相關產業(yè)成果不斷涌現(xiàn)的過程里,也勢必因為AI技術是全新事物,缺乏產業(yè)通行的判斷標準,導致政府、資本、媒體、產業(yè),各領域的話語表達方式不一致,彼此理解差異很大,這導致后續(xù)行動的依據(jù)也不同。
舉個例子,眾多技術平臺和工具進入大眾視野,基本都會冠以首個、獨家、突破這類的字眼。搭配上看似強大的資本與團隊背景,很容易讓行業(yè)外人士產生過高的心理預期。無論在芯片、操作系統(tǒng),還是AI、大數(shù)據(jù)領域,我們已經見過太多類似的問題,甚至鬧劇。這類現(xiàn)象可以稱之為自主科技產業(yè)上的“名實陷阱”。
這就像鐵和金都是金屬,但價值顯然不同。但由于大眾層面缺乏對科技產業(yè)的專業(yè)認知,就很難辨別名稱相近平臺的實際差異。
這一點在深度學習框架的發(fā)展中,也已經開始體現(xiàn)。今年以來,不僅谷歌TensorFlow、Facebook的PyTorch、亞馬遜的MXNet三大美國框架不斷更新,國內很多深度學習框架也宣布向業(yè)界開源開放。比如一流科技自研的Oneflow深度學習框架、曠視科技的深度學習框架天元(MegEngine)等等。當然,每個框架背后都充斥著開發(fā)者的夢想和心血,也會在一些訓練任務上展現(xiàn)出獨特的優(yōu)勢。但如果我們橫向對比這些新框架,會發(fā)現(xiàn)它們在核心技術、工具完整性、生態(tài)布局上有些參差不齊的缺失,甚至達不到國內老大哥“飛槳”的標準。那么如果從政策、資本、產業(yè)合作等層面都給予同樣的賦能,顯然會造成無差別大水漫灌的問題。
(飛槳全景圖體現(xiàn)了全面的核心技術與完整的工具集)
事實上,到底如何定義什么是完整的深度學習框架,是一個非常專業(yè)化的產業(yè)問題。比如早在2018年,阿里開源了旗下的X-Deep Learning,稱其為“業(yè)內首個面向高維稀疏數(shù)據(jù)場景的深度學習開源框架”。而事實上XDL只能面向高維稀疏數(shù)據(jù)場景這一種需求,能力范圍狹小,很快也就在開發(fā)者中不見了蹤影。
同樣的窘境在新近開源的深度學習框架中體現(xiàn)的尤為明顯,像Oneflow這類技術輕騎兵,往往只針對單一的產業(yè)需求,會出現(xiàn)能力范圍和工具性、生態(tài)性、產業(yè)特性的欠缺。而深度學習框架作為AI時代的操作系統(tǒng),又恰恰是需要聚少成多、長期積累的領域。如果引導產業(yè)和開發(fā)者無差別入駐,那么顯然會造成內部凝聚力失衡,無法形成有效生態(tài)的問題。
那么是否有辦法,在產業(yè)周期中建立一個關于深度學習框架的判斷機制呢?
三維模型:如何建立AI產業(yè)的價值判斷機制?
我們當然不會認為深度學習框架一定就是老的好、新的差,或者強者恒強,大者通吃。也不認為新型深度學習框架就沒有出現(xiàn)的必要,或者缺乏產業(yè)機遇。恰恰相反,百花齊放的產業(yè)形態(tài)是業(yè)界開始興旺的表現(xiàn)。只是我們認為無論在產業(yè)政策、資本扶持,抑或產業(yè)合作上,都應該建立標準化、多元化的價值評判機制,引領深度學習框架向合理性、高效率發(fā)展。避免平均主義造成資源浪費,也避免大眾聽到創(chuàng)新和獨立字樣都等而視之,造成公共情緒的錯誤引導。
回歸到深度學習框架領域,一個健康的價值判斷模型,需要檢測多個維度來審視一款產品或者平臺的發(fā)展:
首先,在當前的科研大環(huán)境下,核心技術自主權和底層技術自主可控的價值已經非常明顯。政策制定者、產業(yè)各界與媒體,應該堅定支持國產框架發(fā)展,甚至推動AI產業(yè)生態(tài)從美國框架向國產框架遷移,畢竟在目前的局勢下,誰也無法判斷下一個斷供的是不是TensorFlow。
然而,僅僅下載使用來支持是不夠的,就像操作系統(tǒng)一樣,深度學習框架本身難度很大,但更具挑戰(zhàn)性的是生態(tài)的發(fā)展和匯集。相關政策與產業(yè)標準,也應該更加關注AI開發(fā)者生態(tài),圍繞生態(tài)需求制定針對性推動策略。在這方面,一個顯著的指標就是開發(fā)者的數(shù)目,這能直觀地體現(xiàn)生態(tài)繁榮程度,就拿飛槳舉例,它已經凝聚超過210萬開發(fā)者,而且正在通過自己的生態(tài)化規(guī)模將AI能力拓展到各行業(yè),在產業(yè)階段,理應得到更高的重視。
最重要的是,深度學習框架要體現(xiàn)出對國家經濟轉型升級的推動力,按現(xiàn)在的政策,就是深度學習框架是否能夠負載今天新基建周期中,產業(yè)智能化帶給深度學習框架的工業(yè)級承載需求。這個標準又包含幾個部分,比如核心技術的完整、領先,能夠負載大規(guī)模深度學習;另一方面是平臺體系與技術能力對于工業(yè)化大生產領域的支撐能力。但大部分的深度學習框架交出來的成績單都還沒達到要求,要么是覆蓋面狹窄,要么是企業(yè)不滿意。如果向飛槳看齊,它已經覆蓋通信、電力、城市管理、民生、工業(yè)、農業(yè)、林業(yè)、公益等眾多行業(yè)和領域,在疫情期間也落地大顯身手,目前已有9萬家企業(yè)通過飛槳創(chuàng)建了超過29.5萬個模型, 這些產業(yè)指標,顯然是深度學習框架價值的最好判斷標準,也是后來者亟需突破的方向。
在深度學習框架走向百花齊放的當口,我們希望能夠避免眉毛胡子一把抓,達成重點分明、產業(yè)邏輯清晰的扶持策略與產業(yè)引導行為。
產業(yè)策略:推動AI底座整體發(fā)展的當務之急
對于AI基礎設施來說,百花齊放的產業(yè)形態(tài),甚至開發(fā)者純粹興趣式的創(chuàng)造都非常具有價值。但如果我們的目標是發(fā)展符合社會經濟需求的工業(yè)化AI底座,通過新基建推動產業(yè)智能整體發(fā)展,那么就需要制定詳實、完整的產業(yè)策略,推動深度學習框架與眾多AI基礎設施一道,向AI工業(yè)化大生產發(fā)展。在這樣的目標下,有幾件當務之急值得多加重視:
首當其沖的是,重點發(fā)展一個體系,有策略進行平臺、數(shù)據(jù)、開發(fā)生態(tài)的打通。最佳方案是以發(fā)展度最好的深度學習框架為依托,有效整合再創(chuàng)新,與產業(yè)溝通,避免重復發(fā)明輪子,防止政策扶植、資本、社會輿論的資源錯置或浪費。同時積極推動國產化、自主可控的深度學習框架發(fā)展。當然不是說要刻意規(guī)避美國優(yōu)秀技術成果,但在目前階段和國際形勢下,積極推動甚至政策推動深度學習框架國產化、自主化,似乎已經是題中應有之義。
(國務院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》也提到了扶持深度學習框架的目標)
其次,技術評判標準的建立,是細化核心技術發(fā)展目標的關鍵一步。將深度學習框架拆解為更為詳細的產業(yè)維度,厘清各平臺的優(yōu)劣勢與發(fā)展所處階段,是目前政府和業(yè)界需要共同完成的任務。例如深度學習框架能否保持高頻升級迭代節(jié)奏,來解決產業(yè)不斷涌現(xiàn)的新問題?核心框架的開發(fā)能否變得越來越便捷,讓開發(fā)者和企業(yè)更容易上手?更別說需要大量具有突破性的新技術,來滿足產業(yè)智能化轉型過程中面臨的門檻與痛點。在這些問題上,飛槳做的比較好,他們具備突出優(yōu)勢,核心技術發(fā)展方向也很明確,可以有效幫助產業(yè)快速發(fā)展,讓社會資源對平臺的價值判定更具標準化方案。
而且從另一個方向上看,不同的框架處在不同的發(fā)展周期,自然也需要不同的發(fā)展推動力。比如飛槳在產業(yè)核心能力上的特性、開發(fā)生態(tài)與產業(yè)應用上的積累,目前是其他框架所不具備的。建立關鍵技術的評判標準化體系,可以避免“大小班同上”,讓發(fā)展領先的深度學習框架向下一個產業(yè)階段進行探索,承擔更重的社會價值。
而最關鍵的還是,深度學習框架必須要融入產業(yè)生態(tài),建立起對社會經濟的灌溉體系,否則就會為技術而技術,淪為空中樓閣。深度學習框架之所以重要,完全建立在AI技術可以賦能產業(yè),提升社會生產力的基礎上。那么發(fā)展深度學習框架自主化、國產化,也建立在技術平臺與產業(yè)需求的高效對接與產業(yè)適配上。從這個角度看,在檢驗深度學習框架的價值與發(fā)展?jié)摿r,也必須將其與行業(yè)結合的案例、效率、平臺可行性納為基礎評判準則。比如說,飛槳推動大工業(yè)生產的可行性,正體現(xiàn)在對產業(yè)的適配和大量案例上。新冠疫情期間,就有大量AI應用高效產出并在各個防疫領域發(fā)揮作用。2月13日,飛槳開源了業(yè)內首個口罩人臉檢測及分類模型,隨后,包括中石油、北京地鐵在內的百余家試用企業(yè)紛紛應用落地。
(飛槳開源的口罩人臉檢測及分類模型,助力復工復產)
此外,根據(jù)報道,百度與OPPO的合作中,提供了飛槳大規(guī)模分布式訓練等技術能力,將OPPO推薦系統(tǒng)業(yè)務模型訓練速度提升了8倍,模型擴大了20倍,推薦場景效果提升了4%-5%,節(jié)省了90%的內存,對于OPPO覆蓋全球3.5億用戶的移動互聯(lián)網服務起到了很大助推作用。
還有一個走出國門的案例是,基于飛槳打造的一款無人機自主飛行平臺,已經在東南亞某國提供自主巡邏、火情監(jiān)測、非法入侵、森林樹木砍伐監(jiān)測等功能方案,相比人工巡檢效率提高200%,森林覆蓋面積從40%提升到100%,對當?shù)厣址阑鸸ぷ魈峁┝巳庋劭梢姷闹妗?/p>
在互聯(lián)網、科技行業(yè),以及工業(yè)、農業(yè)、能源、金融,乃至公共衛(wèi)生與社會服務等領域的廣泛落地,也是市場選擇深度學習框架的一種體現(xiàn),此前IDC發(fā)布的《中國深度學習平臺市場份額調研》顯示,深度學習市場形成谷歌、Facebook、百度三強態(tài)勢,三者占據(jù)了國內超過一半的市場份額,由此可見一斑。從這些角度看,在國產深度學習平臺自主可控創(chuàng)新的最佳契機與平臺化底座的選擇上,飛槳已經建立起了較為明顯的優(yōu)勢。
當然,這只是對國產深度學習框架主流平臺選擇及扶持的一種思路,這也體現(xiàn)出,在我們重新審視AI產業(yè)發(fā)展周期與深度學習框架發(fā)展賦能時,或許需要更加體系化、生態(tài)化、產業(yè)指向的目光,來審視不同平臺的差異化戰(zhàn)略價值。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 于東來的“爹味兒”,把胖東來從“風口”推向“浪尖” ?
- 讀懂了vivo的用戶腦、產品心,就讀懂了國產第一如何煉成
- 蘋果手機iPhone 16一到2025年就降價,這次還會有人“上套”嗎?
- 2024年度VR產業(yè)回顧:混合現(xiàn)實頭顯成為主流;國內VR大空間強勢崛起
- 阿里獨家合作,亞馬遜“親測”代言,雷鳥創(chuàng)新打造 AI 眼鏡新標桿,媲美 Meta !
- CES 2025 搶先揭秘:XR領域新品爆料,AI眼鏡成焦點
- 2024 XR年度大事件TOP 10
- 先誅蘋果,再滅Meta?三星、谷歌、高通組“失敗者聯(lián)盟”,能否贏得XR領域終局之戰(zhàn)?
- Meta高端AR眼鏡Orion全揭秘:五年內上市,或無緣國內市場,大概率撞車蘋果
- 庫克進軍游戲圈?蘋果Vision Pro與索尼達成合作 后者發(fā)行游戲剛拿下TGA年度最佳
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。