近日,16周年慶活動(dòng)現(xiàn)場(chǎng),愛(ài)數(shù)正式開(kāi)源了認(rèn)知智能開(kāi)發(fā)框架KWeaver。KWeaver脫胎于愛(ài)數(shù)認(rèn)知智能框架AnyDATA Framework 2,具有快速的開(kāi)發(fā)能力、全面的開(kāi)放性、高性能等特性,以成熟的數(shù)據(jù)知識(shí)化方法論和系列認(rèn)知智能應(yīng)用組件賦能數(shù)據(jù)科學(xué)家和應(yīng)用開(kāi)發(fā)者,以此降低領(lǐng)域認(rèn)知智能應(yīng)用開(kāi)發(fā)的復(fù)雜度與人才門(mén)檻。開(kāi)源后,KWeaver將作為普惠技術(shù)進(jìn)一步賦能產(chǎn)業(yè),人人都可以在 GitHub 上獲取。
GitHub 項(xiàng)目地址:https://github.com/AISHU-Technology/kweaver
長(zhǎng)按識(shí)別二維碼跳轉(zhuǎn)
愛(ài)數(shù)在數(shù)據(jù)產(chǎn)業(yè)的布局與創(chuàng)新
2021年,愛(ài)數(shù)推出新愿景——以數(shù)據(jù)重塑生產(chǎn)力,共創(chuàng)智能世界。“數(shù)據(jù)”和“智能”作為愛(ài)數(shù)成長(zhǎng)的兩個(gè)關(guān)鍵詞,很好地呼應(yīng)了愛(ài)數(shù)的業(yè)務(wù)定位 Data+AI,即AI驅(qū)動(dòng),數(shù)據(jù)賦能。這個(gè)愿景背后,也蘊(yùn)涵著愛(ài)數(shù)更高層次的追求:不僅要成長(zhǎng)為一個(gè)典范企業(yè),還應(yīng)肩負(fù)起社會(huì)責(zé)任,讓技術(shù)驅(qū)動(dòng)社會(huì)進(jìn)步,用數(shù)據(jù)賦能人類生產(chǎn)力的提升。
在“Data”層面,愛(ài)數(shù)很早就開(kāi)始了數(shù)據(jù)產(chǎn)業(yè)的布局,實(shí)現(xiàn)數(shù)據(jù)產(chǎn)業(yè)從0到1的創(chuàng)新。2019年愛(ài)數(shù)發(fā)布大數(shù)據(jù)基礎(chǔ)設(shè)施戰(zhàn)略,加速布局?jǐn)?shù)據(jù)產(chǎn)業(yè);2021年~2022年愛(ài)數(shù)基于領(lǐng)域認(rèn)知智能技術(shù)成立北方大數(shù)據(jù)交易中心,搭建全國(guó)數(shù)據(jù)交易網(wǎng)絡(luò)體系;2022年愛(ài)數(shù)宣布以開(kāi)源賦能產(chǎn)業(yè),減低總體社會(huì)成本,實(shí)現(xiàn)客戶、伙伴等多方的可信協(xié)作。
在“AI”層面,愛(ài)數(shù)認(rèn)知智能技術(shù)在近兩年也取得了較快的進(jìn)展。2021年,愛(ài)數(shù)發(fā)布以領(lǐng)域知識(shí)網(wǎng)絡(luò)為核心技術(shù)的AnyDATA ONE,并與復(fù)旦大學(xué)成立聯(lián)合實(shí)驗(yàn)室開(kāi)展認(rèn)知智能的研究。之后,又和天津大學(xué)成立聯(lián)合實(shí)驗(yàn)室開(kāi)展數(shù)據(jù)智能技術(shù)的研究。目前,愛(ài)數(shù)正在全球范圍招募人工智能博士,在長(zhǎng)沙籌建人工智能研究院,以此推動(dòng)領(lǐng)域認(rèn)知智能技術(shù)的發(fā)展。
在此背景下,愛(ài)數(shù)一方面希望通過(guò)KWeaver的開(kāi)源,整合全球智慧,將各行各業(yè)、各個(gè)領(lǐng)域不同的解題思路和方法模型融入愛(ài)數(shù)的認(rèn)知智能框架,激發(fā)更多的創(chuàng)新與應(yīng)用;另一方面也希望通過(guò)開(kāi)源,讓愛(ài)數(shù)積累的技術(shù)成果走出愛(ài)數(shù),面向更多的數(shù)據(jù)科學(xué)家、應(yīng)用開(kāi)發(fā)者和領(lǐng)域?qū)<?為行業(yè)擁抱AI提供更多的可能。
領(lǐng)域認(rèn)知驅(qū)動(dòng)需要開(kāi)源
經(jīng)過(guò)幾十年的發(fā)展,人工智能從計(jì)算智能發(fā)展到感知智能,又從感知智能發(fā)展到認(rèn)知智能。作為第三代人工智能,認(rèn)知智能非常重要的特點(diǎn)之一,就是需要通過(guò)領(lǐng)域認(rèn)知進(jìn)行驅(qū)動(dòng)。
“第三代人工智能的目標(biāo)是要真正模擬人類的智能行為,我們必須充分地利用知識(shí)、數(shù)據(jù)、算法和算力,把四個(gè)因素充分利用起來(lái),這樣才能夠解決不完全信息、不確定性環(huán)境和動(dòng)態(tài)變化環(huán)境下面的問(wèn)題,才能達(dá)到真正的人工智能。—— 張鈸院士”
在此背景下,領(lǐng)域認(rèn)知智能成為新的解題思路,這也是愛(ài)數(shù)自2021年推出認(rèn)知智能戰(zhàn)略后,聯(lián)合復(fù)旦大學(xué)、天津大學(xué)等高等院校專家不斷實(shí)踐摸索出的技術(shù)成果。領(lǐng)域認(rèn)知智能,面向某一領(lǐng)域內(nèi)具體的業(yè)務(wù)問(wèn)題,通過(guò)獲取領(lǐng)域內(nèi)的數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)知識(shí)化形成領(lǐng)域知識(shí)網(wǎng)絡(luò),再基于領(lǐng)域智商評(píng)估領(lǐng)域知識(shí)的質(zhì)量,在此基礎(chǔ)上利用知識(shí)進(jìn)行理解、推理和決策,從而開(kāi)發(fā)出滿足用戶場(chǎng)景需求的領(lǐng)域認(rèn)知智能應(yīng)用,輔助人們解決特定的問(wèn)題,提升生產(chǎn)力。
“認(rèn)知智能的核心能力是“理解”和“解釋”,體現(xiàn)在機(jī)器能夠理解數(shù)據(jù)、理解語(yǔ)言進(jìn)而理解現(xiàn)實(shí)世界的能力,體現(xiàn)在機(jī)器能夠解釋數(shù)據(jù)、解釋過(guò)程進(jìn)而解釋現(xiàn)象的能力,體現(xiàn)在推理、規(guī)劃等等一系列人類所獨(dú)有的認(rèn)知能力上。
——《知識(shí)圖譜與認(rèn)知智能》,肖仰華,復(fù)旦大學(xué)教授,復(fù)旦愛(ài)數(shù)聯(lián)合研究研究中心主任”
然而,各行各業(yè)領(lǐng)域的眾多、專業(yè)領(lǐng)域之間的高壁壘,唯有通過(guò)開(kāi)源,才能更加容易地讓不同行業(yè)、不同領(lǐng)域的開(kāi)發(fā)者開(kāi)發(fā)領(lǐng)域認(rèn)知智能,從而也讓 KWeaver 不斷提升領(lǐng)域認(rèn)知能力。對(duì)于愛(ài)數(shù)而言,一方面需要借助開(kāi)源整合全球智慧;另一方面也可以通過(guò)開(kāi)源開(kāi)放自身的技術(shù)成果與積累,實(shí)現(xiàn)AI普惠全球。
愛(ài)數(shù)KWeaver項(xiàng)目:開(kāi)源的認(rèn)知智能開(kāi)發(fā)框架
KWeaver是開(kāi)源的認(rèn)知智能開(kāi)發(fā)框架,為數(shù)據(jù)科學(xué)家、應(yīng)用開(kāi)發(fā)者和領(lǐng)域?qū)<姨峁┚哂锌焖俚拈_(kāi)發(fā)能力、全面的開(kāi)放性和高性能的知識(shí)網(wǎng)絡(luò)生成及認(rèn)知智能應(yīng)用開(kāi)發(fā)的工具與平臺(tái)。KWeaver名稱中,K代表的是Knowledge知識(shí),Weaver代表編織者,意為將所有領(lǐng)域知識(shí)編織在一起,從而實(shí)現(xiàn)領(lǐng)域認(rèn)知智能。
KWeaver面向數(shù)據(jù)科學(xué)家、應(yīng)用開(kāi)發(fā)者、領(lǐng)域?qū)<胰愑脩籼峁┤N能力。
快速的開(kāi)發(fā)能力:KWeaver提供可視化的知識(shí)網(wǎng)絡(luò)工作臺(tái),可視化的認(rèn)知智能應(yīng)用開(kāi)發(fā)調(diào)試工具,豐富的數(shù)據(jù)加工及模型訓(xùn)練工具,以及所見(jiàn)即所得的API文檔;
全面的開(kāi)放性: KWeaver源代碼是開(kāi)源且技術(shù)透明的,這意味著參與項(xiàng)目的用戶可以查看全部技術(shù)細(xì)節(jié),同時(shí)還支持多元異構(gòu)數(shù)據(jù)源對(duì)接,提供SDK兼容更多的第三方知識(shí)抽取模型,提供 API 和 Web 組件的整合方式;
高性能:得益于愛(ài)數(shù)多年在云原生領(lǐng)域的積累,KWeaver的開(kāi)發(fā)基于云原生技術(shù),提供橫向擴(kuò)展能力,采用分布式的計(jì)算引擎實(shí)現(xiàn)海量數(shù)據(jù)接入的處理能力。
通過(guò)KWeaver實(shí)現(xiàn)領(lǐng)域認(rèn)知驅(qū)動(dòng)涉及到兩個(gè)關(guān)鍵步驟。
第一是領(lǐng)域知識(shí)獲取。首先建立領(lǐng)域認(rèn)知模型,基于模型進(jìn)行數(shù)據(jù)加工抽取知識(shí),對(duì)于不同來(lái)源的數(shù)據(jù),加工的方式也會(huì)有很大不同,部分?jǐn)?shù)據(jù)可以直接抽取,部分?jǐn)?shù)據(jù)則需要通過(guò)深度學(xué)習(xí)模型,例如文本知識(shí)。加工完成后生成領(lǐng)域知識(shí)網(wǎng)絡(luò)。
第二是領(lǐng)域知識(shí)利用?;谥R(shí)網(wǎng)絡(luò)進(jìn)行認(rèn)知智能應(yīng)用的開(kāi)發(fā),利用數(shù)據(jù)科學(xué)的方法開(kāi)發(fā)模型,并將模型應(yīng)用到推理、理解等具體場(chǎng)景。顯然,在數(shù)據(jù)領(lǐng)域認(rèn)知智能并非替代原有的深度學(xué)習(xí)或機(jī)器學(xué)習(xí),而是將兩者結(jié)合發(fā)揮更大的作用。KWeaver也會(huì)內(nèi)置很多基于深度學(xué)習(xí)的知識(shí)抽取模型。
本次正式開(kāi)源前,KWeaver已經(jīng)伴隨愛(ài)數(shù)AnyDATA經(jīng)歷了近3年的孵化和打磨,結(jié)合AnyShare、AnyRobot、AnyFabric等產(chǎn)品的能力實(shí)現(xiàn)諸多創(chuàng)新。如結(jié)合AnyShare在知識(shí)管理方面形成行業(yè)知識(shí)卡片、行業(yè)標(biāo)簽、知識(shí)搜索等應(yīng)用;結(jié)合AnyRobot在智能運(yùn)維方面實(shí)現(xiàn)可持續(xù)進(jìn)化的運(yùn)維知識(shí)庫(kù),以及運(yùn)維中小概率事件的故障定位和根因分析;結(jié)合AnyFabric幫助用戶更好地編織數(shù)據(jù),以資產(chǎn)圖譜的形式讓用戶更直觀全面的觀察和分析業(yè)務(wù)能力、數(shù)據(jù)質(zhì)量等等。
16年專注,16年探索。從備份一體機(jī)到大數(shù)據(jù)基礎(chǔ)設(shè)施,從人工智能到領(lǐng)域認(rèn)知智能,從傳統(tǒng)商業(yè)模式到KWeaver的正式開(kāi)源,愛(ài)數(shù)始終在朝著“以數(shù)據(jù)重塑生產(chǎn)力,共創(chuàng)智能世界”的愿景不斷成長(zhǎng)。未來(lái),愛(ài)數(shù)將以更開(kāi)放、包容的心態(tài),通過(guò)更多的開(kāi)源計(jì)劃實(shí)現(xiàn)技術(shù)共享,為數(shù)據(jù)產(chǎn)業(yè)的繁榮發(fā)展貢獻(xiàn)自己應(yīng)盡的力量。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )