明略科技創(chuàng)始人、CEO 吳明輝
明略科技資深科學(xué)家 張杰
隨著信息化、網(wǎng)絡(luò)化、智能化的到來,通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)采集到的數(shù)據(jù)呈爆炸式增長,全世界步入了數(shù)字經(jīng)濟(jì)時(shí)代。在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)已經(jīng)成為關(guān)鍵生產(chǎn)要素。近些年,隨著數(shù)據(jù)意識(shí)的覺醒,很多企業(yè)開始構(gòu)建數(shù)據(jù)倉庫、數(shù)據(jù)中臺(tái),一些企業(yè)已經(jīng)具備了較好的數(shù)據(jù)基礎(chǔ)。
然而,數(shù)據(jù)本身并不產(chǎn)生知識(shí),數(shù)據(jù)只是現(xiàn)實(shí)世界在虛擬空間中留下的痕跡。知識(shí)高于數(shù)據(jù),知識(shí)才更貼近事物本質(zhì)。在一個(gè)充滿不確定性的經(jīng)濟(jì)環(huán)境中,企業(yè)持續(xù)競(jìng)爭優(yōu)勢(shì)的一個(gè)確定來源就是知識(shí)。在經(jīng)歷了信息化轉(zhuǎn)型、大數(shù)據(jù)時(shí)代、數(shù)據(jù)治理三個(gè)階段之后,或早或晚,任何組織最終都會(huì)走上利用數(shù)據(jù)創(chuàng)造新知識(shí)的道路。越來越多的企業(yè)開始意識(shí)到,創(chuàng)新力主要來源于自身擁有的知識(shí)資產(chǎn)的多少,其重要性超過數(shù)據(jù)資產(chǎn)甚至財(cái)務(wù)資產(chǎn)。知識(shí)成為企業(yè)核心資產(chǎn)和核心驅(qū)動(dòng)力的時(shí)代已來臨,越來越多的企業(yè)管理者開始重視知識(shí)的管理運(yùn)營。
在知識(shí)復(fù)雜度高的行業(yè)里,沒有不做知識(shí)管理的企業(yè)?,F(xiàn)階段,很多企業(yè)通過員工培訓(xùn)、文檔管理和數(shù)據(jù)管理來間接地管理知識(shí),普遍缺乏更高效的知識(shí)管理系統(tǒng),面臨不少問題,比如,知識(shí)難留存,知識(shí)難挖掘,知識(shí)難管理,知識(shí)難傳承。
隨著知識(shí)工程、云計(jì)算等技術(shù)的快速發(fā)展,將知識(shí)作為一種資源進(jìn)行整合,便于業(yè)務(wù)專家們基于任務(wù)以分布式協(xié)作的方式解決問題,成為實(shí)現(xiàn)知識(shí)的交流、共享和創(chuàng)新的途徑。知識(shí)中臺(tái)應(yīng)運(yùn)而生,建設(shè)知識(shí)中臺(tái)最直觀的交付物是知識(shí)服務(wù)系統(tǒng)(Knowledge as a Service,KaaS)。
明略科技根據(jù)在營銷、金融、工業(yè)、零售等行業(yè)的數(shù)字化轉(zhuǎn)型實(shí)踐經(jīng)驗(yàn),撰寫了《知識(shí)中臺(tái):數(shù)字化轉(zhuǎn)型中的認(rèn)知技術(shù)》,目前已由電子工業(yè)出版社出版。書中提供了一套構(gòu)建知識(shí)中臺(tái)的方法論,其核心內(nèi)容可總結(jié)為兩類用戶、三類知識(shí)和六步建設(shè)法。
兩類用戶包括知識(shí)官和知識(shí)工程師。知識(shí)官往往是企業(yè)內(nèi)的高級(jí)專家,負(fù)責(zé)定義全局概念體系和管理知識(shí)。知識(shí)工程師往往是業(yè)務(wù)一線的基層管理者,負(fù)責(zé)貢獻(xiàn)單條知識(shí)。
三類知識(shí)包括事實(shí)知識(shí)、原理知識(shí)和技能知識(shí)。以往的研究主要集中在事實(shí)知識(shí)上,原理知識(shí)多是按照技術(shù)路線區(qū)分,技能知識(shí)多是從管理學(xué)視角出發(fā),很少科技公司能夠給出IT方面的實(shí)現(xiàn)方案。
三類知識(shí)與兩類用戶的關(guān)系如圖1所示。
圖1 兩類用戶與三類知識(shí)的關(guān)系
六步建設(shè)法,指從各類包含顯性知識(shí)和隱性知識(shí)的數(shù)據(jù)源中,抽取出陳述性知識(shí)和程序性知識(shí),并做形式化表示,然后以多種方式提供知識(shí)服務(wù),最后促進(jìn)已有知識(shí)的迭代和新知識(shí)的產(chǎn)生。
具體包括以下步驟:
第一步,知識(shí)建模。
為了有效組織領(lǐng)域內(nèi)業(yè)務(wù)活動(dòng)中的幾類關(guān)鍵數(shù)據(jù),需要建立起知識(shí)的模型,定義出兩個(gè)概念體系。一個(gè)是類別體系,包含領(lǐng)域內(nèi)的類別、類別所包含的屬性及其約束、類別間的關(guān)系類型;另一個(gè)是任務(wù)體系,包含領(lǐng)域中要面對(duì)的場(chǎng)景、場(chǎng)景下的細(xì)分任務(wù)、處理任務(wù)所需考慮的判斷條件和工作流程等。有些領(lǐng)域在國家主管部委或行業(yè)聯(lián)盟組織的推動(dòng)下建立了相應(yīng)的國標(biāo)、行標(biāo),便于成員間的數(shù)據(jù)共享和流程標(biāo)準(zhǔn)化。
第二步,知識(shí)抽取。
知識(shí)抽取的目的是從數(shù)據(jù)源中抽取出知識(shí)片段,理解其語義后,做有序的組織和存儲(chǔ)。涉及的知識(shí)通常是明確定義的、事實(shí)性的信息,這些信息來自不同的數(shù)據(jù)源、具有不同的結(jié)構(gòu)。不同數(shù)據(jù)源的知識(shí)抽取方法各有不同:從結(jié)構(gòu)化數(shù)據(jù)中獲取知識(shí)的操作常被稱為映射(Mapping),需要編寫映射腳本,其難點(diǎn)在于復(fù)雜的關(guān)系表的處理,包括嵌套表、多列、外鍵關(guān)聯(lián)等。從半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲取知識(shí)的操作單元常被稱為包裝器(Wrapper),其難點(diǎn)在于包裝器的生成、更新和維護(hù),其中從非結(jié)構(gòu)化文本中抽取知識(shí)時(shí)就是廣義上說的抽取器(Extractor),其中三個(gè)最重要的子任務(wù)是:實(shí)體識(shí)別、關(guān)系抽取和事件抽取。
第三步,知識(shí)管理。
廣義的知識(shí)管理被定義為“對(duì)知識(shí)、知識(shí)創(chuàng)造過程和知識(shí)的應(yīng)用進(jìn)行規(guī)劃與管理的活動(dòng)”。此處的狹義的知識(shí)管理作為知識(shí)中臺(tái)的一項(xiàng)系統(tǒng)功能是指,通過提供用戶交互接口對(duì)事實(shí)知識(shí)庫、原理知識(shí)列表、技能知識(shí)庫中的知識(shí)條目做體系化組織,如增刪改查、推薦、問答、訂閱分享等操作,并最終存儲(chǔ)于數(shù)據(jù)庫中。
第四步,知識(shí)計(jì)算。
三類知識(shí)除了供人類用戶使用,還應(yīng)該被計(jì)算機(jī)無歧義的調(diào)用執(zhí)行,為上層的應(yīng)用系統(tǒng)提供API接口調(diào)用。由于三類知識(shí)經(jīng)過體系化的整理,相當(dāng)于人工的建立起更多的結(jié)構(gòu)關(guān)聯(lián),拉近了相似知識(shí)片段間的語義距離,從而使其超越了字符串匹配式的語義計(jì)算方法,作為一項(xiàng)基礎(chǔ)服務(wù)進(jìn)一步提升上層應(yīng)用系統(tǒng)的性能。
第五步,知識(shí)應(yīng)用。
知識(shí)在真實(shí)條件下經(jīng)過有效性和穩(wěn)定性驗(yàn)證后,可在組織內(nèi)部進(jìn)一步推廣應(yīng)用,應(yīng)用層常見的使用方式有兩種,一種是較為通用的技術(shù)型應(yīng)用,如可視化洞察、信息檢索、推薦系統(tǒng)、問答系統(tǒng)等;另一種是具有行業(yè)特色的解決方案型應(yīng)用,如金融反欺詐、快消品營銷、工業(yè)維保等。無論以何種形式服務(wù)于用戶或應(yīng)用層系統(tǒng),均需收集實(shí)際的應(yīng)用反饋結(jié)果,以用于上述步驟的更新優(yōu)化,從而形成閉環(huán)。
第六步,知識(shí)演化。
知識(shí)的有效應(yīng)用并不是終點(diǎn),知識(shí)中臺(tái)帶來的一項(xiàng)額外的增值是促進(jìn)知識(shí)的動(dòng)態(tài)演化,形成良性循環(huán)。隨著內(nèi)外部新知識(shí)片段不斷加入到統(tǒng)一的知識(shí)體系中來,系統(tǒng)及時(shí)發(fā)現(xiàn)已有知識(shí)之間相似性、主動(dòng)的推送給最有可能與之產(chǎn)生交互的人,從而對(duì)已有知識(shí)進(jìn)行更新、促進(jìn)新知識(shí)的應(yīng)用和啟發(fā)式創(chuàng)新。
圖2 六步建設(shè)法
相較于數(shù)據(jù)管理、文檔管理的方式,知識(shí)中臺(tái)在許多方面將帶來更大價(jià)值。
通過知識(shí)表示技術(shù),使知識(shí)同時(shí)表示為人類語言和機(jī)器語言,可解釋性更強(qiáng);通過知識(shí)抽取技術(shù),建立企業(yè)內(nèi)部全局統(tǒng)一視圖,便于全員達(dá)成概念共識(shí);通過知識(shí)增強(qiáng)技術(shù),提升下游應(yīng)用的準(zhǔn)確性,包括可視化洞察、信息檢索、推薦系統(tǒng)、任務(wù)型問答、具有行業(yè)特色的解決方案型應(yīng)用等。
放眼未來,數(shù)字化轉(zhuǎn)型要實(shí)現(xiàn)進(jìn)一步突破,一個(gè)必經(jīng)階段就是在數(shù)字化基礎(chǔ)上搭建知識(shí)中臺(tái)。各類知識(shí)密集型行業(yè)均需建立自己的行業(yè)大腦,行業(yè)大腦將會(huì)成為企業(yè)在市場(chǎng)競(jìng)爭中的戰(zhàn)略控制點(diǎn),由企業(yè)自身運(yùn)營維護(hù),知識(shí)作為企業(yè)資產(chǎn)不斷地沉淀和更新。知識(shí)中臺(tái)將會(huì)成為數(shù)字化轉(zhuǎn)型中打通底層數(shù)據(jù)和上層應(yīng)用的關(guān)鍵組件,幫助企業(yè)解決知識(shí)難留存、難挖掘、難管理、難傳承的問題,為新經(jīng)濟(jì)環(huán)境下的市場(chǎng)競(jìng)爭做戰(zhàn)略布局。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )