專訪丨文因互聯(lián)CEO鮑捷:連接一切,建起金融數(shù)據(jù)的高速公路

新一代科技革命蓬勃發(fā)展,不斷催生新的產(chǎn)業(yè)形態(tài)和商業(yè)模式。金融行業(yè)在歷經(jīng)電子化、移動化之后,也進入了金融與科技相結(jié)合的新階段-智能金融時代。因為與數(shù)據(jù)高度相關(guān),金融行業(yè)也一直被認為是人工智能落地最好、最快、最有商業(yè)價值的場景。

2018年12月14至16日,由中國人工智能學(xué)會、永泰縣人民政府主辦,中國科學(xué)技術(shù)出版社協(xié)辦的第二期全球高?!度斯ぶ悄軐?dǎo)論》師資培訓(xùn)班在福州永泰縣召開。文因互聯(lián)CEO鮑捷在現(xiàn)場帶來了關(guān)于知識圖譜的報告。會后,億歐就智能金融和人工智能等相關(guān)問題專訪了鮑捷。

文因互聯(lián)是一家智能金融解決方案提供商,主要利用自然語言處理和知識圖譜技術(shù),對金融數(shù)據(jù)進行結(jié)構(gòu)化提取和智能化分析。整合金融機構(gòu)內(nèi)外部數(shù)據(jù),從而利用銀行、監(jiān)管機構(gòu),基金證券等持有的海量數(shù)據(jù),實現(xiàn)監(jiān)管、獲客、風(fēng)控等場景的自動化。累計服務(wù)了招商銀行、平安銀行、南京銀行、普華永道、天風(fēng)證券等多家金融機構(gòu)。目前,文因互聯(lián)正在進行下一輪的融資。

知識圖譜-催化劑、濃縮軸和打折卡

當我們談到智能金融的技術(shù)基石時,更多的人會說機器學(xué)習(xí)、自然語言理解等,但很少有人會提到知識圖譜。但是在眾多的智能金融應(yīng)用場景中,如智能風(fēng)控、智能投顧、智能投研、智能監(jiān)管等,很多時候都是機器學(xué)習(xí)和知識圖譜共同發(fā)揮作用的結(jié)果。

知識圖譜最早由Google公司在2012年提出。從學(xué)術(shù)的角度,我們可以對知識圖譜給一個這樣的定義:知識圖譜本質(zhì)上是一種叫做語義網(wǎng)絡(luò)的知識庫。從實際應(yīng)用的角度出發(fā)其實可以簡單地把知識圖譜理解成多關(guān)系圖。

鮑捷從1998年開始從事人工智能方面的研究,主要聚焦在語義網(wǎng)/知識圖譜。鮑捷表示,他對具體算法過程不感興趣,如何解決問題才是他的興趣所在。他本人有個窮盡一生想要解決的目標,那就是將世界所有的知識聯(lián)系在一起,而知識圖譜能幫助他完成這一目標。

知識圖譜可以說是一種應(yīng)用于諸多人工智能相關(guān)領(lǐng)域的關(guān)鍵技術(shù),它主要應(yīng)用于數(shù)據(jù)結(jié)構(gòu)化處理、解析、關(guān)聯(lián)和后續(xù)的分析與推理。按照鮑捷的話說,知識圖譜是一種催化劑,濃縮軸和打折卡。一方面它能加速價值的產(chǎn)生,在數(shù)據(jù)聚合中產(chǎn)生新的數(shù)據(jù),例如本體映射;另一方面它可以提煉大量知識和數(shù)據(jù),是一種流動性好,摩擦力特別小的數(shù)據(jù),例如百科數(shù)據(jù);它同時也是能降低成本,利用先驗知識大幅提高價值的數(shù)據(jù),例如基因本體。

“目前國內(nèi)做智能金融的企業(yè)主要聚焦在智能投顧和智能投研方面,人工智能應(yīng)用在金融行業(yè)應(yīng)用的切入點不應(yīng)該是這樣的?!滨U捷表示,我們所講的金融大工業(yè)化,增強的不應(yīng)該只是一兩個人的能力,而是多人協(xié)作的能力。它的核心問題是如何實現(xiàn)金融知識結(jié)構(gòu)的沉淀和業(yè)務(wù)流程的自動化。

這個難點在于怎樣做到用機器理解文檔,并且讓機器理解金融知識。前一項技術(shù)涉及自然語言處理技術(shù),后一項技術(shù)涉及知識圖譜技術(shù)。文因互聯(lián)所做的事情就是結(jié)合這兩項技術(shù),在金融行業(yè)進行落地。這就要求企業(yè)具備全鏈條的數(shù)據(jù)結(jié)構(gòu)化能力,包括財務(wù)報表的公開化提取能力,還有公告、研報、法規(guī)的解析,解析后再進行實體鏈接,映射到知識圖譜上,之后是規(guī)則建模與推理、語義搜索、自然語言問答。

鮑捷告訴億歐,希望能在5年時間內(nèi),在所有的金融機構(gòu)、政府、研究機構(gòu)間構(gòu)造出一個巨大的近乎實時的數(shù)據(jù)分發(fā)網(wǎng)絡(luò),即“金融數(shù)據(jù)高速公路”,加快各金融機構(gòu)間的信息流通速度。

實現(xiàn)AI,不一定需要先了解人腦

歷史上,人工智能經(jīng)歷了三起兩落。鮑捷表示,未來30年,人工智能會也會繼續(xù)呈現(xiàn)這種上下波動的趨勢。但是這次的熱潮肯定跟前幾次的不一樣,鮑捷給出了以下幾點理由:

首先,AI已經(jīng)結(jié)合很多具體場景落地到產(chǎn)業(yè)上,有些行業(yè)已經(jīng)創(chuàng)造了幾十億的產(chǎn)值;其次,從投資上看,之前的AI發(fā)展主要靠政府和軍方在做支撐,而這次資本的入駐已經(jīng)給AI的發(fā)展提供了大量的助推器;此外,工智能的發(fā)展,離不開其他技術(shù)的支持,如大數(shù)據(jù)、云。舉個簡單的例子,假設(shè)我們想造一輛車,光擁有AI這么一塊內(nèi)燃機是不夠的。云、大數(shù)據(jù)、運維系統(tǒng),這一整套相當于我們車的輪子,傳送機制,保險機制。只有結(jié)合這些東西,才能造出一輛車,在公路上飛速馳騁。

“我們現(xiàn)在的AI就好像一個破破爛爛的車子,經(jīng)常漏氣漏油,但起碼還能用?!滨U捷笑著說道。

事實上,現(xiàn)在在人工智能領(lǐng)域已經(jīng)產(chǎn)生了一條特別長的產(chǎn)業(yè)鏈條。比如上游有上百萬的數(shù)據(jù)標注師,下游有各種各樣的應(yīng)用場景。一個產(chǎn)業(yè)的成熟一定是建立在產(chǎn)業(yè)鏈完善的基礎(chǔ)上的。任何行業(yè)都會存在泡沫,AI繼續(xù)崩盤的情況也有可能會出現(xiàn)。但是當浪潮退去,剩下一地雞毛后,能留下來的都是人才,都是好的企業(yè)。

現(xiàn)在很多人都認為要實現(xiàn)AI,需要建立在先了解大腦機制的基礎(chǔ)上。鮑捷并不贊成這樣的觀點。舉個簡單的例子,飛機飛上天時,我們還沒有空氣動力學(xué)這樣的理論;在蒸汽機出現(xiàn)的時候,也還不存在熱力學(xué)這一理論。AI也是如此。只有當產(chǎn)業(yè)界做出產(chǎn)品并開始盈利后,才能形成持續(xù)回饋科學(xué)的機制,帶動學(xué)界去給我們解釋為什么,然后再靠科學(xué)帶我們沖出這片“無人區(qū)”。

“產(chǎn)業(yè)界講究成本。工程師們往往需要混合使用幾百種方法,去不斷地試錯來完成項目,就像用漿糊把各種零件貼在一起一樣。在缺乏足夠理論知識下,我們今天做的事跟當年的阿波羅登月項目差不多,就是要用落后的技術(shù)實現(xiàn)20年后的效果?!滨U捷說。

專訪人物

鮑捷,文因互聯(lián)CEO,聯(lián)合創(chuàng)始人。研究領(lǐng)域涉及人工智能多個方向,如自然語言處理、語義網(wǎng)、機器學(xué)習(xí)、描述邏輯、語義維基、上下文建模、語義信息論、規(guī)則語言、封閉世界推理、策略建模、語義數(shù)據(jù)集成、模塊化本體、協(xié)作本體構(gòu)建、網(wǎng)絡(luò)隱私保護、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘和圖像識別等。在International Joint Conferences on Artificial Intelligence(IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC),和Asian Semantic Web Conference (ASWC)等期刊和會議上發(fā)表70多篇論文。曾任W3C OWL(Web本體語言)工作組成員,在此期間,合作撰寫了OWL2的W3C規(guī)范文檔。先后參與組織50多場國際學(xué)術(shù)會議和學(xué)術(shù)研討會,并任中國中文信息學(xué)會語言與知識計算專業(yè)委員會委員、W3C顧問委員會委員、中國計算機協(xié)會會刊編委,中文開放知識圖譜聯(lián)盟(OpenKG)發(fā)起人之一。


相關(guān)閱讀推薦:

聚焦AI教學(xué),全球高?!?a href="http://m.ygpos.cn/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能導(dǎo)論》師資培訓(xùn)班召開

專訪丨南京大學(xué)高陽教授:并非取代!研究AI是為了幫助人類

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-12-25
專訪丨文因互聯(lián)CEO鮑捷:連接一切,建起金融數(shù)據(jù)的高速公路
新一代科技革命蓬勃發(fā)展,不斷催生新的產(chǎn)業(yè)形態(tài)和商業(yè)模式。金融行業(yè)在歷經(jīng)電子化、移動化之后,也進入了金融與科技相結(jié)合的新階段-智能金融時代。因為與數(shù)據(jù)高度相關(guān),金融行業(yè)一直被認為是人工智能落地最好、最快的場景。

長按掃碼 閱讀全文