專訪丨文因互聯(lián)CEO鮑捷:連接一切,建起金融數(shù)據(jù)的高速公路

新一代科技革命蓬勃發(fā)展,不斷催生新的產(chǎn)業(yè)形態(tài)和商業(yè)模式。金融行業(yè)在歷經(jīng)電子化、移動化之后,也進入了金融與科技相結合的新階段-智能金融時代。因為與數(shù)據(jù)高度相關,金融行業(yè)也一直被認為是人工智能落地最好、最快、最有商業(yè)價值的場景。

2018年12月14至16日,由中國人工智能學會、永泰縣人民政府主辦,中國科學技術出版社協(xié)辦的第二期全球高?!度斯ぶ悄軐д摗穾熧Y培訓班在福州永泰縣召開。文因互聯(lián)CEO鮑捷在現(xiàn)場帶來了關于知識圖譜的報告。會后,億歐就智能金融和人工智能等相關問題專訪了鮑捷。

文因互聯(lián)是一家智能金融解決方案提供商,主要利用自然語言處理和知識圖譜技術,對金融數(shù)據(jù)進行結構化提取和智能化分析。整合金融機構內外部數(shù)據(jù),從而利用銀行、監(jiān)管機構,基金證券等持有的海量數(shù)據(jù),實現(xiàn)監(jiān)管、獲客、風控等場景的自動化。累計服務了招商銀行、平安銀行、南京銀行、普華永道、天風證券等多家金融機構。目前,文因互聯(lián)正在進行下一輪的融資。

知識圖譜-催化劑、濃縮軸和打折卡

當我們談到智能金融的技術基石時,更多的人會說機器學習、自然語言理解等,但很少有人會提到知識圖譜。但是在眾多的智能金融應用場景中,如智能風控、智能投顧、智能投研、智能監(jiān)管等,很多時候都是機器學習和知識圖譜共同發(fā)揮作用的結果。

知識圖譜最早由Google公司在2012年提出。從學術的角度,我們可以對知識圖譜給一個這樣的定義:知識圖譜本質上是一種叫做語義網(wǎng)絡的知識庫。從實際應用的角度出發(fā)其實可以簡單地把知識圖譜理解成多關系圖。

鮑捷從1998年開始從事人工智能方面的研究,主要聚焦在語義網(wǎng)/知識圖譜。鮑捷表示,他對具體算法過程不感興趣,如何解決問題才是他的興趣所在。他本人有個窮盡一生想要解決的目標,那就是將世界所有的知識聯(lián)系在一起,而知識圖譜能幫助他完成這一目標。

知識圖譜可以說是一種應用于諸多人工智能相關領域的關鍵技術,它主要應用于數(shù)據(jù)結構化處理、解析、關聯(lián)和后續(xù)的分析與推理。按照鮑捷的話說,知識圖譜是一種催化劑,濃縮軸和打折卡。一方面它能加速價值的產(chǎn)生,在數(shù)據(jù)聚合中產(chǎn)生新的數(shù)據(jù),例如本體映射;另一方面它可以提煉大量知識和數(shù)據(jù),是一種流動性好,摩擦力特別小的數(shù)據(jù),例如百科數(shù)據(jù);它同時也是能降低成本,利用先驗知識大幅提高價值的數(shù)據(jù),例如基因本體。

“目前國內做智能金融的企業(yè)主要聚焦在智能投顧和智能投研方面,人工智能應用在金融行業(yè)應用的切入點不應該是這樣的?!滨U捷表示,我們所講的金融大工業(yè)化,增強的不應該只是一兩個人的能力,而是多人協(xié)作的能力。它的核心問題是如何實現(xiàn)金融知識結構的沉淀和業(yè)務流程的自動化。

這個難點在于怎樣做到用機器理解文檔,并且讓機器理解金融知識。前一項技術涉及自然語言處理技術,后一項技術涉及知識圖譜技術。文因互聯(lián)所做的事情就是結合這兩項技術,在金融行業(yè)進行落地。這就要求企業(yè)具備全鏈條的數(shù)據(jù)結構化能力,包括財務報表的公開化提取能力,還有公告、研報、法規(guī)的解析,解析后再進行實體鏈接,映射到知識圖譜上,之后是規(guī)則建模與推理、語義搜索、自然語言問答。

鮑捷告訴億歐,希望能在5年時間內,在所有的金融機構、政府、研究機構間構造出一個巨大的近乎實時的數(shù)據(jù)分發(fā)網(wǎng)絡,即“金融數(shù)據(jù)高速公路”,加快各金融機構間的信息流通速度。

實現(xiàn)AI,不一定需要先了解人腦

歷史上,人工智能經(jīng)歷了三起兩落。鮑捷表示,未來30年,人工智能會也會繼續(xù)呈現(xiàn)這種上下波動的趨勢。但是這次的熱潮肯定跟前幾次的不一樣,鮑捷給出了以下幾點理由:

首先,AI已經(jīng)結合很多具體場景落地到產(chǎn)業(yè)上,有些行業(yè)已經(jīng)創(chuàng)造了幾十億的產(chǎn)值;其次,從投資上看,之前的AI發(fā)展主要靠政府和軍方在做支撐,而這次資本的入駐已經(jīng)給AI的發(fā)展提供了大量的助推器;此外,工智能的發(fā)展,離不開其他技術的支持,如大數(shù)據(jù)、云。舉個簡單的例子,假設我們想造一輛車,光擁有AI這么一塊內燃機是不夠的。云、大數(shù)據(jù)、運維系統(tǒng),這一整套相當于我們車的輪子,傳送機制,保險機制。只有結合這些東西,才能造出一輛車,在公路上飛速馳騁。

“我們現(xiàn)在的AI就好像一個破破爛爛的車子,經(jīng)常漏氣漏油,但起碼還能用?!滨U捷笑著說道。

事實上,現(xiàn)在在人工智能領域已經(jīng)產(chǎn)生了一條特別長的產(chǎn)業(yè)鏈條。比如上游有上百萬的數(shù)據(jù)標注師,下游有各種各樣的應用場景。一個產(chǎn)業(yè)的成熟一定是建立在產(chǎn)業(yè)鏈完善的基礎上的。任何行業(yè)都會存在泡沫,AI繼續(xù)崩盤的情況也有可能會出現(xiàn)。但是當浪潮退去,剩下一地雞毛后,能留下來的都是人才,都是好的企業(yè)。

現(xiàn)在很多人都認為要實現(xiàn)AI,需要建立在先了解大腦機制的基礎上。鮑捷并不贊成這樣的觀點。舉個簡單的例子,飛機飛上天時,我們還沒有空氣動力學這樣的理論;在蒸汽機出現(xiàn)的時候,也還不存在熱力學這一理論。AI也是如此。只有當產(chǎn)業(yè)界做出產(chǎn)品并開始盈利后,才能形成持續(xù)回饋科學的機制,帶動學界去給我們解釋為什么,然后再靠科學帶我們沖出這片“無人區(qū)”。

“產(chǎn)業(yè)界講究成本。工程師們往往需要混合使用幾百種方法,去不斷地試錯來完成項目,就像用漿糊把各種零件貼在一起一樣。在缺乏足夠理論知識下,我們今天做的事跟當年的阿波羅登月項目差不多,就是要用落后的技術實現(xiàn)20年后的效果?!滨U捷說。

專訪人物

鮑捷,文因互聯(lián)CEO,聯(lián)合創(chuàng)始人。研究領域涉及人工智能多個方向,如自然語言處理、語義網(wǎng)、機器學習、描述邏輯、語義維基、上下文建模、語義信息論、規(guī)則語言、封閉世界推理、策略建模、語義數(shù)據(jù)集成、模塊化本體、協(xié)作本體構建、網(wǎng)絡隱私保護、神經(jīng)網(wǎng)絡、數(shù)據(jù)挖掘和圖像識別等。在International Joint Conferences on Artificial Intelligence(IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC),和Asian Semantic Web Conference (ASWC)等期刊和會議上發(fā)表70多篇論文。曾任W3C OWL(Web本體語言)工作組成員,在此期間,合作撰寫了OWL2的W3C規(guī)范文檔。先后參與組織50多場國際學術會議和學術研討會,并任中國中文信息學會語言與知識計算專業(yè)委員會委員、W3C顧問委員會委員、中國計算機協(xié)會會刊編委,中文開放知識圖譜聯(lián)盟(OpenKG)發(fā)起人之一。


相關閱讀推薦:

聚焦AI教學,全球高校《人工智能導論》師資培訓班召開

專訪丨南京大學高陽教授:并非取代!研究AI是為了幫助人類

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-12-25
專訪丨文因互聯(lián)CEO鮑捷:連接一切,建起金融數(shù)據(jù)的高速公路
新一代科技革命蓬勃發(fā)展,不斷催生新的產(chǎn)業(yè)形態(tài)和商業(yè)模式。金融行業(yè)在歷經(jīng)電子化、移動化之后,也進入了金融與科技相結合的新階段-智能金融時代。因為與數(shù)據(jù)高度相關,金融行業(yè)一直被認為是人工智能落地最好、最快的場景。

長按掃碼 閱讀全文