“計(jì)算機(jī)閱讀文字的速度是人類的500倍以上,讓計(jì)算機(jī)來做文字類工作非常迅速、效率高、效果好。目前文字類工作100%是人在做,未來我們希望和文字相關(guān)的工作,90%都靠計(jì)算機(jī)來做,最后把關(guān)的10%交給人類。”
“企業(yè)原來靠‘人拉肩扛’的方式處理文檔,我們要讓這些人力更好地釋放出來,更好地享受生活,更好地用在我們社會(huì)的其他重要方面。我們希望五年以后,中國有超過一半的大型企業(yè)能夠用上達(dá)觀的AI技術(shù),來處理它們的文檔資料?!?/span>
消費(fèi)互聯(lián)網(wǎng)和企業(yè)互聯(lián)網(wǎng)領(lǐng)域的認(rèn)知隔閡由來已久,踏入所謂的DT時(shí)代后,黑科技滋生的速度放佛跟不上人們對(duì)自動(dòng)化、智能化美好生活的向往速度,以至于方興未艾的AI似乎很快就在技術(shù)狂熱者那里失了寵,讓位于一個(gè)叫做區(qū)塊鏈的“虛無縹緲”的東西。
實(shí)際上在“古典”的極客網(wǎng)看來,大數(shù)據(jù)、AI的應(yīng)用才剛剛起步。在占據(jù)傳媒頭條的人臉識(shí)別、刷臉支付等錦上添花型應(yīng)用的背后,大家似乎忽略了一個(gè)現(xiàn)實(shí):占據(jù)人們大部分學(xué)習(xí)工作時(shí)間的文字文本,也還存在大量需要被AI化的地方。尤其是在企業(yè)級(jí)市場,倘若職員們能夠從日常繁復(fù)的文字工作中解放出來,那將是一個(gè)多名令人興奮的場景!
帶著這個(gè)認(rèn)知和猜想,極客網(wǎng)日前專訪了達(dá)觀數(shù)據(jù)的CEO陳運(yùn)文——一個(gè)曾經(jīng)打卡于百度、盛大和騰訊,后率兄弟團(tuán)隊(duì)創(chuàng)業(yè)專注于文本智能處理的復(fù)旦大學(xué)計(jì)算機(jī)博士——看看他是如何一門心思將算法和算力“浪費(fèi)”在“古典”的文字文本智能處理(相對(duì)圖像和視頻)領(lǐng)域的。
金融機(jī)構(gòu)過半員工在與文本合同打交道,其實(shí)他們90%的工作可以交給計(jì)算機(jī)
概念可以一日千里,落地卻總是慢條斯理。陳運(yùn)文告訴極客網(wǎng),一個(gè)金融機(jī)構(gòu)里有超過一半的員工日常是在和大量的文本合同打交道,把這些工作自動(dòng)化,以后就不需要人來做,而主要由計(jì)算機(jī)去完成?!斑^去兩年里,我們就是在這個(gè)領(lǐng)域投入大量技術(shù)能力,做核心的技術(shù)攻關(guān)?!?/span>
他指出,金融機(jī)構(gòu)里有大量的員工需要審核合同里的流程,他們要去審核合同是否存在問題,比如數(shù)字是否一致?有沒有法律漏洞?有沒有不合企業(yè)規(guī)范、不合金融行業(yè)監(jiān)管要求的地方?經(jīng)過大量訓(xùn)練后的計(jì)算機(jī),則可以完成其中的絕大部分工作,處理完后再交給人去把關(guān)。
“計(jì)算機(jī)閱讀文字的速度是人類的500倍以上,讓計(jì)算機(jī)來做文字類工作非常迅速、效率高、效果好。”技術(shù)出身的陳運(yùn)文自信地告訴極客網(wǎng),“目前文字類工作100%是人在做,未來我們希望和文字相關(guān)的工作,90%都靠計(jì)算機(jī)來做,最后把關(guān)的10%交給人類?!?/span>
“50%員工日常工作的90%由機(jī)器去完成”,相信企業(yè)經(jīng)營者都知道這背后意味著什么。而且可想象,這樣的場景絕不僅限于金融行業(yè),包括法律、媒體、快消零售等行業(yè),都存在著類似的重復(fù)枯燥的巨量文本文檔處理任務(wù)需要“機(jī)器代人”的解決之道。
陳運(yùn)文告訴極客網(wǎng),定位文本智能處理專家的達(dá)觀數(shù)據(jù),瞄準(zhǔn)的正是這些潛力場景,專注為數(shù)字化轉(zhuǎn)型升級(jí)期的企業(yè)提供完善的文本挖掘、知識(shí)圖譜、搜索引擎和個(gè)性化推薦等文本智能處理技術(shù)服務(wù),幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)化、智能化運(yùn)營,有效提升企業(yè)運(yùn)營效率和經(jīng)營業(yè)績。
“AI員工”又快又好,但培養(yǎng)一名合格的“AI員工”卻并非易事
自動(dòng)化、智能化帶來的結(jié)果很美好,但通向結(jié)果的道路,卻不總是那么順暢。陳運(yùn)文指出,原理其實(shí)很簡單,讓計(jì)算機(jī)做員工的工作,本質(zhì)上就是將計(jì)算機(jī)培養(yǎng)成員工(或許我們可以將之稱為“AI員工”);這個(gè)“AI員工”所做的事和人應(yīng)該做的事差別越小,它就越接近于人類員工,越趨于合格。
在技術(shù)層面,這其實(shí)又是一個(gè)AI領(lǐng)域老生常談的三個(gè)要素的話題,即AI必不可少的數(shù)據(jù)、算法和算力。考慮到文本是最不占IT資源的數(shù)據(jù)類型,因此文本智能處理對(duì)AI技術(shù)的要求又可簡化為數(shù)據(jù)和算法兩大要點(diǎn)。陳運(yùn)文自信地稱,達(dá)觀數(shù)據(jù)的文本智能處理已經(jīng)做到全球領(lǐng)先水平,成為國內(nèi)大型企業(yè)的首選合作伙伴。
達(dá)觀數(shù)據(jù)具體怎么做的呢?陳運(yùn)文告訴極客網(wǎng),在數(shù)據(jù)層面,針對(duì)特定行業(yè),達(dá)觀先是從互聯(lián)網(wǎng)上采集幾十億字的文檔資料,讓計(jì)算機(jī)每天反復(fù)閱讀它們,提取這些文字背后的規(guī)律,讓它逐漸具備人的理解能力,去做分析挖掘。與此同時(shí),特定客戶自己也積累了海量的歷史文本資料,也會(huì)讓計(jì)算機(jī)去閱讀分析這些資料,理解它的每一個(gè)字、每一句話、每一個(gè)段落的含義,以及字詞的組合方式。如此雙重閱讀訓(xùn)練、不斷積累,計(jì)算機(jī)就實(shí)現(xiàn)了理解行業(yè)文本的能力。
如果說大量數(shù)據(jù)訓(xùn)練的“后天努力”非常重要,那么算法模型層面的“先天智商”也同等重要。“AI員工”的“大腦”聰明程度、智慧程度,存在著高下之分。陳運(yùn)文指出,達(dá)觀數(shù)據(jù)有超過100名工程師專注在核心算法模型上,去讓計(jì)算機(jī)具備理解字里行間含義的能力。盡管只有3000左右的常用字,但漢字的組合千變?nèi)f化,這需要計(jì)算機(jī)的大腦進(jìn)化速度遠(yuǎn)快于人腦,同時(shí)“喂”以大量數(shù)據(jù)“糧食”,才能快速成長為合格的“AI員工”。
資料顯示,在核心技術(shù)方面,達(dá)觀數(shù)據(jù)迄今已獲得了30余國家發(fā)明專利,出版了兩本人工智能著作,并發(fā)表了超100篇高質(zhì)量行業(yè)技術(shù)論文。特別是在算法層面,陳運(yùn)文帶隊(duì)的達(dá)觀技術(shù)團(tuán)隊(duì)先后獲得了ACM CIKM Competition國際競賽冠軍、EMI國際黑客馬拉松算法競賽冠軍等多項(xiàng)桂冠。而在合作客戶方面,達(dá)觀數(shù)據(jù)已積累了華為、招商銀行、中國平安、中興、京東、順豐、中國移動(dòng)、和訊財(cái)經(jīng)等數(shù)百家企業(yè)客戶的成功服務(wù)經(jīng)驗(yàn),各細(xì)分領(lǐng)域的“AI員工”都得到了極大的先天+后天錘煉。
達(dá)觀的詩與遠(yuǎn)方:專注企業(yè)服務(wù),解放人力做更有意義的事
當(dāng)被問及對(duì)部分公司利用類似的AI技術(shù),在消費(fèi)互聯(lián)網(wǎng)領(lǐng)域風(fēng)生水起估值上百億的看法時(shí),陳運(yùn)文告訴極客網(wǎng)達(dá)觀數(shù)據(jù)目前還是會(huì)專注在企業(yè)服務(wù)領(lǐng)域,一是因?yàn)槲谋咎幚響?yīng)用面在企業(yè)層面最廣,二來能給社會(huì)創(chuàng)造更多價(jià)值。他預(yù)計(jì),單金融機(jī)構(gòu)中國就超過一萬家,整個(gè)企業(yè)級(jí)的文本智能處理市場規(guī)模是萬億級(jí)別的。
最重要的是,陳運(yùn)文補(bǔ)充道,“企業(yè)原來靠‘人拉肩扛’的方式處理文檔,我們要讓這些人力更好地釋放出來,更好地享受生活,更好地用在我們社會(huì)的其他重要方面。我們希望五年以后,中國有超過一半的大型企業(yè)能夠用上達(dá)觀的AI技術(shù),來處理它們的文檔資料。”
當(dāng)然,他認(rèn)為,這個(gè)過程人們不必?fù)?dān)憂失業(yè)等所謂的AI的副作用,就像120年前福特發(fā)明T型汽車并沒有讓北美15萬馬車車夫無路可走一樣;他們或許轉(zhuǎn)行,或許轉(zhuǎn)做汽車司機(jī),提升了社會(huì)效率,實(shí)現(xiàn)了更大價(jià)值,人生也更有意義。今天包括歐洲和北美,企業(yè)職工的平均工作時(shí)間都低于中國,主要原因就是效率提升使得他們不用滿負(fù)荷工作就能夠享受人生。
但與此同時(shí),陳運(yùn)文對(duì)極客網(wǎng)強(qiáng)調(diào),技術(shù)的發(fā)展從來都不是線性發(fā)展,而是指數(shù)跳躍。一個(gè)新技術(shù)的應(yīng)用和普及,其速度只會(huì)越來越快。無線電普及用了10年時(shí)間,但智能手機(jī)兩三年就滿大街了?!癆I同樣如此,它的速度比以往任何技術(shù)的普及都會(huì)更快。我們很快就會(huì)看到它為企業(yè)帶來的提升效率、節(jié)約成本的效果。很快大量文本處理相關(guān)的工作——包括已知的和未知的——都將主要由計(jì)算機(jī)完成,人只要負(fù)責(zé)思考和下達(dá)指令即可。”
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 泛微·數(shù)智大腦Xiaoe.AI更注重實(shí)際場景落地,為客戶提供真正有價(jià)值的服務(wù)
- TMCU,曦華科技邁出車規(guī)MCU差異化第一步
- 網(wǎng)易數(shù)帆汪源:聚焦“數(shù)智軟件生產(chǎn)”,為組織構(gòu)建獨(dú)特?cái)?shù)智競爭力
- 泛微王晨志:推出低代碼平臺(tái),是基于市場和客戶需求順勢而為
- 決勝遙感大模型時(shí)代!昇騰AI引領(lǐng)AI+遙感融合發(fā)展新范式
- 海量數(shù)據(jù)肖楓:堅(jiān)定融入openGauss生態(tài),逐夢數(shù)字時(shí)代星辰大海
- 卓思洞見:從“客戶至上”到“客戶體驗(yàn)至上”
- 對(duì)話華為朱慧敏:綠色5G助力“雙碳”目標(biāo),控能耗更要提能效
- 專訪易快報(bào)創(chuàng)始人兼CEO馬春荃,多維度助力企業(yè)進(jìn)行費(fèi)控?cái)?shù)字化轉(zhuǎn)型
- 專訪河北移動(dòng)韓斌杰:全國首個(gè)5G泛在千兆地鐵站是如何打造的?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。