人工智能潮起,巨頭紛紛搶灘,薩摩耶數(shù)科會用遷移學習激起怎樣的浪花?

曾幾何時,讓·鮑德里亞說“人工智能的可悲之處在于它不夠巧妙,因而不夠智能。”如今,用這句話描述人工智能已越來越不恰當。

蘋果、特斯拉、滴滴、百度等國內(nèi)外巨頭在無人駕駛上的頻頻加碼,讓無人駕駛技術進入了發(fā)展的快車道。但自動駕駛,只是人工智能的一個細分領域。

“人工智能是我們?nèi)祟愓趶氖碌淖顬樯羁痰难芯糠较蛑?,甚至要比火與電還更加深刻。” 桑德爾·皮猜曾指出。

近期,一項名為“遷移學習”的技術被谷歌、阿里云、薩摩耶數(shù)科等知名企業(yè)頻頻提及,這項技術雖然不如智能駕駛那么“接地氣”,但在商業(yè)應用上的價值卻毫不遜色。

人工智能潮起,巨頭紛紛搶灘,薩摩耶數(shù)科會用遷移學習激起怎樣的浪花?

圖片來源于網(wǎng)絡

無處不在的遷移學習

究竟什么是遷移學習?“你永遠不能理解一種語言——除非你至少理解兩種語言。”英國作家杰弗里·威廉斯的這句話有助于我們理解什么是遷移學習。

不必討論它冗長的概念,只需要思考一些生活中的細節(jié)。在幼兒園學習拼音的時候,老師教我們“a 、o、 e、 i 、u、 ü”,教我們聲母、韻母如何搭配組合;而在我們學習英語的時候,常常自然而然地將一些拼音中的規(guī)律帶到音標中,這就是遷移學習一個常見的應用。

學習一類外語時,人們常常將在學習母語過程中的經(jīng)驗、技巧、習慣、方式不自覺的遷移運用于新語種的學習當中。如果是可借鑒的經(jīng)驗與方法,我們會獲取并且加深這種學習方式,如果是不適用的方法,我們則會放棄,換一種學習方式。

遷移學習的原理與人類學習語言的過程十分相似,在從源領域(比如漢語中拼音)學習的過程中,根據(jù)目標領域(比如英語中的音標)的數(shù)據(jù)特性,來決定是否需要將知識從源領域遷移到目標領域。

數(shù)據(jù)是人工智能的底層基礎,也是人工智能時代最核心的競爭力之一,必然“洛陽紙貴”。

如果源數(shù)據(jù)是“1”,那遷移學習的價值在于,它可以在源數(shù)據(jù)在源領域實現(xiàn)自身“1”的價值的同時,在諸多目標領域實現(xiàn)0.5、0.6乃至0.9的價值;使用遷移學習的新模型在開發(fā)過程中,也不用經(jīng)歷“從0到1”的過程,而是從0.5、0.6乃至0.9起步。

在薩摩耶數(shù)科看來,遷移學習就是“借力打力”,酷似諸葛孔明草船借箭,通過“借力”它將自己學習的框架放大,找到更多更有“能力”的樣本,并且充分利用他們的能力。

如今遷移學習已成為機器學習的基礎研究領域之一,在計算機視覺、文本分類、醫(yī)療健康領域有著廣闊的應用場景,當然也包括金融領域。

“與廣告推薦等領域相比,金融領域獲取的無偏樣本不僅僅需要獲客成本、營銷推廣費用,更需要付出昂貴的客戶逾期成本。而使用遷移學習的時候,就可以直接采用大量的業(yè)務樣本,這種近乎于零成本的樣本獲取方式的優(yōu)勢正是建模樣本所或缺的,能夠解決有標注的樣本的昂貴的產(chǎn)生代價問題。” 薩摩耶數(shù)科人工智能部負責人指出。

薩摩耶數(shù)科是一家以AI為驅動的金融數(shù)字科技公司,現(xiàn)有團隊規(guī)模超450人,其中風控及研發(fā)技術人員占比80%以上,依托人工智能和云計算等技術,為金融機構提供全方位、專業(yè)的數(shù)字金融科技服務。截至2021年一季度,薩摩耶數(shù)科已與包括商業(yè)銀行、消費金融公司在內(nèi)的超100家機構達成合作,累計注冊用戶超7130萬。

而遷移學習就是薩摩耶數(shù)科在人工智能領域廣泛應用的技術之一。

薩摩耶數(shù)科與遷移學習

薩摩耶數(shù)科是國內(nèi)較早將遷移學習應用于金融科技領域的企業(yè)之一。通過結合薩摩耶數(shù)科內(nèi)部常用的自動建模平臺AUTOMAN,薩摩耶數(shù)科開發(fā)了一套合適自身特點和需求的遷移學習工具。

例如在通過AUTOMAN自動建模過程中,在存在兩份建模數(shù)據(jù)集(目標數(shù)據(jù)集、輔助數(shù)據(jù)集)的前提下,通過遷移學習的方式,來調(diào)整兩份樣本中每個樣本實例的權重,通過每一輪的迭代,使得目標數(shù)據(jù)集中的錯分樣本權重提高,同時使得輔助數(shù)據(jù)集中的錯分樣本權重降低;如此,使得輔助數(shù)據(jù)集中有用的樣本可以為建模集所用,而無用的樣本從建模集中剔除,來實現(xiàn)建模數(shù)據(jù)樣本的調(diào)整。

該工具是否真的能通過遷移學習的方法改善建模效果?薩摩耶數(shù)科舉了一個項目實例:

此項目模擬了兩個數(shù)據(jù)集用遷移學習方式改善建模效果的實例,實際的樣本構成如下表所示:

人工智能潮起,巨頭紛紛搶灘,薩摩耶數(shù)科會用遷移學習激起怎樣的浪花?

最終建模效果如下圖所示,在相同的跨時間建模樣本上驗證模型效果,KS從0.328提升到0.406,效果有了非常顯著的提升。盡管兩份數(shù)據(jù)集的正樣本比例有著巨大的差距(圖1所示),但遷移學習可以在迭代的過程中消除這種差異,將可用數(shù)據(jù)為建模數(shù)據(jù)集所用。

人工智能潮起,巨頭紛紛搶灘,薩摩耶數(shù)科會用遷移學習激起怎樣的浪花?

從此項目實例可以看出,遷移學習在金融領域大有可為,而薩摩耶數(shù)科就是這項技術的先行者之一。

經(jīng)過了十余年的發(fā)展,金融科技已經(jīng)走過了一個完整的周期,大浪淘沙之下,穿越周期的企業(yè)很少,其中就有薩摩耶數(shù)科的身影。“穿越周期需要終局思維”薩摩耶數(shù)科董事長林建明曾如此說。

薩摩耶數(shù)科的終局思維體現(xiàn)在哪里?就在諸如遷移學習等人工智能技術上。截止2021年Q1季度,薩摩耶數(shù)科知識產(chǎn)權申請(專利、商標、著作權)418個,行業(yè)獲獎超50項。

6月初,智源研究院理事長張宏江一次活動上指出:在智能化時代,AI已經(jīng)像電力一樣變成無所不在的能力,數(shù)據(jù)已經(jīng)像燃料一樣變得隨處都需要。

誠然,人工智能早已不再是局限于圍棋上的阿爾法狗,它與我們的生活聯(lián)系越來越緊密,若說AI是“電力”,數(shù)據(jù)是“燃料”,那遷移學習這類技術是什么呢?在薩摩耶數(shù)科看來,它是人類在提升“燃料”使用效率的探索,就像人類對內(nèi)燃機的改進和研究。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )