藏在實習(xí)生招聘里的“行業(yè)公式”:AI如何解決“中國式問題”

原標(biāo)題:藏在實習(xí)生招聘里的“行業(yè)公式”:AI如何解決“中國式問題”

我們經(jīng)常說,今天人工智能的核心矛盾,是打開新聞發(fā)現(xiàn)“wow!AI好厲害”和回到工作中悲嘆“人工智能在哪里……”之間的矛盾。

對于中國千百萬具體行業(yè)來說,今天人工智能還是朦朦朧朧、似是而非的一件事。找一下本行業(yè)和AI相關(guān)的動向,一般我們會發(fā)現(xiàn)三樣?xùn)|西:

1. 歐美某AI公司做了一個本行業(yè)應(yīng)用。奈何遠(yuǎn)在天邊,也不怎么符合國情。

2. 某論文里提出了AI新技術(shù)??墒堑鹊綉?yīng)用,也不知道自己退休了沒有……

3. 某創(chuàng)業(yè)公司的PPT里有相關(guān)技術(shù)。一般這種比較傲嬌,遲遲不想從PPT里走下來……

綜合起來看,今天在面對AI時,中國市場上各行業(yè)的普遍困惑是:AI聽起來很美,看上去很遠(yuǎn),大家又不敢貿(mào)然當(dāng)?shù)谝粋€吃螃蟹的人。心動和行動之間,缺少一個靈光一閃的可行性方案。

說得更直白點,傳統(tǒng)行業(yè)和各個企業(yè),缺乏的是一套能夠復(fù)制、符合實際需求的解決問題思路。最好有個公式,讓各個行業(yè)可以一鍵粘貼,得到快速并有價值的AI方案。

今天讓我們來研究一個真實案例,試著一起來找到一個這樣的“公式”。當(dāng)然,案例本身也頗具價值,因為它發(fā)生在一個任何企業(yè)都可能邂逅的領(lǐng)域:在線招聘。

前不久,腦極體采訪了云腦科技(沒錯,我們都是腦字輩的)聯(lián)合創(chuàng)始人&COO龍志勇。作為一家跨越中美兩國的人工智能行業(yè)平臺公司,云腦科技的商業(yè)模式就是利用深度學(xué)習(xí)產(chǎn)品為傳統(tǒng)行業(yè)服務(wù)。在他們與百度、實習(xí)僧共同推進(jìn)的智能招聘項目中,AI與中國式互聯(lián)網(wǎng)問題的膠著碰撞可謂暴露無遺。

絕不小的“小問題”:中國式實習(xí)生招聘

讓我們先來了解下,人力資源領(lǐng)域的“中國式問題”。

在歐美國家,人力的昂貴、人才流通的需求頻率相對較緩,加上監(jiān)管的嚴(yán)謹(jǐn)性,都讓人力資源事業(yè)處在相對較“穩(wěn)”的曲線中。而AI進(jìn)入人力資源領(lǐng)域,也更多是從智能獵頭、背景審核等輔助功能的AI化開始。

但在中國,互聯(lián)網(wǎng)招聘的人才虹吸效應(yīng)以及巨大的人力缺口,導(dǎo)致今天的人力資源必須實現(xiàn)快進(jìn)快出。如果不能高效準(zhǔn)確找到人才,企業(yè)甚至很可能被產(chǎn)能拖垮。這就讓“快”成了中國HR的第一準(zhǔn)則。

但僅僅快還不夠,HR同時還要準(zhǔn)。如果面試錄取率不佳,企業(yè)會直接質(zhì)疑HR的職業(yè)能力。這導(dǎo)致很多HR同學(xué)常年在業(yè)務(wù)部門需求和大量雷同的簡歷中無盡掙扎。而在招聘實習(xí)生時,類似問題會尤其凸顯。

因為實習(xí)生招聘中很可能會遇到這樣幾個尷尬:

1. 簡歷特別多,看完就已經(jīng)暈了。

2. 由于投遞者都是在校學(xué)生,很難明確職業(yè)意向。簡歷與職位需求經(jīng)常存在偏差。

3. 實習(xí)生簡歷內(nèi)容簡單雷同,HR難以判斷取舍。

這些因素的堆疊,導(dǎo)致實習(xí)生招聘很可能在企業(yè)中變成缺乏效率、高流失率,并且沒什么科學(xué)依據(jù)的工作。而在互聯(lián)網(wǎng)時代,企業(yè)招聘實習(xí)生又大量依托線上平臺。特有痛點+線上存量數(shù)據(jù)+AI,會不會有什么意外驚喜呢?

百度+云腦:一個人力資源問題的AI解決方案

采訪中我們了解到,國內(nèi)著名實習(xí)生招聘平臺“實習(xí)僧”與云腦科技的深度合作中,共同完成了AI人才庫:利用實習(xí)僧平臺上留存的招聘數(shù)據(jù),云腦訓(xùn)練匹配模型,以此實現(xiàn)以AI進(jìn)行初步簡歷篩選。

顯然,這個AI解決方案旨在解決HR實習(xí)招聘的真實痛點,實習(xí)僧平臺沉積的幾十萬職位描述和幾百萬簡歷數(shù)據(jù)也為深度學(xué)習(xí)提供了優(yōu)厚的條件。那么接下來的問題是,到底如何讓美好的技術(shù)想象變?yōu)楝F(xiàn)實。

為了讓AI輔助HR,更好地完成實習(xí)生簡歷初篩問題,云腦使用實習(xí)生招聘環(huán)節(jié)中的三個重要數(shù)據(jù):HR發(fā)布的職位描述文本;HR瀏覽、標(biāo)記和發(fā)出面試邀約的簡歷文本數(shù)據(jù);學(xué)生們的簡歷文本、瀏覽記錄與選擇投遞的公司與職位描述。

為了統(tǒng)籌這些文本數(shù)據(jù)和行為數(shù)據(jù),云腦結(jié)合門禁卷積神經(jīng)網(wǎng)絡(luò)(Gated CNN)和注意力機制,訓(xùn)練適用于招聘領(lǐng)域的門禁卷積神經(jīng)網(wǎng)絡(luò)(Gated Query Model, GQM),在保證文本匹配準(zhǔn)確性的同時,還能提供匹配的細(xì)節(jié)。最終實現(xiàn)了HR在平臺發(fā)布職位描述后,模型自動檢索匹配庫內(nèi)海量簡歷,實現(xiàn)分鐘級的匹配,并按照匹配度倒序推薦給HR。

在這里我們當(dāng)然沒有必要解釋算法背后的函數(shù)關(guān)系,但有幾點技術(shù)邏輯卻是值得我們注意的。因為在今天中國的AI與行業(yè)結(jié)合中,這些問題會反復(fù)經(jīng)常出現(xiàn)。

1.需要適應(yīng)中文的獨特性

我們了解到,在針對中國互聯(lián)網(wǎng)招聘數(shù)據(jù)進(jìn)行簡歷與需求的精準(zhǔn)匹配時,云腦面對的首要問題是解決中文自然語言處理場景中,中文分詞、詞性標(biāo)注、句法分析等缺乏技術(shù)借鑒鏡像的問題,在降低了文本向量維度的同時,也需要保留文本語義信息,兼顧算法的處理效率。

2.克服有效數(shù)據(jù)困境

互聯(lián)網(wǎng)招聘平臺數(shù)據(jù)僅僅能有效記錄,HR瀏覽了哪些實習(xí)生簡歷、發(fā)出了哪些面試邀約是比較容易記錄的。但在這之后,現(xiàn)場面試反饋記錄、錄用情況,甚至錄用之后的實習(xí)效果,就都是互聯(lián)網(wǎng)平臺難以記錄的了。

為了解決實習(xí)僧平臺數(shù)據(jù)不閉環(huán)的問題,云腦先根據(jù)場景定制化了一個簡單可快速上線的模型,搜集HR針對每個崗位描述發(fā)出的面試邀約。用來搜集可用于深度學(xué)習(xí)的數(shù)據(jù)樣本。當(dāng)真實的招聘需求、獲得面試邀約者基本信息及雙方的行為數(shù)據(jù)量足夠之后,再進(jìn)行第二階段的深度模型的迭代,通過文本分析、數(shù)據(jù)挖掘和行為學(xué)習(xí),自動捕捉企業(yè)用人偏好,防止錯失潛在的優(yōu)秀簡歷和候選人。

3.解決開發(fā)框架問題

與很多主流AI創(chuàng)業(yè)公司不同,云腦在開發(fā)智能招聘算法時,沒有采用歐美主流開發(fā)框架,比如TensorFlow、Caffe等等,而是用到了百度的PaddlePaddle。采訪中聊到這個問題時,云腦方面表示,根據(jù)他們的測試和實踐,TensorFlow等開發(fā)框架雖然社區(qū)資源會更齊備,但由于這些框架不一定能滿足商業(yè)應(yīng)用場景中對速度與效率的追求。

與歐美框架相比,PaddlePaddle從一開始就為了解決并行計算問題,其利用GPU的并行度更強。也就是說,在同等數(shù)據(jù)相同網(wǎng)絡(luò)結(jié)構(gòu)的條件下,PaddlePaddle展現(xiàn)出了更快的速度強大效率。

根據(jù)我們的觀察,這也不是個孤立問題。越來越多的AI公司投入產(chǎn)業(yè)實戰(zhàn)當(dāng)中時,都會發(fā)現(xiàn)訓(xùn)練框架對大規(guī)模應(yīng)用的友好程度,直接決定了企業(yè)的商業(yè)化進(jìn)度。這種情況下,性能更好,更支持大規(guī)模應(yīng)用的框架顯然占據(jù)優(yōu)勢。

此外,基于PaddlePaddle的生態(tài)合作,也為AI企業(yè)開發(fā)基于中文互聯(lián)網(wǎng)數(shù)據(jù)的算法提供了支撐。比如PaddlePaddle會提供更多專項中文數(shù)據(jù)集,并且開放了近20種工業(yè)級模型,比如語音識別、文本分類、圖像分類、機器翻譯、物體識別等,這些能力適合中國國情和中國企業(yè)融匯進(jìn)入AI世界。

從基礎(chǔ)訓(xùn)練到分布架構(gòu)徹底開源,由于PaddlePaddle今天在中國AI產(chǎn)業(yè)中的獨特性和生態(tài)價值,其也被視為“最適合中國國情的深度學(xué)習(xí)框架”。

于是我們看到,在云腦的算法模型和百度PaddlePaddle的無間合作下,智能招聘實習(xí)生這時似乎真的看到了曙光。

據(jù)說,效果是企業(yè)每招一個人,能省160塊

招聘平臺加算法的效果如何評價,最終當(dāng)然要數(shù)據(jù)說了算。采訪者我們了解到了一些有意思的數(shù)據(jù),或者可以說明這個商業(yè)智能應(yīng)用的直觀價值。

1. 企業(yè)招聘速度提升,更主要的是,省錢了……

對算法加入前后的邀約率分析,智能招聘算法上線之后,將簡歷初篩這個高時間成本的找簡歷、看簡歷和篩簡歷過程,優(yōu)化為HR根據(jù)AI推薦簡歷,發(fā)出面試邀約一步,面試邀約率實現(xiàn)了5倍提升,推薦的成功率比之前提高了50%,大大提升了HR的工作效率。

企業(yè)更快找到人才,招聘速率被提升后,企業(yè)每招到一個人的成本約可降低160塊人民幣。算法已服務(wù)了3萬余個崗位的精準(zhǔn)匹配,累積優(yōu)勢十分可觀。

2. 優(yōu)化招聘需求,提升HR精度

在效率提高、成本下降之外,AI招聘帶給企業(yè)的新想象力,是企業(yè)可以更好地招到原先容易錯失的人才。

以教育機構(gòu)好未來當(dāng)前正在招聘機器學(xué)習(xí)實習(xí)生為例,在新興的垂直技術(shù)領(lǐng)域,比如機器學(xué)習(xí)、區(qū)塊鏈等,HR通常面臨著不知道要招聘什么人才、也不知道去哪里找到他們等問題。使用了AI(H)后,可根據(jù)企業(yè)所在的行業(yè)、職業(yè)描述所在的專業(yè)領(lǐng)域、借鑒其他企業(yè)的招聘案例等,自動匹配到在垂直領(lǐng)域有相似科研經(jīng)驗、項目實踐經(jīng)驗和獲得類似面試邀約的候選人,有效協(xié)助HR更好的在新興的技術(shù)領(lǐng)域搜尋人才。

這對于企業(yè)發(fā)展的助力,或許是難以用量化金錢來衡量的。

3. 提升深度模型的可解釋性

深度學(xué)習(xí)模型本身具有不可解釋性,但在力求公平公正的招聘場景下,企業(yè)仍舊存在一些使用疑慮。云腦針對這類的場景需求,在智能招聘算法中,改進(jìn)了模型設(shè)計,在保留了模型表達(dá)能力的基礎(chǔ)上,解釋需求與簡歷間的文本特征匹配關(guān)系。企業(yè)和應(yīng)聘者在使用精準(zhǔn)匹配的過程中,不僅能夠幫助HR找到最符合的應(yīng)聘者、幫助應(yīng)聘者找到最符合的HR,同時還能夠給予雙方一份詳細(xì)的建議理由。

從個案到“公式”:AI如何解決互聯(lián)網(wǎng)時代的問題

通過以上云腦、百度、實習(xí)僧,加上若干應(yīng)用企業(yè)參與的整個案例。我們可以看出AI在招聘這件事上也是可以大展拳腳的。

但更有價值的信息,是我們可以從整個合作關(guān)系中發(fā)現(xiàn),解決某個傳統(tǒng)行業(yè)或者企業(yè)通識問題,AI到底如何來開啟第一步。

在智能招聘案例中,首要解決的是數(shù)據(jù)問題。缺失了可進(jìn)行深度學(xué)習(xí)訓(xùn)練的有特征數(shù)據(jù),那么一切都白搭。這個案例中,線上招聘平臺實習(xí)僧成為了數(shù)據(jù)輸出者。在互聯(lián)網(wǎng)時代,很多數(shù)據(jù)都留存在平臺上,這給更多行業(yè)以想象空間。但如果想要深入到企業(yè)內(nèi)部流程當(dāng)中,本行業(yè)本企業(yè)的線下數(shù)據(jù)也是重中之重。而如何確保數(shù)據(jù)安全性,以及組成企業(yè)、行業(yè)、平臺間的數(shù)據(jù)對接,將是接下來AI產(chǎn)業(yè)發(fā)展中的任務(wù)。

接下來,是云腦這樣的AI公司,結(jié)合實習(xí)僧的數(shù)據(jù)提出了一系列垂直于行業(yè)的解決方案。這其中有大量中文,或者中國產(chǎn)業(yè)格局里必須要克服的問題,基本功不過硬肯定不行。

此外,百度提供的PaddlePaddle也成為了AI能夠商業(yè)化工作的前提。適應(yīng)中國企業(yè)需求,善于支持AI并行計算與大規(guī)模部署的AI平臺,顯然不是創(chuàng)業(yè)公司能夠負(fù)擔(dān)得起的,而海外平臺又不接地氣。

因此上,百度這樣平臺級別的輸出能力就會成為主要解決方案。而平臺的價值,也不僅僅是能力輸出,而是綜合資本、流量、影響力、技術(shù)解決能力的示范價值與生態(tài)化賦能產(chǎn)業(yè)基礎(chǔ)。比如百度就基于PaddlePaddle及其開放能力建立了PaddlePaddle訓(xùn)練營,為開發(fā)者和企業(yè)提供轉(zhuǎn)型和應(yīng)用AI的平臺,既有針對開發(fā)者的系列課程培訓(xùn)、線上線下活動,也有面向企業(yè)的AI市場。假如百度本身平臺的品牌扶持與價值培養(yǎng)能力,對于具體行業(yè)問題的引導(dǎo)是多方面的。

或許到此我們可以看出,算法創(chuàng)新、行業(yè)數(shù)據(jù)、平臺三者構(gòu)成了一個產(chǎn)業(yè)共生體,通過三方面不能或缺的能力,集合式為第四方解決了問題。

在AI距離應(yīng)用較遠(yuǎn)、成本相對模糊的條件下,理解這樣一個公式或者可以成為企業(yè)探索AI的支點:你的產(chǎn)業(yè)到AI之間,是否有數(shù)據(jù)、算法、平臺這樣一個三角形產(chǎn)業(yè)關(guān)系。而它們間的產(chǎn)業(yè)合作能力又是否能被企業(yè)接受。

在更多的人才和更普及的AI能力之前,運用恰當(dāng)?shù)漠a(chǎn)業(yè)合作來實現(xiàn)AI,幾乎是唯一的正路。

面對十分復(fù)雜的中國式問題,或許我們要做的,是發(fā)展出一套中國式AI,并以最快速度把它投向千百萬行業(yè)。寒來暑往后,才是秋收冬藏。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-06-06
藏在實習(xí)生招聘里的“行業(yè)公式”:AI如何解決“中國式問題”
原標(biāo)題:藏在實習(xí)生招聘里的“行業(yè)公式”:AI如何解決“中國式問題”我們經(jīng)常說,今天人工智能的核心矛盾,是打開新聞發(fā)現(xiàn)“wow!AI好厲害”和回到工作中悲嘆“人工智能在哪里……”之間的矛盾。

長按掃碼 閱讀全文