原標(biāo)題:藏在實(shí)習(xí)生招聘里的“行業(yè)公式”:AI如何解決“中國式問題”
我們經(jīng)常說,今天人工智能的核心矛盾,是打開新聞發(fā)現(xiàn)“wow!AI好厲害”和回到工作中悲嘆“人工智能在哪里……”之間的矛盾。
對于中國千百萬具體行業(yè)來說,今天人工智能還是朦朦朧朧、似是而非的一件事。找一下本行業(yè)和AI相關(guān)的動向,一般我們會發(fā)現(xiàn)三樣?xùn)|西:
1. 歐美某AI公司做了一個(gè)本行業(yè)應(yīng)用。奈何遠(yuǎn)在天邊,也不怎么符合國情。
2. 某論文里提出了AI新技術(shù)。可是等到應(yīng)用,也不知道自己退休了沒有……
3. 某創(chuàng)業(yè)公司的PPT里有相關(guān)技術(shù)。一般這種比較傲嬌,遲遲不想從PPT里走下來……
綜合起來看,今天在面對AI時(shí),中國市場上各行業(yè)的普遍困惑是:AI聽起來很美,看上去很遠(yuǎn),大家又不敢貿(mào)然當(dāng)?shù)谝粋€(gè)吃螃蟹的人。心動和行動之間,缺少一個(gè)靈光一閃的可行性方案。
說得更直白點(diǎn),傳統(tǒng)行業(yè)和各個(gè)企業(yè),缺乏的是一套能夠復(fù)制、符合實(shí)際需求的解決問題思路。最好有個(gè)公式,讓各個(gè)行業(yè)可以一鍵粘貼,得到快速并有價(jià)值的AI方案。
今天讓我們來研究一個(gè)真實(shí)案例,試著一起來找到一個(gè)這樣的“公式”。當(dāng)然,案例本身也頗具價(jià)值,因?yàn)樗l(fā)生在一個(gè)任何企業(yè)都可能邂逅的領(lǐng)域:在線招聘。
前不久,腦極體采訪了云腦科技(沒錯(cuò),我們都是腦字輩的)聯(lián)合創(chuàng)始人&COO龍志勇。作為一家跨越中美兩國的人工智能行業(yè)平臺公司,云腦科技的商業(yè)模式就是利用深度學(xué)習(xí)產(chǎn)品為傳統(tǒng)行業(yè)服務(wù)。在他們與百度、實(shí)習(xí)僧共同推進(jìn)的智能招聘項(xiàng)目中,AI與中國式互聯(lián)網(wǎng)問題的膠著碰撞可謂暴露無遺。
絕不小的“小問題”:中國式實(shí)習(xí)生招聘
讓我們先來了解下,人力資源領(lǐng)域的“中國式問題”。
在歐美國家,人力的昂貴、人才流通的需求頻率相對較緩,加上監(jiān)管的嚴(yán)謹(jǐn)性,都讓人力資源事業(yè)處在相對較“穩(wěn)”的曲線中。而AI進(jìn)入人力資源領(lǐng)域,也更多是從智能獵頭、背景審核等輔助功能的AI化開始。
但在中國,互聯(lián)網(wǎng)招聘的人才虹吸效應(yīng)以及巨大的人力缺口,導(dǎo)致今天的人力資源必須實(shí)現(xiàn)快進(jìn)快出。如果不能高效準(zhǔn)確找到人才,企業(yè)甚至很可能被產(chǎn)能拖垮。這就讓“快”成了中國HR的第一準(zhǔn)則。
但僅僅快還不夠,HR同時(shí)還要準(zhǔn)。如果面試錄取率不佳,企業(yè)會直接質(zhì)疑HR的職業(yè)能力。這導(dǎo)致很多HR同學(xué)常年在業(yè)務(wù)部門需求和大量雷同的簡歷中無盡掙扎。而在招聘實(shí)習(xí)生時(shí),類似問題會尤其凸顯。
因?yàn)閷?shí)習(xí)生招聘中很可能會遇到這樣幾個(gè)尷尬:
1. 簡歷特別多,看完就已經(jīng)暈了。
2. 由于投遞者都是在校學(xué)生,很難明確職業(yè)意向。簡歷與職位需求經(jīng)常存在偏差。
3. 實(shí)習(xí)生簡歷內(nèi)容簡單雷同,HR難以判斷取舍。
這些因素的堆疊,導(dǎo)致實(shí)習(xí)生招聘很可能在企業(yè)中變成缺乏效率、高流失率,并且沒什么科學(xué)依據(jù)的工作。而在互聯(lián)網(wǎng)時(shí)代,企業(yè)招聘實(shí)習(xí)生又大量依托線上平臺。特有痛點(diǎn)+線上存量數(shù)據(jù)+AI,會不會有什么意外驚喜呢?
百度+云腦:一個(gè)人力資源問題的AI解決方案
采訪中我們了解到,國內(nèi)著名實(shí)習(xí)生招聘平臺“實(shí)習(xí)僧”與云腦科技的深度合作中,共同完成了AI人才庫:利用實(shí)習(xí)僧平臺上留存的招聘數(shù)據(jù),云腦訓(xùn)練匹配模型,以此實(shí)現(xiàn)以AI進(jìn)行初步簡歷篩選。
顯然,這個(gè)AI解決方案旨在解決HR實(shí)習(xí)招聘的真實(shí)痛點(diǎn),實(shí)習(xí)僧平臺沉積的幾十萬職位描述和幾百萬簡歷數(shù)據(jù)也為深度學(xué)習(xí)提供了優(yōu)厚的條件。那么接下來的問題是,到底如何讓美好的技術(shù)想象變?yōu)楝F(xiàn)實(shí)。
為了讓AI輔助HR,更好地完成實(shí)習(xí)生簡歷初篩問題,云腦使用實(shí)習(xí)生招聘環(huán)節(jié)中的三個(gè)重要數(shù)據(jù):HR發(fā)布的職位描述文本;HR瀏覽、標(biāo)記和發(fā)出面試邀約的簡歷文本數(shù)據(jù);學(xué)生們的簡歷文本、瀏覽記錄與選擇投遞的公司與職位描述。
為了統(tǒng)籌這些文本數(shù)據(jù)和行為數(shù)據(jù),云腦結(jié)合門禁卷積神經(jīng)網(wǎng)絡(luò)(Gated CNN)和注意力機(jī)制,訓(xùn)練適用于招聘領(lǐng)域的門禁卷積神經(jīng)網(wǎng)絡(luò)(Gated Query Model, GQM),在保證文本匹配準(zhǔn)確性的同時(shí),還能提供匹配的細(xì)節(jié)。最終實(shí)現(xiàn)了HR在平臺發(fā)布職位描述后,模型自動檢索匹配庫內(nèi)海量簡歷,實(shí)現(xiàn)分鐘級的匹配,并按照匹配度倒序推薦給HR。
在這里我們當(dāng)然沒有必要解釋算法背后的函數(shù)關(guān)系,但有幾點(diǎn)技術(shù)邏輯卻是值得我們注意的。因?yàn)樵诮裉熘袊腁I與行業(yè)結(jié)合中,這些問題會反復(fù)經(jīng)常出現(xiàn)。
1.需要適應(yīng)中文的獨(dú)特性
我們了解到,在針對中國互聯(lián)網(wǎng)招聘數(shù)據(jù)進(jìn)行簡歷與需求的精準(zhǔn)匹配時(shí),云腦面對的首要問題是解決中文自然語言處理場景中,中文分詞、詞性標(biāo)注、句法分析等缺乏技術(shù)借鑒鏡像的問題,在降低了文本向量維度的同時(shí),也需要保留文本語義信息,兼顧算法的處理效率。
2.克服有效數(shù)據(jù)困境
互聯(lián)網(wǎng)招聘平臺數(shù)據(jù)僅僅能有效記錄,HR瀏覽了哪些實(shí)習(xí)生簡歷、發(fā)出了哪些面試邀約是比較容易記錄的。但在這之后,現(xiàn)場面試反饋記錄、錄用情況,甚至錄用之后的實(shí)習(xí)效果,就都是互聯(lián)網(wǎng)平臺難以記錄的了。
為了解決實(shí)習(xí)僧平臺數(shù)據(jù)不閉環(huán)的問題,云腦先根據(jù)場景定制化了一個(gè)簡單可快速上線的模型,搜集HR針對每個(gè)崗位描述發(fā)出的面試邀約。用來搜集可用于深度學(xué)習(xí)的數(shù)據(jù)樣本。當(dāng)真實(shí)的招聘需求、獲得面試邀約者基本信息及雙方的行為數(shù)據(jù)量足夠之后,再進(jìn)行第二階段的深度模型的迭代,通過文本分析、數(shù)據(jù)挖掘和行為學(xué)習(xí),自動捕捉企業(yè)用人偏好,防止錯(cuò)失潛在的優(yōu)秀簡歷和候選人。
3.解決開發(fā)框架問題
與很多主流AI創(chuàng)業(yè)公司不同,云腦在開發(fā)智能招聘算法時(shí),沒有采用歐美主流開發(fā)框架,比如TensorFlow、Caffe等等,而是用到了百度的PaddlePaddle。采訪中聊到這個(gè)問題時(shí),云腦方面表示,根據(jù)他們的測試和實(shí)踐,TensorFlow等開發(fā)框架雖然社區(qū)資源會更齊備,但由于這些框架不一定能滿足商業(yè)應(yīng)用場景中對速度與效率的追求。
與歐美框架相比,PaddlePaddle從一開始就為了解決并行計(jì)算問題,其利用GPU的并行度更強(qiáng)。也就是說,在同等數(shù)據(jù)相同網(wǎng)絡(luò)結(jié)構(gòu)的條件下,PaddlePaddle展現(xiàn)出了更快的速度強(qiáng)大效率。
根據(jù)我們的觀察,這也不是個(gè)孤立問題。越來越多的AI公司投入產(chǎn)業(yè)實(shí)戰(zhàn)當(dāng)中時(shí),都會發(fā)現(xiàn)訓(xùn)練框架對大規(guī)模應(yīng)用的友好程度,直接決定了企業(yè)的商業(yè)化進(jìn)度。這種情況下,性能更好,更支持大規(guī)模應(yīng)用的框架顯然占據(jù)優(yōu)勢。
此外,基于PaddlePaddle的生態(tài)合作,也為AI企業(yè)開發(fā)基于中文互聯(lián)網(wǎng)數(shù)據(jù)的算法提供了支撐。比如PaddlePaddle會提供更多專項(xiàng)中文數(shù)據(jù)集,并且開放了近20種工業(yè)級模型,比如語音識別、文本分類、圖像分類、機(jī)器翻譯、物體識別等,這些能力適合中國國情和中國企業(yè)融匯進(jìn)入AI世界。
從基礎(chǔ)訓(xùn)練到分布架構(gòu)徹底開源,由于PaddlePaddle今天在中國AI產(chǎn)業(yè)中的獨(dú)特性和生態(tài)價(jià)值,其也被視為“最適合中國國情的深度學(xué)習(xí)框架”。
于是我們看到,在云腦的算法模型和百度PaddlePaddle的無間合作下,智能招聘實(shí)習(xí)生這時(shí)似乎真的看到了曙光。
據(jù)說,效果是企業(yè)每招一個(gè)人,能省160塊
招聘平臺加算法的效果如何評價(jià),最終當(dāng)然要數(shù)據(jù)說了算。采訪者我們了解到了一些有意思的數(shù)據(jù),或者可以說明這個(gè)商業(yè)智能應(yīng)用的直觀價(jià)值。
1. 企業(yè)招聘速度提升,更主要的是,省錢了……
對算法加入前后的邀約率分析,智能招聘算法上線之后,將簡歷初篩這個(gè)高時(shí)間成本的找簡歷、看簡歷和篩簡歷過程,優(yōu)化為HR根據(jù)AI推薦簡歷,發(fā)出面試邀約一步,面試邀約率實(shí)現(xiàn)了5倍提升,推薦的成功率比之前提高了50%,大大提升了HR的工作效率。
企業(yè)更快找到人才,招聘速率被提升后,企業(yè)每招到一個(gè)人的成本約可降低160塊人民幣。算法已服務(wù)了3萬余個(gè)崗位的精準(zhǔn)匹配,累積優(yōu)勢十分可觀。
2. 優(yōu)化招聘需求,提升HR精度
在效率提高、成本下降之外,AI招聘帶給企業(yè)的新想象力,是企業(yè)可以更好地招到原先容易錯(cuò)失的人才。
以教育機(jī)構(gòu)好未來當(dāng)前正在招聘機(jī)器學(xué)習(xí)實(shí)習(xí)生為例,在新興的垂直技術(shù)領(lǐng)域,比如機(jī)器學(xué)習(xí)、區(qū)塊鏈等,HR通常面臨著不知道要招聘什么人才、也不知道去哪里找到他們等問題。使用了AI(H)后,可根據(jù)企業(yè)所在的行業(yè)、職業(yè)描述所在的專業(yè)領(lǐng)域、借鑒其他企業(yè)的招聘案例等,自動匹配到在垂直領(lǐng)域有相似科研經(jīng)驗(yàn)、項(xiàng)目實(shí)踐經(jīng)驗(yàn)和獲得類似面試邀約的候選人,有效協(xié)助HR更好的在新興的技術(shù)領(lǐng)域搜尋人才。
這對于企業(yè)發(fā)展的助力,或許是難以用量化金錢來衡量的。
3. 提升深度模型的可解釋性
深度學(xué)習(xí)模型本身具有不可解釋性,但在力求公平公正的招聘場景下,企業(yè)仍舊存在一些使用疑慮。云腦針對這類的場景需求,在智能招聘算法中,改進(jìn)了模型設(shè)計(jì),在保留了模型表達(dá)能力的基礎(chǔ)上,解釋需求與簡歷間的文本特征匹配關(guān)系。企業(yè)和應(yīng)聘者在使用精準(zhǔn)匹配的過程中,不僅能夠幫助HR找到最符合的應(yīng)聘者、幫助應(yīng)聘者找到最符合的HR,同時(shí)還能夠給予雙方一份詳細(xì)的建議理由。
從個(gè)案到“公式”:AI如何解決互聯(lián)網(wǎng)時(shí)代的問題
通過以上云腦、百度、實(shí)習(xí)僧,加上若干應(yīng)用企業(yè)參與的整個(gè)案例。我們可以看出AI在招聘這件事上也是可以大展拳腳的。
但更有價(jià)值的信息,是我們可以從整個(gè)合作關(guān)系中發(fā)現(xiàn),解決某個(gè)傳統(tǒng)行業(yè)或者企業(yè)通識問題,AI到底如何來開啟第一步。
在智能招聘案例中,首要解決的是數(shù)據(jù)問題。缺失了可進(jìn)行深度學(xué)習(xí)訓(xùn)練的有特征數(shù)據(jù),那么一切都白搭。這個(gè)案例中,線上招聘平臺實(shí)習(xí)僧成為了數(shù)據(jù)輸出者。在互聯(lián)網(wǎng)時(shí)代,很多數(shù)據(jù)都留存在平臺上,這給更多行業(yè)以想象空間。但如果想要深入到企業(yè)內(nèi)部流程當(dāng)中,本行業(yè)本企業(yè)的線下數(shù)據(jù)也是重中之重。而如何確保數(shù)據(jù)安全性,以及組成企業(yè)、行業(yè)、平臺間的數(shù)據(jù)對接,將是接下來AI產(chǎn)業(yè)發(fā)展中的任務(wù)。
接下來,是云腦這樣的AI公司,結(jié)合實(shí)習(xí)僧的數(shù)據(jù)提出了一系列垂直于行業(yè)的解決方案。這其中有大量中文,或者中國產(chǎn)業(yè)格局里必須要克服的問題,基本功不過硬肯定不行。
此外,百度提供的PaddlePaddle也成為了AI能夠商業(yè)化工作的前提。適應(yīng)中國企業(yè)需求,善于支持AI并行計(jì)算與大規(guī)模部署的AI平臺,顯然不是創(chuàng)業(yè)公司能夠負(fù)擔(dān)得起的,而海外平臺又不接地氣。
因此上,百度這樣平臺級別的輸出能力就會成為主要解決方案。而平臺的價(jià)值,也不僅僅是能力輸出,而是綜合資本、流量、影響力、技術(shù)解決能力的示范價(jià)值與生態(tài)化賦能產(chǎn)業(yè)基礎(chǔ)。比如百度就基于PaddlePaddle及其開放能力建立了PaddlePaddle訓(xùn)練營,為開發(fā)者和企業(yè)提供轉(zhuǎn)型和應(yīng)用AI的平臺,既有針對開發(fā)者的系列課程培訓(xùn)、線上線下活動,也有面向企業(yè)的AI市場。假如百度本身平臺的品牌扶持與價(jià)值培養(yǎng)能力,對于具體行業(yè)問題的引導(dǎo)是多方面的。
或許到此我們可以看出,算法創(chuàng)新、行業(yè)數(shù)據(jù)、平臺三者構(gòu)成了一個(gè)產(chǎn)業(yè)共生體,通過三方面不能或缺的能力,集合式為第四方解決了問題。
在AI距離應(yīng)用較遠(yuǎn)、成本相對模糊的條件下,理解這樣一個(gè)公式或者可以成為企業(yè)探索AI的支點(diǎn):你的產(chǎn)業(yè)到AI之間,是否有數(shù)據(jù)、算法、平臺這樣一個(gè)三角形產(chǎn)業(yè)關(guān)系。而它們間的產(chǎn)業(yè)合作能力又是否能被企業(yè)接受。
在更多的人才和更普及的AI能力之前,運(yùn)用恰當(dāng)?shù)漠a(chǎn)業(yè)合作來實(shí)現(xiàn)AI,幾乎是唯一的正路。
面對十分復(fù)雜的中國式問題,或許我們要做的,是發(fā)展出一套中國式AI,并以最快速度把它投向千百萬行業(yè)。寒來暑往后,才是秋收冬藏。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。