和數(shù)據(jù)濫用說再見,用少樣本學(xué)習(xí)拯救被群嘲的推薦系統(tǒng)

推薦系統(tǒng)想必大家都不陌生,一個(gè)推薦系統(tǒng)有多“聰明”,將在很大程度上決定了用戶是留下還是跳出,甚至可能影響一款產(chǎn)品的生命周期和商業(yè)價(jià)值。

在推薦系統(tǒng)誕生的三十多年間,不同平臺(tái)衍生出了各有特色的機(jī)制和算法,冷啟動(dòng)卻是伴隨其始終的話題。

所謂冷啟動(dòng),就是在推薦系統(tǒng)初期,沒有任何用戶與平臺(tái)信息的交集信息和行為軌跡的情況下,無法通過用戶偏好等方式進(jìn)行推薦。這時(shí),推薦系統(tǒng)就處于冷啟動(dòng)狀態(tài)。

簡(jiǎn)單來說,就是一個(gè)新顧客來到饅頭鋪,第一次買饅頭、也沒有任何動(dòng)作表情可供揣測(cè),如何讓他第一眼就看到自己想吃的饅頭。

今天我們就用一篇文章,看看AI在推薦系統(tǒng)的冷啟動(dòng)上,有哪些新突破。

流量紅利耗盡后,互聯(lián)網(wǎng)公司還能向誰要增長(zhǎng)?

后面我們會(huì)深入探討一些關(guān)于推薦算法及冷啟動(dòng)的技術(shù)概念,但首先,我們需要闡述一下,冷啟動(dòng)到底有何價(jià)值?

先說結(jié)論:冷啟動(dòng)可以讓推薦系統(tǒng)用最快的效率黏住新用戶。

2017年以來,所有中國(guó)互聯(lián)網(wǎng)公司都在流量紅利枯竭的深淵中掙扎。智能設(shè)備的用戶數(shù)量不再自發(fā)性增長(zhǎng),用戶使用時(shí)長(zhǎng)也來到了瓶頸期,此時(shí)想要繼續(xù)擴(kuò)大規(guī)模的互聯(lián)網(wǎng)公司,路徑無非兩個(gè):

一是去海外市場(chǎng)攫取新用戶,二是在存量市場(chǎng)中撬走新用戶。

無論哪一種,都面臨一個(gè)難題:如何第一時(shí)間吸引住越來越缺乏耐心的用戶?

例如,某新聞資訊APP好不容易吸引了一個(gè)新用戶下載,如果他在首頁(yè)上翻了二十分鐘也看不到自己想看的內(nèi)容,或許就不會(huì)再浪費(fèi)時(shí)間;

同樣,如果一個(gè)大眾社交平臺(tái)在不知道用戶特征的時(shí)候,推薦的賬號(hào)都與他心目中的理想型八竿子打不著,自然也難逃涼涼的命運(yùn)。

在這些例子中,推薦系統(tǒng)與新用戶之間難免出現(xiàn)信息與預(yù)期的不兼容,往往需要用戶進(jìn)行一些顯著的操作才能提高匹配的精準(zhǔn)度,而冷啟動(dòng)恰恰是推動(dòng)用戶與平臺(tái)產(chǎn)生交互的關(guān)鍵所在。

精準(zhǔn)的幻象:目前的冷啟動(dòng)存在哪些問題?

冷啟動(dòng)要與潛在用戶有效契合,問卷調(diào)查和興趣選擇,是最常見的一種。

諸如豆瓣、微博、喜馬拉雅等內(nèi)容分發(fā)平臺(tái),在用戶第一次打開APP,都會(huì)強(qiáng)制注冊(cè)并采取一定的獎(jiǎng)勵(lì)機(jī)制,引導(dǎo)用戶留下個(gè)人資料和感興趣的話題,主動(dòng)推薦關(guān)注相關(guān)熱門賬號(hào),以盡可能保證用戶在正式體驗(yàn)過程中,能刷到自己喜歡的話題。

這種主動(dòng)引導(dǎo)用戶留下行為軌跡的方式,可以快速積累起第一批用戶數(shù)據(jù),做一些顆粒度比較大的推薦。

如果用戶很懶,或者不愿意讓系統(tǒng)知道自己的個(gè)人信息,推薦系統(tǒng)還可以使用熱度模型,基于統(tǒng)計(jì)分析推薦一些大部分人都會(huì)感興趣的熱點(diǎn)信息。雖然很容易讓平臺(tái)調(diào)性顯得有點(diǎn)low,但從概率學(xué)角度看,說不定就正好撞到用戶心口上了呢。

比如一直強(qiáng)調(diào)算法推薦的今日頭條,在冷啟動(dòng)狀態(tài)就采用了這種做法,向新用戶推薦的大多是“新娘給伴娘下藥”、“孿生姐妹共侍一夫”這樣low得不要不要的內(nèi)容,還是有一定效果的。

如果以上還不夠,那么也可以采取更加激進(jìn)一點(diǎn)的方式。比如基于大數(shù)據(jù)的協(xié)同過濾,可以根據(jù)關(guān)聯(lián)行為或關(guān)聯(lián)用戶的相似性來進(jìn)行推薦。

像是采集用戶的地理位置信息,旅游商務(wù)、本地O2O等應(yīng)用可以更有針對(duì)性地進(jìn)行推薦;或者調(diào)取手機(jī)中關(guān)聯(lián)APP的用戶行為數(shù)據(jù)進(jìn)行預(yù)分析。

今日頭條就曾引導(dǎo)用戶使用微博登錄,然后爬取用戶在微博上的一些社交數(shù)據(jù),比如動(dòng)態(tài)、圖片、文章、贊過的人等等。依據(jù)這些信息,可以判斷出用戶最近喜歡哪個(gè)明星,并為其推送相關(guān)資訊。

反正大數(shù)據(jù)時(shí)代,“凡有接觸,必留痕跡”,總有一些隱藏的信息能夠捕捉到用戶內(nèi)心的吉光片羽。

說了這么多,我們來歸納一下傳統(tǒng)意義上冷啟動(dòng)的內(nèi)在邏輯——盡可能多地掌握用戶信息的獲取維度。

這個(gè)過程同時(shí)也向我們揭示了一種推薦系統(tǒng)的集體困境,那就是,如果企業(yè)無限度地?cái)U(kuò)展獲取用戶信息的渠道,必然會(huì)遭遇隱私和法律之墻;而挖掘已有的用戶信息,數(shù)據(jù)量往往又捉襟見肘。

那么,情況有可能發(fā)生變化嗎?少樣本學(xué)習(xí)(fewshot learning)正在嘗試解決這一問題。

少樣本學(xué)習(xí):改變的不只一點(diǎn)點(diǎn)

不難發(fā)現(xiàn),推薦系統(tǒng)冷啟動(dòng)的眾多通用方法,都需要越多越好的標(biāo)注數(shù)據(jù)才能有效發(fā)揮其作用。

但現(xiàn)實(shí)是,冷用戶往往不會(huì)提供那么多的標(biāo)注數(shù)據(jù)。在小數(shù)據(jù)的環(huán)境下,推薦算法還能發(fā)揮作用嗎?

這里就涉及到一個(gè)重要的“多臂老虎機(jī)問題(Multi-armed bandit problem, MAB)”。

當(dāng)你走進(jìn)一家賭場(chǎng),面對(duì)20個(gè)一模一樣的老虎機(jī),在不知道它們吐錢概率的情況下,如果可以無限制地?fù)u下去,自然可以知道哪臺(tái)老虎機(jī)成功率最高。

但當(dāng)你手里的錢有限的時(shí)候,搖弊的次數(shù)也被限制了,該如何最大化自己的收益呢?

顯然,此時(shí)每一次搖臂的機(jī)會(huì)對(duì)你來說都是極其寶貴的。

在冷啟動(dòng)中,用戶的每一次有效行為也是如此。

系統(tǒng)既要盡可能地?cái)U(kuò)大信息的多樣性和寬度,又要防止過多“無用”信息夾雜其中,讓用戶“信息過載”。

過去,不少平臺(tái)試圖通過熱度模型來解決這個(gè)冷啟動(dòng)中的“多臂老虎機(jī)問題”,給新用戶推薦目前點(diǎn)擊率最高的結(jié)果。但這又會(huì)大大降低信息的覆蓋率和多樣性,出現(xiàn)反復(fù)推薦。

那么,少樣本學(xué)習(xí)(fewshot learning)又是怎么做的呢?

簡(jiǎn)單來說,就是讓推薦引擎具備經(jīng)過少量樣本訓(xùn)練之后快速泛化的能力,從而在冷用戶有限的行為軌跡下,實(shí)現(xiàn)推薦效果的最大化。

舉個(gè)例子,電商平臺(tái)可以先用隨機(jī)試探的方式,選擇帶有不同標(biāo)簽的熱門商品展示給冷用戶,并對(duì)冷用戶的有效動(dòng)作進(jìn)行強(qiáng)化學(xué)習(xí)。

比如給用戶的動(dòng)作設(shè)定一個(gè)獎(jiǎng)勵(lì)函數(shù)。用戶點(diǎn)擊一次,收益就是1;沒有點(diǎn)擊,收益就是0。以此測(cè)試?yán)溆脩魧?duì)哪些商品有反饋,再在此基礎(chǔ)上根據(jù)實(shí)際收益去調(diào)整被展示的商品。

這樣做的好處是,即便是在有限的條件下,也能快速判斷出用戶的興趣所在,降低瀏覽過程中用戶的耐心損耗,同時(shí)避免熱度模型制造的“信息繭房”。

一個(gè)商品的收益均值越大,被選中展示給用戶的機(jī)會(huì)就越大。而那些被選次數(shù)較少的商品,也回被呈現(xiàn)在冷用戶面前,相當(dāng)于一張“復(fù)活卡”。

又比如孿生網(wǎng)絡(luò),訓(xùn)練時(shí)利用雙路神經(jīng)網(wǎng)絡(luò)進(jìn)行交叉計(jì)算,從而得出共性特征。再用這一模型去測(cè)試樣本,對(duì)于樣本的共性指數(shù)進(jìn)行排列。這樣電商就可以通過這種共性指數(shù)來進(jìn)行商品推薦,把用戶行為和商品標(biāo)簽看做一對(duì)孿生數(shù)據(jù),假如用戶與“少女”、“溫馨”這樣的數(shù)據(jù)標(biāo)簽共性指數(shù)越高,那么自然與“直男”、“酷炫”這樣的標(biāo)簽共性指數(shù)越低,反之亦然。當(dāng)用戶無視了粉紅色手機(jī)殼時(shí),系統(tǒng)可以嘗試推薦白酒這類商品,通過實(shí)時(shí)反饋不斷縮小用戶畫像的范圍,在少量數(shù)據(jù)的前提下達(dá)到和協(xié)同推進(jìn)算法近似的效果。

除了電商,少樣本學(xué)習(xí)還能夠被應(yīng)用在眾多其他領(lǐng)域。

比如視頻網(wǎng)站。

“一千個(gè)觀眾有一千個(gè)哈姆雷特”,用戶認(rèn)知標(biāo)準(zhǔn)不一,讓視頻的數(shù)據(jù)標(biāo)注也充滿了不確定性,無法建立龐大的標(biāo)簽體系,使得視頻平臺(tái)個(gè)性化推薦的冷啟動(dòng)更加困難。

從這個(gè)角度看,少樣本學(xué)習(xí)在視頻領(lǐng)域更有用武之地。

比如用戶的觀看長(zhǎng)度、觀看時(shí)間段、觀看次數(shù)、跳進(jìn)跳出等等行為都存在者很大的主觀性,很難用標(biāo)簽語言來概括。在這種情況下,在用少量視頻“試探”冷用戶的時(shí)候,反而可以對(duì)這些主觀因素進(jìn)行價(jià)值判斷并賦值,再讓機(jī)器進(jìn)行在線學(xué)習(xí),選出成功率最高的進(jìn)行推薦。

并不討好的少樣本學(xué)習(xí),會(huì)完成推薦系統(tǒng)的終極理想嗎?

說了這么多不難發(fā)現(xiàn),“少樣本學(xué)習(xí)”的條件要比大數(shù)據(jù)學(xué)習(xí)苛刻的多。

它將訓(xùn)練范疇鎖定在了新用戶與單一平臺(tái)的有限交互之間,既不能調(diào)取外部用戶行為進(jìn)行協(xié)同過濾,也不讓用戶主動(dòng)告知系統(tǒng)自己的個(gè)人偏好,可說是完全暴露在用戶行為的數(shù)據(jù)孤島上。

在中國(guó)如此寬松的隱私環(huán)境下,這種探索有必要的嗎?

我認(rèn)為是有的。

首先我們要知道,當(dāng)前寬松的隱私環(huán)境一定只是一時(shí)的。相關(guān)法律法規(guī)的制定、用戶的防范意識(shí)只會(huì)越來越完善。未來數(shù)據(jù)泛濫供人取用的情況只會(huì)越來越少,如何最大程度下發(fā)揮有限數(shù)據(jù)的作用,一定是推薦系統(tǒng)取勝的關(guān)鍵。

同時(shí),能用更少的數(shù)據(jù)去捕捉更多用戶,也是中國(guó)科技企業(yè)發(fā)展從流量轉(zhuǎn)向算法的關(guān)鍵。在巨頭割據(jù)下,或許流量、再?gòu)牧髁恐修D(zhuǎn)化數(shù)據(jù)正在成為一件奢侈的事情,但沒有數(shù)據(jù),也就沒有精準(zhǔn)的推薦算法,無法留住用戶更無法商業(yè)化。而少樣本學(xué)習(xí)的出現(xiàn),正在打破這個(gè)怪圈,未來崛起新企業(yè)不一定是BAT的附庸,但一定會(huì)應(yīng)用少數(shù)據(jù)學(xué)習(xí)算法。

更重要的是,冷啟動(dòng)所面對(duì)的,不是等待被收割商業(yè)價(jià)值的賬號(hào),而是一個(gè)個(gè)充滿好奇的靈魂。真正優(yōu)質(zhì)的推薦系統(tǒng),要做的就是不斷帶來驚喜,這才是技術(shù)的終極理想。

用萊蒙托夫的一句詩(shī)結(jié)束這篇文章吧……

一只船孤獨(dú)地航行在海上/它既不尋求幸福/也不逃避幸福/它只是向前航行/底下是沉靜碧藍(lán)的大海/而頭頂是金色的太陽(yáng)/將要直面的/與已成過往的/較之理想/皆為微沫……

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-10-29
和數(shù)據(jù)濫用說再見,用少樣本學(xué)習(xí)拯救被群嘲的推薦系統(tǒng)
推薦系統(tǒng)想必大家都不陌生,一個(gè)推薦系統(tǒng)有多“聰明”,將在很大程度上決定了用戶是留下還是跳出,甚至可能影響一款產(chǎn)品的生命周期和商業(yè)價(jià)值。

長(zhǎng)按掃碼 閱讀全文