123,123

信息流充斥在我們生活中的每一個(gè)角落，如同河流一樣哺育著每一個(gè)人。我們閱讀的每一條新聞、看的每一段視頻，一切通過信息流出現(xiàn)在我們眼前的東西，多多少少都受到了智能推薦的驅(qū)動(dòng)。

自2016年開始，信息流幾乎進(jìn)入了所有的頭部App。同時(shí)各個(gè)平臺(tái)間也開始暗自發(fā)力，希望掌握更強(qiáng)大的智能推薦算法。更好的智能推薦體驗(yàn)，意味著更多流量和優(yōu)質(zhì)的轉(zhuǎn)化率。那么智能推薦的技術(shù)支點(diǎn)究竟在哪？

主動(dòng)與被動(dòng)間的認(rèn)知鴻溝，智能推薦如何才能了解用戶？

其實(shí)智能推薦的行為邏輯很簡(jiǎn)單，那就是把適合的內(nèi)容推薦給適合的用戶。但在簡(jiǎn)單的行為邏輯中的，卻是智能推薦的本質(zhì)：內(nèi)容和用戶兩方面的雙向深度理解。

首先在對(duì)用戶的理解上，很多平臺(tái)都會(huì)陷入一個(gè)誤區(qū)，那就是把用戶的被動(dòng)反應(yīng)當(dāng)成了主動(dòng)索求。

比如很多資訊類推薦平臺(tái)冷啟動(dòng)時(shí)，都會(huì)讓用戶選擇自己感興趣的話題，這一行為就已經(jīng)把用戶畫像圈定在了平臺(tái)自己設(shè)置的范圍之內(nèi)。實(shí)際這種理解用戶的方式略有片面，即使不斷挖掘也只能察覺到用戶在閱讀這一個(gè)場(chǎng)景中的狀態(tài)，無(wú)法察覺用戶在閱讀中的喜好、無(wú)法察覺用戶當(dāng)下的需求。

這也就形成了信息流最嚴(yán)重的污名——信息繭房，智能推薦只會(huì)根據(jù)用戶的興趣愛好推薦內(nèi)容，久而久之用戶就會(huì)被自己關(guān)心的事物圍繞，從而失去對(duì)外界的整體認(rèn)知。尤其當(dāng)?shù)退?、獵奇、軟色情這些刺激眼球的信息出現(xiàn)時(shí)，人們難免會(huì)因?yàn)橄乱庾R(shí)的好奇進(jìn)行瀏覽，這一典型的被動(dòng)反應(yīng)將相關(guān)的標(biāo)簽加入了用戶畫像中，導(dǎo)致相關(guān)內(nèi)容大量污染用戶的信息流。

其實(shí)有時(shí)候信息繭房的形成并非內(nèi)容出產(chǎn)者和平臺(tái)故意灌輸帶有刺激性的內(nèi)容給用戶，而是一些信息流產(chǎn)品缺少獲取用戶主動(dòng)索取行為的途徑，猶如將用戶放置入一個(gè)狹小的環(huán)境中，用戶對(duì)環(huán)境產(chǎn)生的一點(diǎn)點(diǎn)反應(yīng)都會(huì)在環(huán)境中形成反復(fù)的回聲?？晌覀儫o(wú)法確定環(huán)境之外用戶的主動(dòng)行為，從而形成了巨大的認(rèn)知鴻溝。

了解內(nèi)容才是在大數(shù)據(jù)外的硬實(shí)力

目前很多智能推薦算法了解用戶的方式，是利用數(shù)據(jù)挖掘捕捉用戶的每一次點(diǎn)擊、瀏覽行為，對(duì)大數(shù)據(jù)進(jìn)行匯總、歸納和關(guān)聯(lián)。通過協(xié)同過濾算法，尋找用戶與用戶、內(nèi)容與內(nèi)容間的相似點(diǎn)，以此為依據(jù)為用戶推薦其他內(nèi)容。這就涉及到了雙向深度理解的另一端，也就是對(duì)技術(shù)硬實(shí)力要求最高的內(nèi)容理解。

和電商、音樂等平臺(tái)不同，資訊類平臺(tái)上的內(nèi)容數(shù)量巨大，種類多而龐雜，加之內(nèi)容本身作為消費(fèi)品，為了換取流量貨幣，內(nèi)容產(chǎn)出者很容易會(huì)使用標(biāo)題黨甚至違規(guī)內(nèi)容來(lái)吸引點(diǎn)擊。

舉個(gè)例子，當(dāng)有熱門八卦發(fā)生時(shí)，會(huì)有很多作者在標(biāo)題上提及熱門事件蹭熱度，內(nèi)容卻與標(biāo)題毫無(wú)關(guān)聯(lián)。或者有作者自己為作品搭上歷史、科普等標(biāo)簽，作品中的圖片、文字卻是軟色情內(nèi)容。這時(shí)如果單純依靠用戶間共同喜好做協(xié)同過濾推薦，很容易造成推薦不準(zhǔn)的情況。

可作為信息流產(chǎn)品，每天由大量作者出產(chǎn)大量?jī)?nèi)容，只利用人工審核分類是不實(shí)際的，利用人工智能技術(shù)對(duì)內(nèi)容進(jìn)行批量理解才是最好的選擇。對(duì)于圖片內(nèi)容可以建立深度學(xué)習(xí)模型，用圖像識(shí)別分辨圖片是否涉及違規(guī)。對(duì)于文字，可以用自然語(yǔ)言處理技術(shù)和知識(shí)圖譜技術(shù)實(shí)現(xiàn)對(duì)內(nèi)容的理解，分辨是否有文不對(duì)題的情況。像Facebook就應(yīng)用深度學(xué)習(xí)技術(shù)分析了大量標(biāo)題黨標(biāo)題，建立了專門識(shí)別夸張標(biāo)題的模型來(lái)減少標(biāo)題黨狀況的存在。

很多資訊類平臺(tái)都為自己巨大的用戶量感到自豪，認(rèn)為擁有大量用戶數(shù)據(jù)就可以無(wú)所不能，實(shí)際就是因?yàn)橛脩袅烤薮?，所以很難從用戶身上尋找到天然的共同點(diǎn)，需要更強(qiáng)大的技術(shù)能力，從用戶和內(nèi)容兩方面進(jìn)行挖掘，進(jìn)而滿足個(gè)體用戶的深層需求。

資訊推薦謎題，大企業(yè)真的有天然優(yōu)勢(shì)嗎？

如果無(wú)法駕馭河流，結(jié)果往往是被河水淹沒。由于只依賴大數(shù)據(jù)，缺乏足夠的自然語(yǔ)言處理、知識(shí)圖譜等雙向深度理解的技術(shù)底牌，在某些推薦算法主導(dǎo)的資訊類平臺(tái)上體現(xiàn)的最為顯著，出現(xiàn)了難以治理低俗內(nèi)容、推薦不準(zhǔn)確等等多種問題。

一個(gè)不得不承認(rèn)的事實(shí)是，相比一些業(yè)務(wù)單一的平臺(tái)，BAT這類大廠有自身產(chǎn)品群豐富，又有足夠的人力和基本投身于人工智能技術(shù)建設(shè)，更容易做到智能推薦技術(shù)的雙向深度理解。

以在內(nèi)容行業(yè)扎根很深的百度為例，相比很多內(nèi)容平臺(tái)，百度信息流很少受到內(nèi)容質(zhì)量方面的詬病。

首先，百度豐富的產(chǎn)品群使得用戶畫像更加全面，尤其是搜索+信息流雙引擎的存在，使得用戶的行為更加一致和順暢。搜索可以有效矯正推薦算法在用戶需求分析上的偏差。讓用戶自己突破信息繭房。

第二點(diǎn)，則是百度自身的AI能力方面的優(yōu)勢(shì)，成為了百度信息流最重要的技術(shù)底牌。

百度長(zhǎng)期做搜索產(chǎn)品，對(duì)知識(shí)圖譜、分詞技術(shù)有著大量累積，讓百度信息流可以更深入的理解文字內(nèi)容，不僅能理解每一句話在說(shuō)什么，還能精準(zhǔn)的理解內(nèi)容的感情傾向并為之加上標(biāo)簽。利用知識(shí)圖譜的深度挖掘和關(guān)聯(lián)能力，構(gòu)建起科普、娛樂、歷史等等細(xì)分類別的內(nèi)容體系，從而實(shí)現(xiàn)更精準(zhǔn)的內(nèi)容推薦。

尤其對(duì)于圖片、短視頻這類富媒體內(nèi)容，圖像識(shí)別技術(shù)就起到了重要作用。當(dāng)需要對(duì)圖片內(nèi)容進(jìn)行審核和分類時(shí)，應(yīng)用了卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)可以快速建立各種模型，實(shí)現(xiàn)對(duì)豐富的圖片內(nèi)容進(jìn)行認(rèn)識(shí)和判斷，及時(shí)找到違規(guī)內(nèi)容并進(jìn)行處理。

借助于人工智能技術(shù)，通過對(duì)視頻內(nèi)容的深刻理解和精準(zhǔn)分析，百度可以為每一個(gè)小視頻提煉一個(gè)6~10秒的精彩摘要，便于用戶快速了解視頻內(nèi)容?；谕瑯拥募夹g(shù)能力，還可以找出短視頻所對(duì)應(yīng)的愛奇藝中的長(zhǎng)視頻。而通過機(jī)器學(xué)習(xí)對(duì)視頻內(nèi)容的特征向量進(jìn)行提取，則為資訊平臺(tái)中每一段短視頻建立了獨(dú)一無(wú)二的視頻指紋，不僅僅能實(shí)現(xiàn)精準(zhǔn)的匹配推薦，還可以保證視頻不被盜用，維護(hù)了內(nèi)容創(chuàng)作者的權(quán)利。

還有一點(diǎn)，百度有熊掌號(hào)、百家號(hào)、百度新聞等等多種內(nèi)容入口，加之百度正在通過“創(chuàng)作大腦”將人工智能技術(shù)開放給內(nèi)容創(chuàng)作者，其中的視頻自動(dòng)轉(zhuǎn)化圖文功能、自動(dòng)識(shí)別圖片內(nèi)容并提供相關(guān)信息等功能，都在吸引著更多優(yōu)質(zhì)內(nèi)容出產(chǎn)方加入百度內(nèi)容生態(tài)之中，不光媒介結(jié)構(gòu)更加豐滿，也給了用戶更充實(shí)的內(nèi)容。同時(shí)人工編輯的存在也為百度信息流把握著內(nèi)容價(jià)值觀的導(dǎo)向，為創(chuàng)作者驅(qū)逐劣幣，讓更多優(yōu)質(zhì)內(nèi)容留存下來(lái)。

和其他資訊類平臺(tái)不同，重金挖角KOL、高額補(bǔ)貼用戶和自媒體作者這些事情很少發(fā)生在百度信息流產(chǎn)品中。不難看出，當(dāng)百度整體發(fā)展方向扭轉(zhuǎn)向人工智能時(shí)，技術(shù)優(yōu)勢(shì)讓百度信息流有能力實(shí)現(xiàn)用戶和內(nèi)容雙向的深度理解，這是智能推薦背后真正的支點(diǎn)，也是一張全能的王牌。

當(dāng)智能推薦的信息流已經(jīng)將我們的生活“包圍”，我們或許需要一些時(shí)間去習(xí)慣。但我們無(wú)需抗拒這一事實(shí)，當(dāng)前的些許不適只是科技發(fā)展帶來(lái)的生長(zhǎng)痛。

信息流本身就是一種受智能推薦技術(shù)驅(qū)動(dòng)的產(chǎn)品，相信各個(gè)平臺(tái)對(duì)雙向深度理解的追逐不會(huì)停止，找對(duì)了支點(diǎn)就能將水流引向正確的方向。終有一天信息流不再是信息繭房的代言詞，而是如流水一般，哺育著我們對(duì)信息的渴求。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

信息流如何規(guī)避低質(zhì)內(nèi)容和信息繭房？

下一篇