算法有三個陷阱,移動資訊客戶端如何規(guī)避?

今天朋友李俊在朋友圈的一則吐槽引發(fā)了我對移動資訊客戶端的思考。

前幾天有在媒體平臺工作的朋友問我:為什么他們怎么努力都達(dá)不到今日頭條如今的高度?

拋開一切因素,最關(guān)鍵的可能還是精英思維在作祟,對內(nèi)容的嚴(yán)格審核把關(guān),那些無法滿足大眾低俗趣味的文章不給流量推薦,這是平臺的致命傷。

別人就喜歡吃屎,非要給別人吃山珍海味,你覺得自己對別人好,但別人可真不這么認(rèn)為!

這則吐槽是老生常談,然而卻說明了眼下做好流量推薦這事兒,將關(guān)乎移動資訊平臺成敗這個道理。

移動資訊平臺的內(nèi)容推薦,要依賴算法還是依賴編輯?眼下業(yè)界正在開始向算法傾斜。

依賴編輯的問題很明顯,編輯的品味決定大眾閱讀的品味,然而這勢必帶來一個問題:閱讀面變窄,每個人看到的內(nèi)容都是相似的。過去門戶網(wǎng)站,以及門戶時代的新聞客戶端,正是這樣做的。如果說,我們只是看新聞,看具有時效性的資訊,這個模式?jīng)]任何問題,紙媒時代不就是這樣做的嗎?

然而,我們面臨的挑戰(zhàn)是,過去用戶只會訂閱一兩份報紙,一兩份雜志,一兩檔電視節(jié)目,而今天的手機已經(jīng)將用戶與海量的內(nèi)容生產(chǎn)者連接起來,用戶面臨信息大爆炸的同時,信息本身在改變:資訊不再等于新聞,而是五花八門的內(nèi)容。正是因為此,傳統(tǒng)的編輯推薦模式,開始失效了,這給了算法可乘之機,今日頭條、一點資訊們可以異軍突起,UC、百度們現(xiàn)在還在努力殺入古老的資訊市場,正是看中了算法帶來的機會。

在信息大爆炸時代,只有通過算法才能幫用戶從海量內(nèi)容中發(fā)現(xiàn)適合自己的內(nèi)容。在碎片化閱讀時代,只有通過算法才能不斷推薦用戶感興趣的內(nèi)容滿足其“刷資訊”的需求。在泛資訊閱讀而不是新聞閱讀的今天,只有通過算法才能滿足用戶五花八門大雜燴式的內(nèi)容消費需求。來勢洶洶的算法推薦技術(shù),引入九大巨頭角逐移動資訊客戶端市場,很是熱鬧。

然而,算法并不是萬能的。前幾天,在貴州省貴陽市舉辦的第十六屆中國網(wǎng)絡(luò)媒體論壇上,鳳凰網(wǎng)CEO、一點資訊董事長劉爽的分享,在我看來十分準(zhǔn)確地點名了算法本身的缺陷,用劉爽的話說,基于算法的推薦優(yōu)勢明顯,然而,卻有三個缺陷。

缺陷1:“千人千面的算法帶來我們個體的信息孤島化”。

就是個性化推薦容易讓我們的閱讀范圍越來越窄。劉爽認(rèn)為,個性化算法的基礎(chǔ)邏輯是,不斷地了解用戶的興趣,進(jìn)而結(jié)合其興趣進(jìn)行內(nèi)容推薦,用戶用得越久,推薦就會愈發(fā)精準(zhǔn)。久而久之,算法給用戶推薦的內(nèi)容在越來越精準(zhǔn)的同時會越來越狹窄,比如喜歡歷史、體育的用戶可能全屏幕都是這些內(nèi)容,而這將阻礙用戶關(guān)注到理應(yīng)關(guān)注的資訊,或者潛在感興趣的資訊。

這一點我深有體會,由于我關(guān)注科技比較多,因此我在今日頭條等個性化產(chǎn)品上幾乎全都是科技數(shù)碼內(nèi)容,然而我同時也會關(guān)注歷史、娛樂、財經(jīng)、電影等話題,有時候還會看一些時政新聞,這時候還我就必須要去別的App比如網(wǎng)易新聞客戶端才能看到,這顯然不是個性化內(nèi)容平臺愿意看到的。

缺陷2:“基于海量點擊的算法推薦帶來的閱讀和視野的狹窄和偏見”。

個性化算法的基礎(chǔ)邏輯是,如果一篇文章被點擊的越多就表明它更受歡迎,基于此它更應(yīng)該被推薦給你。微信公眾平臺上能形成10萬+的閱讀就算不錯了,而個性化資訊平臺上動輒出現(xiàn)100萬+閱讀的內(nèi)容,就是因為后者采取了基于閱讀效果的個性化推薦技術(shù)。就是說,個性化閱讀很容易形成閱讀量的“馬太效應(yīng)”,強者恒強,弱者越弱,說白了,就是強化頂部閱讀,弱化長尾閱讀,然而這顯然違背了個性化閱讀的初衷。

在劉爽看來,這個推薦邏輯導(dǎo)致的后果是,“算法推薦的是大眾,甚至是庸眾一致叫好的高點擊作品,但不一定是用戶所在的那一個圈層所高度認(rèn)可的?!?,不同圈層有著不同的偏好,比如中產(chǎn)階級、90后、互聯(lián)網(wǎng)圈、媽媽圈,大家都有自己的閱讀偏好。大眾喜歡的不一定是你我喜歡的,很多人喜歡雞湯、喜歡咪蒙、喜歡八卦,但也有很多人不喜歡。如果基于此進(jìn)行推薦,等于讓每個人的閱讀趣味被迫隨大流,這比傳統(tǒng)編輯推薦模式更加可怕:主編的閱讀品味可是高于大眾平均水平的。

缺陷3:“標(biāo)題抓眼球這一算法點擊推薦模式帶來的閱讀的淺薄化甚至低俗化”。

“標(biāo)題黨”是移動資訊平臺被詬病最多的問題,事實上,不論是今日頭條,還是微信公眾平臺抑或新聞客戶端,上面的內(nèi)容生產(chǎn)者都明白一個淺顯的道理:一個內(nèi)容的傳播效果,內(nèi)容、標(biāo)題與分發(fā)各占三分之一,一個好的標(biāo)題會成就一個平庸的內(nèi)容,反過來,一個差的標(biāo)題會毀了一個優(yōu)秀的內(nèi)容。然而,何為好的標(biāo)題?如果從分發(fā)效果來看,大眾對危言聳聽、驚悚離奇、低級趣味的標(biāo)題反而更加喜聞樂見,哪怕文不對題。因此,“標(biāo)題黨”就成了“標(biāo)題黨”。

正如劉爽所言,“海量讀者因為非常聳動的標(biāo)題被吸引過去,看了以后立刻走人,雖然他個人的體驗很不愉快,但他點擊這個行為留下來了,被算法捕捉到,所以形成了惡性循環(huán),越多的人被吸引,它也會給這個新聞更多的權(quán)重,所以會推薦開去,這嚴(yán)重影響了閱讀的體驗?!庇捎跇?biāo)題決定內(nèi)容分發(fā)效果,最終所有標(biāo)題都想方設(shè)法去迎合人性中的陰暗面,去聳人聽聞文不對題,好內(nèi)容不如好標(biāo)題對內(nèi)容生態(tài)是一個巨大的打擊。

在WEB內(nèi)容時代,如何讓人們更好地發(fā)現(xiàn)與消費優(yōu)質(zhì)內(nèi)容?搜索引擎PageRank算法的邏輯是,如果一個網(wǎng)頁被別的網(wǎng)頁引用得越多,這個頁面就有更高權(quán)重。同時,如果一個網(wǎng)頁更加符合HTML規(guī)范和語義,也將擁有更高權(quán)重,反之則被降低懲罰。如果這個頁面所屬網(wǎng)站本身一直有很好的信用,它會有更好權(quán)重,反之則被降低權(quán)重。這套體系非常有效,確保了搜索引擎的體驗。移動互聯(lián)網(wǎng)時代,個性化推薦取代了主動搜索成為用戶內(nèi)容獲取的首選方式,WEB內(nèi)容推薦邏輯也失效了,然而,與之匹配的內(nèi)容推薦體系還沒有成型,這是個性化算法的挑戰(zhàn),也是機遇。

在規(guī)避個性化算法三大陷阱上,我看到了這些值得一提的方式:

1、算法為主,編輯為輔,配合作戰(zhàn)。

今天人工智能技術(shù)方興未艾,AlphaGo戰(zhàn)勝了最聰明的人類,機器已經(jīng)可以取代記者寫稿,許多人都在討論機器會不會取代人類,在這一點上我十分認(rèn)同馬云前不久在云棲大會上提到的觀點:

計算機一定比人更聰明,因為計算機不會累,沒有情緒,不會發(fā)脾氣,對它來講,它永遠(yuǎn)只要加了數(shù)據(jù)以后,它會越來越聰明,但是計算機不可能統(tǒng)治人類。過去機器是人類的工具,未來機器是人類的合作伙伴。機器不可能有智慧,機器不可能有使命,機器也做不到價值觀,也不可能有很好的這套文化體系。

在資訊推薦上,算法的優(yōu)勢毋庸置疑,然而,它不可能取代人,編輯有智慧、使命、價值觀、文化趣味等等,這些如果能夠與算法結(jié)合,一方面可幫助算法進(jìn)化,另一方面可直接影響推薦。一點資訊采取算法為主、編輯為輔的方式,嘗試給技術(shù)注入人文情懷,把媒體基因以及編輯對用戶、對內(nèi)容消費的深刻洞察融入算法,AlphaGo是深度學(xué)習(xí)棋局,一點資訊則是人工編輯將上萬篇包括普利策新聞獎在內(nèi)的優(yōu)質(zhì)文章輸入內(nèi)容庫用以訓(xùn)練機器算法,讓機器通過尋找其中共性,學(xué)習(xí)篩選具備同類特質(zhì)的文章再應(yīng)用于內(nèi)容畫像和推薦分發(fā);天天快報則采取編輯為主、算法為輔的方式,他們會有微信群收集優(yōu)質(zhì)內(nèi)容創(chuàng)作者的優(yōu)質(zhì)內(nèi)容并酌情推薦;今日頭條強調(diào)依賴技術(shù),但有消息稱他們也在引入編輯模式。

2、用戶參與,數(shù)據(jù)多元,綜合評價。

如果我們只是基于用戶閱讀數(shù),點擊量這樣的少數(shù)指標(biāo)對一個內(nèi)容進(jìn)行是否受歡迎的判斷,并不恰當(dāng),但如果能夠引入“內(nèi)容閱讀時長”、“內(nèi)容評論數(shù)量”、“內(nèi)容分享次數(shù)”這些數(shù)據(jù),并將這些行為相關(guān)的數(shù)據(jù)進(jìn)行再度收集,形成更加全面的內(nèi)容反饋數(shù)據(jù),基于此進(jìn)行內(nèi)容質(zhì)量評價將更加客觀。在這一點上,一點資訊的做法不失為一種比較好的嘗試,除了用戶點擊、閱讀時長、是否有收藏點贊分享這些緯度,還會更加依賴用戶的主動興趣表達(dá),一點資訊在成立初期便把搜索引擎在底層技術(shù)架構(gòu)融入到推薦引擎中,目前是唯一一款可以實現(xiàn)搜索任意關(guān)鍵詞再訂閱成為用戶專屬個性化頻道的產(chǎn)品。

與此同時,通過反作弊技術(shù)去剔除掉“臟數(shù)據(jù)”,并允許用戶舉報標(biāo)題黨、低至化等方式來降低一個內(nèi)容的權(quán)重,甚至降低一個內(nèi)容生產(chǎn)者的整體權(quán)重,說白了,就是把搜索引擎對網(wǎng)站網(wǎng)頁的套路,搬到移動資訊客戶端上來,眼下我看到今日頭條、一點資訊已經(jīng)開始有這些動作,比如允許用戶舉報標(biāo)題黨。

還有就是對用戶應(yīng)該進(jìn)行更加全面的了解。我們不應(yīng)該只是了解用戶當(dāng)下的閱讀興趣,訂閱過什么頻道,消費過什么內(nèi)容,這些信息完全不足以了解一個用戶,更別說一個用戶還會隨著場景的變化、時間的遷移而改變閱讀需求。我們應(yīng)該去了解這個用戶的職業(yè),圈層,口味等等一切可以了解的習(xí)慣,并基于此進(jìn)行更加智能的推薦,避免讓用戶閱讀興趣越來越窄,在這一點上一點資訊做得比較好,至少在興趣標(biāo)簽上一點資訊就有多達(dá)300萬個,你不只是訂閱幾個頻道,而是可以搜索你感興趣的一切話題,結(jié)合搜索引擎+推薦引擎,一點資訊對用戶進(jìn)行了主動與被動的全面了解。

3、人人為我、訂閱關(guān)注、眾包編輯。

微博與微信公眾賬號是個性化資訊客戶端嗎?當(dāng)時是,曾幾何時,微博只是基于follow關(guān)系給你源源不斷的信息流,其邏輯是“我關(guān)注一個人,就會關(guān)注這個人關(guān)注的內(nèi)容”。現(xiàn)如今微博也十分強調(diào)算法,信息流中會出現(xiàn)你沒有Follow的信息。微信朋友圈和微信公眾賬號則依然是基于人與人的關(guān)系的內(nèi)容推薦,朋友圈中人人都是編輯,給你過濾了許多信息,我們訂閱微信公眾賬號同樣是因為一個人或者一個組織。

正是因為此,今日頭條、一點資訊、天天快報都會強調(diào)“訂閱”,希望可在內(nèi)容生產(chǎn)者與內(nèi)容消費者之前建立更緊密的聯(lián)系。然而,除此之外,資訊客戶端是否可以考慮更多地利用人與人的關(guān)系?比如我關(guān)注一個內(nèi)容生產(chǎn)者,就可以看到這個內(nèi)容生產(chǎn)者閱讀或推薦的內(nèi)容,知乎在這一點上做得就很到位,百度知道之后知乎為何脫穎而出,就是社會化,就是利用好了人與人的關(guān)系,美國版貼吧Reddit定位為社會化新聞網(wǎng)站,其理念正是人人皆是編輯。那么,個性化資訊之后,會不會是社會化個性資訊客戶端呢?我想,很有可能。

微博@互聯(lián)網(wǎng)阿超 微信 羅超(luochaotmt)

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-10-20
算法有三個陷阱,移動資訊客戶端如何規(guī)避?
個性化資訊之后,會不會是社會化個性資訊客戶端呢?我想,很有可能。

長按掃碼 閱讀全文