Netflix 是如何推薦電影的

在信息爆炸的時代,我們面對的選擇越來越多。內(nèi)容提供商們,比如音樂電臺、視頻流媒體、應用商店等,常常把內(nèi)容分成不同的類型,以供用戶們選擇。不過,類型常常是一種寬泛的分類,并不能完全滿足用戶個性需求,而且類型區(qū)分過細的話,常常使人無所適從。

在這種情況下,智能推薦開始出現(xiàn)了。得益于計算機技術的進步,內(nèi)容提供商能夠?qū)τ脩舻膼酆米龀龈鼮榧氈碌姆治觯瑥亩龀龈觽€性化的推薦。通過對Netflix影片分類的深入分析,以及采訪Netflix產(chǎn)品副總裁,Atlantic網(wǎng)站的Alexis C. Madrigal揭示了Netflix影視推薦背后的真相。

Netflix推薦影片的時候,會給出一個非常細致的類型,或者說是一種“微類型”.Alexis 想要整理出一份完整的微類型列表。由于Netflix的微類型多得離譜,他不得不借助于自動處理軟件。在計算機連續(xù)運作一天之后,他看到了Netflix微類型的數(shù)量:76897個。這些微類型是由一些基本要素構成的,基本語法是這樣:

地區(qū)+形容詞+類型(名詞) +基于……+……為背景+來自……+關于……+從 X 歲到 Y 歲

(Region + Adjectives + Noun Genre + Based On… + Set In… + From the… + About… + For Age X to Y)

當然,有些微類型是不符合上述語法的,比如“有強勢女主角”和“適合無可救藥的浪漫主義者。”

在同事Ian Bogost 的建議下,Alexis還編寫了一個類型生成器,試圖理解Netflix的算法究竟是什么樣子的。不過,他還是感覺沒有看到全貌。于是,他聯(lián)系了Netflix,并見到了公司的產(chǎn)品副總裁Todd Yellin,那個創(chuàng)建了 Netflix 推薦系統(tǒng)的人。

在接受采訪的時候,Todd Yellin說,他早就等著人們來問這個問題了。為所有的電影加上標簽,正是他的主意,而他還自己寫了一張24頁的文檔,講述加標簽的方法。他為早期的一些電影加過標簽,而且主導了整個系統(tǒng)的創(chuàng)建過程。

“我的第一個任務是:把內(nèi)容撕裂開來!”他說。

2006 年,Yellin組織了十幾個工程師,花費數(shù)月時間編寫一份名為“Netflix 量子理論”的文檔。當時,他把組成影片的基本元素稱作“量子”.如今,他更喜歡“微標簽”的說法,因為現(xiàn)在看來,“量子理論”是一個自命不凡的名字。

這份文檔描述了為影片各種層面加標簽的方法,涉及到影片結尾、主角的“社會接受程度”等等方面。標簽是帶標量的,從1到5,就是說,所有的影片都有一個“浪漫程度”的標示,而不僅僅是那些表明是“浪漫片”的電影。每個電影的結局都有打分,從幸福到悲傷。每個情節(jié)都有標簽。主角的工作有標簽。影片的地點有標簽。

Netflix的工程師以“微標簽”為基礎,創(chuàng)造了一種語法,來生成各種類型。這是一種人工和機器算法的結合。Netflix 的做法,與 Pandora 的音樂基金組計劃有些類似,但是 Netflix 不僅僅展示給你喜歡的內(nèi)容,還能夠?qū)ζ溥M行文字描述。

這些標簽數(shù)據(jù)不僅僅用來生成類型,也用來增加推薦的個性化程度。如果你喜歡動作冒險類電影,并且浪漫程度比較高的,Netflix 可以推薦給你。“我們將對影片中的浪漫程度做出標注。我們不會告訴你它有多浪漫,但是我們會推薦它,”Yellin 說,“你會看到動作場面,里面的浪漫程度如何,那取決于我們對你的了解。”

在采訪結束之前,Alexis 向Yellin展示了一個有趣的圖表。Netflix上最受歡迎的演員排名中,占據(jù)第一名的是Raymond Burr,50 年代電視劇Perry Mason的主演,而占據(jù)第七名的是Barbara Hale,在劇中扮演主演的秘書。為什么這兩個人能夠超過梅麗爾·斯特里普、塞繆爾·杰克遜、尼古拉斯·凱奇和肖恩·康納利?

這是一個謎題。即使是Yellin也搞不懂,為什么他們的名字出現(xiàn)在那么多的“微類型”中。這是無法用邏輯來解釋的問題。

“讓我們做些哲學思考吧。在人類社會中,生命由于意外而變得有趣。”他說,“當你把復雜的東西添加到機器的世界時,你也在添加自己無法想象的意外。Perry Mason就會發(fā)生。這些機器中的鬼魂,經(jīng)常是復雜帶來的副產(chǎn)品。有時候我們稱它為失誤,有時候我們稱之為特色。”

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2014-01-06
Netflix 是如何推薦電影的
在信息爆炸的時代,我們面對的選擇越來越多。內(nèi)容提供商們,比如音樂電臺、視頻流媒體、應用商店等,常常把內(nèi)容分成不同的類型,以供用戶們

長按掃碼 閱讀全文