黑科技刷屏烏鎮(zhèn)后,快手背后的AI天團終于現(xiàn)身了

當一家以短視頻業(yè)務為主的企業(yè)進行產(chǎn)業(yè)延伸,它們會選擇哪些方向?相信大多數(shù)人腦海中會立刻閃出這些答案:連接電商流量變現(xiàn)、建立MCN機構自制節(jié)目等。其實所有以內容為起點的產(chǎn)業(yè),發(fā)展路徑也大致如此。也正因如此,很多內容平臺對于流量過度依賴,要大力維護平臺頭部博主或不斷靠外部廣告引流,最終使運營成本居高不下。

但同樣以短視頻為起點的快手,卻給出了不同的答案。

科技公司:從短視頻出發(fā)能到達哪些地方?

在今年的烏鎮(zhèn)互聯(lián)網(wǎng)大會上,有一個展臺被圍得水泄不通,好奇的觀眾、媒體排起了長隊都想體驗下展臺上的黑科技。這個展臺是快手的展臺,但展臺如此火爆并非是因為非常受歡迎的“手工耿”這樣的快手網(wǎng)紅,而是三項參與感較強的黑科技。

其中有 “世界上另一個你”,通過人臉識別找到快手平臺上跟你長的最像的用戶,就連現(xiàn)場體驗的印度記者也找到一位和自己非常相似的印度快手用戶;還有“快手平安系統(tǒng)”,可以將官方發(fā)布的國家預警信息第一時間推送給災害發(fā)生地用戶,并且聚集理解發(fā)生地用戶所拍攝的視頻向國家提供一線信息;最后還有快手的“萌面”魔法表情,把人的臉部表情實時復原在可愛的卡通形象上,把曾經(jīng)只有蘋果X獨有的animoji玩法普及到了iOS、安卓的所有機型。

這三項黑科技,體現(xiàn)了快手這家科技公司在做的探索,通過短視頻、通過AI等科技,帶給用戶更新奇的體驗。

首先是對于人臉識別技術的無限應用可能。

在“世界上另一個你”項目中,快手所展示的其實是其量級極大、覆蓋面極廣的人臉數(shù)據(jù)庫,以及適用于多種特征的識別技術。要知道不同性別、不同人種的人臉特征是有很大差異的,當數(shù)據(jù)樣本分布不均時,就會出現(xiàn)自拍無法被識別五官的情況。

尤其是如今人臉識別已經(jīng)成為一種高度商業(yè)化的AI技術,快手所展示出的不光是技術實力,還有面向全球的商業(yè)前景。

第二則是利用巨大用戶量和AI技術對于智慧城市的補充。

快手平安系統(tǒng)可以說是和快手當下主營業(yè)務關聯(lián)最小的技術了,可也是最具有實用性的之一。災難預警一直是智慧城市建設的目標之一,但在智慧城市建設的過程中,快手可以憑借著自己巨大的用戶量和對三四線城市及鄉(xiāng)鎮(zhèn)地區(qū)的覆蓋來予以補充。

當鄉(xiāng)鎮(zhèn)、農(nóng)村還來不及布設那么多應用于智慧城市的傳感器時,平安系統(tǒng)對于用戶拍攝內容的理解就讓居民本身變成了更靈活的傳感器,及時地搜尋信息。其實不止災難預警,在用戶分布基礎和內容理解能力下,很多我們渴望通過智慧城市實現(xiàn)的效果,也能通過快手實現(xiàn)。

第三是利用技術對于軟硬件進行協(xié)調。

快手的多媒體內容理解部門所推出的“萌面”魔法表情,讓千元機也能實現(xiàn)iPhone X人臉結構光的效果,其實這種算法實現(xiàn)or硬件實現(xiàn)的分歧也曾在手機廠商中出現(xiàn)。之前谷歌的Pixel就一直堅持采用單目攝像頭來實現(xiàn)雙攝效果,解決途徑就是算法。對于一些低造價的硬件產(chǎn)品來說,能夠提升體驗的算法非常重要。

快手在這方面的優(yōu)異表現(xiàn),也為自己贏得了更多和硬件廠商對話的可能。

內容淘金的AI天團:比黑科技更神秘的快手多媒體內容理解部門

也就是說,和其他很多內容產(chǎn)品不同,快手在技術本身、應用場景挖掘和硬件協(xié)調三個方向上都有很強大的延展能力。這種強大延展能力的來源,就是快手本身豐富的內容源。

內容雖然是金礦,但能讓金礦發(fā)揮出價值的還是淘金者。在快手大量視頻內容中淘金的,是快手的多媒體內容理解部門(英文全稱:Multimedia Understanding 簡稱:MMU)。上文提到在烏鎮(zhèn)刷屏的黑科技,就出自快手的多媒體內容理解部。團隊由近百名算法工程師、應用工程師構成,聚焦多媒體內容的理解與應用。在內容理解方面,MMU主要通過對人臉、圖像、音樂、視頻四個維度實現(xiàn)對多媒體內容的感知,并融合感知內容和知識圖譜,實現(xiàn)對視頻高層語義及情感的理解,從而讓機器高效看懂海量內容。目前,多媒體內容理解部的核心技術服務于內容安全、原創(chuàng)保護、視頻創(chuàng)作、視頻推薦、視頻搜索及商業(yè)化等方面。

從快手的多媒體內容理解部出發(fā),我們可以嘗試探討下:以內容為起點,用技術撬動更多價值,都需要哪些工具?

1、 不斷增長的數(shù)據(jù)源

快手在數(shù)據(jù)上的優(yōu)勢不僅僅是量大,更重要的是類型豐富并且持續(xù)保持增長,讓內容理解可以不斷根據(jù)用戶不同時期和狀態(tài)的需要進行自我驅動的革新。

樹立起快手強大內容理解的跨模態(tài)內容分類,就是建立在豐富的內容種類上,對于視頻+音頻、畫面+用戶行為等等元素進行綜合理解才能達成。如果沒有豐富的數(shù)據(jù)來源,也是很難實現(xiàn)的。

2、 充足的算力資源

想對內容尤其是視頻內容進行深度的挖掘,算力自然是不可或缺的??焓侄嗝襟w內容理解部擁有5000塊GPU構成的超算中心,為種種新嘗試提供源源不斷的動力。不管是內容的理解還是生成,都可以利用好云端算力,減輕對用戶終端算力的要求。

3、 深厚的人才底蘊

真正能把數(shù)據(jù)和算力利用起來的,還是人才。作為快手技術創(chuàng)新的中流砥柱,快手多媒體內容理解部是快手博士最多的部門,算法團隊中有四成都是AI領域的博士,可以說是快手的“AI天團”。

在技術研究為導向的AI領域,人才可以說是企業(yè)的原動力,因此快手才能在跨模態(tài)融合技術方向占據(jù)業(yè)界領先優(yōu)勢。

4、 技術與業(yè)務的緊密貼合

現(xiàn)在企業(yè)里設立個AI研究院或實驗室已經(jīng)成了風尚,但如果目的是讓技術對企業(yè)業(yè)務本身產(chǎn)生驅動,研究部門能否和業(yè)務線緊密貼合非常重要。像快手多媒體內容理解部的核心技術就服務于快速內容安全、原創(chuàng)保護、視頻創(chuàng)作、視頻推薦、視頻搜索及商業(yè)化等方面。有業(yè)務線上的及時反饋,技術研究才能在快速迭代中不斷接近正確方向。

當快手冠以AI之名:不僅淘金,還要點石成金

這四項優(yōu)勢可以說是多媒體內容理解部內容淘金的四樣神器,讓多媒體內容理解部驅動整個快手打開了更多的延展空間。

而從這次烏鎮(zhèn)上展示的項目看來,快手的野心遠遠不僅是掌握礦脈,而是渴望點石成金的能力。

視頻生成技術中體現(xiàn)出的跨模態(tài)識別算法,平安系統(tǒng)中體現(xiàn)出的強大算力和數(shù)據(jù)資源,加上快手多媒體內容理解部本身的人才儲備,這一切都說明了快手正在無限貼近他們對于自身的定位:一家AI企業(yè)。

短視頻只是輸出AI技術的方式之一,當擁有點石成金的能力后,快手的未來可以有很多選擇。

例如快手可以利用強大的算法推出高性價比的硬件產(chǎn)品,就像Snapchat推出AR眼鏡一樣。不管是自研還是合作的方式,以快手用戶的技術和活躍度,相信可以很快拓展開市場。

要么快手可以和Facebook這類社交媒體平臺一樣,開放技術API將自身打造成時下流行的AR開發(fā)平臺。一方面鼓勵開發(fā)者為短視頻業(yè)務貢獻更多特效,另一方面可以接入營銷類業(yè)務。

快手甚至可以面向產(chǎn)業(yè)成為可以輸出技術的供應商,在安防、考勤等等領域提供人臉識別和視頻內容理解技術。

總之在快手多媒體內容理解部的支持下,快手的AI技術可以在很多地方創(chuàng)造價值。AI企業(yè)未來五光十色的豐富可能性,也一樣投射到了快手身上。

當然,這些都是局外人的猜測?;蛟S快手會一直像CEO宿華說的那樣,像陽光一樣普照大地,利用技術去改變每一個普通人的生活。而在AI驅動的時代大幕上,每一家企業(yè)都置身洪流之中。擁有技術便意味著擁有選擇權,任浪潮波動也一切由己。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-11-15
黑科技刷屏烏鎮(zhèn)后,快手背后的AI天團終于現(xiàn)身了
內容淘金的AI天團:比黑科技更神秘的快手多媒體內容理解部門快手在數(shù)據(jù)上的優(yōu)勢不僅僅是量大,更重要的是類型豐富并且持續(xù)保持增長,讓內容理解可以不斷根據(jù)用戶不同時期和狀態(tài)的需要進行自我驅…

長按掃碼 閱讀全文