這一天,我們讀了千頁往事,和一頁叫做“百度大腦”的未來

剛剛過去的世界讀書日,大體與所有節(jié)日一樣,都是媒體和各企業(yè)必要參與的節(jié)慶。

相信大家都已經看到,社交媒體上大家都在推出各種和讀書、書籍有關的東西。有人笑言,這一天把一年也看不完的書都推出來了。

所有企業(yè)和媒體,無論推什么書籍、書人和書事,必然都是關于歷史和往事的內容。但今年卻有了一個例外。百度大腦在這天推出了一個同樣切題世界讀書日的玩法,實際上為讀者奉上的卻是一碟未來。

4月23日,百度大腦攜手Kindle,發(fā)布了一個名為“遇見著名的你”的創(chuàng)意H5。這個H5的玩法不同之處在于,用戶只需上傳自己的正面照,百度大腦就會自動進行分析,把對用戶的識別和理解,匹配到名著中某一段關于人物的描寫或者故事情節(jié)。

從而告訴用戶,此刻的你最像哪本名著中的哪段故事。這種感覺很是奇妙,在一個不期然的瞬間,突然知道此刻自己的衣著穿戴和表情,竟然與多少年前秉燭夜讀時遇到的文字如出一轍。

喚醒對閱讀的追憶和神往,“身臨其境”顯然是一種不錯的選擇。

但是這場優(yōu)雅而雋永的“遇見”,回歸到技術層面卻并不容易。對AI有了解的朋友,顯然會發(fā)現(xiàn)這個H5在識別和判斷中所展現(xiàn)的“智慧“,已經遠遠超出大家對類似玩法的常識認知。

遇見名著中的自己之后,我們也許有必要細數這背后究竟隱藏著哪些技術因素。借此,或許可以精準讀取出關于AI的未來能力。

“穿越回名著“是一個入口,曲徑通幽連著不同遠近的未來圖景。而這條“徑”,被稱作百度大腦。

此刻的未來:AI能做的,遠比想象中更多

對于AI帶來的識別能力,相信大家已經并不陌生。今天機場車站都已經運用了人臉識別功能,解鎖手機也有3D人臉識別這一選項。

但是如果大家覺得AI只能識別人臉,那可能就大錯特錯了。

從“遇見著名的你”H5中,百度大腦最直接展現(xiàn)出的能力,是其所提供的AI能力種類,已經遠遠超過了大眾想象。

換句話說,在大家剛剛開始習慣簡單人臉識別的時候,百度大腦已經小試牛刀展示出了AI技術在識別和理解層面可以達到的高度——對于大眾行業(yè)來說這是未來,對于百度大腦來說,這就是現(xiàn)在。

比如說,在這個H5中,百度大腦不只是能夠識別出人臉,還會更加復雜地進行“人臉屬性識別”。具體來說,就是百度大腦能通過照片上的面部信息,識別出照片中人的性別、年齡、表情等信息。我在幾個同事身上做了測試,年齡識別這個很困難的技術,百度大腦的判斷都相當準確。

而在人臉屬性識別之外,百度大腦這次還展現(xiàn)了另一個AI技術:人體分析。顧名思義,這一技術的識別對象不是人臉,而是人的體態(tài)。在H5中,百度大腦通過對全身照用人體分析能力,可以識別出照片中用戶的性別、年齡、服飾類別及顏色、佩戴物、行為動作等信息。最終通過把理解后的信息抽象出來,與AI所理解的名著段落進行匹配,完成“穿越”。

同時,H5中還融入了百度大腦的車輛識別能力,能夠識別圖片中的交通工具。

能夠看懂用戶的容貌體態(tài),才僅僅是個開始。要想準確匹配到名著的段落,還需要對大量名著文本信息進行理解,這就涉及語義理解這個AI能力。通過對Kindle提供的超過百萬冊書籍進行學習,百度大腦將各部名著中的人物描寫和情節(jié)段落進行了準確抽離。讓AI把讀書學來的知識,和看人識物的本事放在一起,多種能力融合,這才帶給用戶一場“名著穿越”。

作為測試,我拍了一張同事的照片交給百度大腦來匹配。通過識別出年齡29歲、表情是高興,然后搭配黑色長褲,這張照片被匹配到了《鋼鐵是怎樣煉成的》中保爾回到冬妮婭身邊那一幕。

同事問我這代表了什么,我說這是AI覺得你像剛從戰(zhàn)場回來的。

以上多維度的AI能力綜合,才最終做到了這件很是神奇的“小事”。而其背后,則意味著我們期待的大量AI能力為人類服務,這一非?!拔磥怼钡木跋?,其實已經被百度大腦帶入了我們身邊。

即將發(fā)生的未來:當我們習慣用百度大腦來“智慧結繩”

更深一層的未來,在于這一H5背后展現(xiàn)的,并不是一個個單體的AI技術,而是將大量技術融合到渾然天成。用戶在毫無知覺的情況下,就得到了經過復雜識別與匹配的結果。

讓我們一同思考這樣一個問題:人的智慧和單一的機器,二者到底有什么區(qū)別?

最大的區(qū)別可能在于,無論多復雜的“機器”,都只能用單一能力完成單一目標。無論是生產線還是電腦,莫不如是。而人的能力在于,我們可以利用手耳眼腳心,集成所有的感官和思考,在同一點上迸發(fā)出來,解決同一個問題。我們可以聽到命令,經過思考,馬上實踐。這樣的綜合和轉化,是傳統(tǒng)意義上“機器”不具備的能力。

然而規(guī)則正在發(fā)生改變。

運用之妙存乎一心,在這次“穿越名著”背后,百度大腦展示出了對多跟AI技術絲線的“結繩”。即通過整合調用,把大量技術融合解決同一個問題。這個思路的背后,事實上是百度大腦3.0的核心技術突破“多模態(tài)深度語義理解”。多模態(tài)融合與多信道統(tǒng)一,不僅讓AI能聽和看,還可以理解實物背后的含義。比如說理解一張照片如何匹配名著中的一段情節(jié),既要能夠看清看懂照片上有哪些因素,又要讀懂名著的大段內容中,哪些是關于人物表情、服裝、配飾和交通工具的描寫。二者結合,才有智慧。

而現(xiàn)實世界中,也在經歷必須讓AI從單獨的聽和看,走向多看多聽之后的自我理解這樣一個趨勢。這是一個極其廣泛的技術需求,甚至大量產業(yè)應用AI能力都必須以其為基礎。而這樣的需求,就要求技術綜合體必須具備三個能力:平臺化、實用導向和多模態(tài)融合。

經歷百度多年AI技術積累的百度大腦,恰好就處在這樣一個位置。它包括視覺、語音、自然語言處理、知識圖譜、深度學習等 AI 核心技術和 AI 開放平臺,對內支持百度所有業(yè)務,對外全方位開放,賦能各行各業(yè)轉型升級。

從有技術到能夠用技術,從單體智能走向泛智能,百度大腦已經打開了開關,這個即將發(fā)生的未來,意味著社會化生產的全新AI可能性。

未來的未來:或許,我們終將靠AI之舟跨過“莊子悖論”

為了凝視更遠的未來,讓我們回到世界讀書日的意義。

哪怕每一天都是世界讀書日,必須承認的是人類已經徹底陷入了“莊子悖論”,即生有涯而知也無涯。在信息爆炸、知識碎片化、體系學習成本越來越重的未來,人類究竟如何與“知識”這個怪獸相處呢?

日本著名漫畫家、《圣斗士星矢》的作者浜津守,還有一部知名的作品,翻譯為《鐵甲神兵》。那部漫畫里有一個令我印象深刻的角色,他是一位哲學家,但面對浩如煙海的知識,他感到生命如此短暫。最終他選擇把身體化為分子態(tài)以求永生,就是為了讀完所有的人類知識。

雖然是一個漫畫人物,但這卻是一個鮮明的隱喻。知識體系越來越細分,好內容不計其數,但適合自己的書籍又隱藏在我們難以意料的角落里,這樣一個時代,人類究竟該如何妥善地閱讀?

百度大腦在這一天,展示了這樣一個未來的一角:不僅僅是人去閱讀知識,而是讓AI來閱讀人類,通過識別和理解,把最適合你的那一頁放在你的面前。

對抗人類與知識的鴻溝,或許會在未來成為人類主要難題之一。雖然那還是非常遙遠的未來,但百度大腦無疑掀起了簾幕一角,讓我們看到不用追求永生,人類同樣可以更高效率地追逐知識。

當然,這里不是教導大家放棄閱讀,一味等候智能。但不可否認的是,人類與信息的交互方式正在快速迭代,從固定時空閱讀,到隨時閱讀,再到未來的AI來為你閱讀。世界讀書日這天,百度大腦帶來的終極人文關懷,是關于知識與生命交互的一次勇敢思考。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-04-24
這一天,我們讀了千頁往事,和一頁叫做“百度大腦”的未來
換句話說,在大家剛剛開始習慣簡單人臉識別的時候,百度大腦已經小試牛刀展示出了AI技術在識別和理解層面可以達到的高度——對于大眾行業(yè)來說這是未來,對于百度大腦來說,這就是現(xiàn)在。

長按掃碼 閱讀全文