這一天,我們讀了千頁(yè)往事,和一頁(yè)叫做“百度大腦”的未來

原標(biāo)題:這一天,我們讀了千頁(yè)往事,和一頁(yè)叫做“百度大腦”的未來

剛剛過去的世界讀書日,大體與所有節(jié)日一樣,都是媒體和各企業(yè)必要參與的節(jié)慶。

相信大家都已經(jīng)看到,社交媒體上大家都在推出各種和讀書、書籍有關(guān)的東西。有人笑言,這一天把一年也看不完的書都推出來了。

所有企業(yè)和媒體,無論推什么書籍、書人和書事,必然都是關(guān)于歷史和往事的內(nèi)容。但今年卻有了一個(gè)例外。百度大腦在這天推出了一個(gè)同樣切題世界讀書日的玩法,實(shí)際上為讀者奉上的卻是一碟未來。

4月23日,百度大腦攜手Kindle,發(fā)布了一個(gè)名為“遇見著名的你”的創(chuàng)意H5。這個(gè)H5的玩法不同之處在于,用戶只需上傳自己的正面照,百度大腦就會(huì)自動(dòng)進(jìn)行分析,把對(duì)用戶的識(shí)別和理解,匹配到名著中某一段關(guān)于人物的描寫或者故事情節(jié)。

從而告訴用戶,此刻的你最像哪本名著中的哪段故事。這種感覺很是奇妙,在一個(gè)不期然的瞬間,突然知道此刻自己的衣著穿戴和表情,竟然與多少年前秉燭夜讀時(shí)遇到的文字如出一轍。

喚醒對(duì)閱讀的追憶和神往,“身臨其境”顯然是一種不錯(cuò)的選擇。

但是這場(chǎng)優(yōu)雅而雋永的“遇見”,回歸到技術(shù)層面卻并不容易。對(duì)AI有了解的朋友,顯然會(huì)發(fā)現(xiàn)這個(gè)H5在識(shí)別和判斷中所展現(xiàn)的“智慧“,已經(jīng)遠(yuǎn)遠(yuǎn)超出大家對(duì)類似玩法的常識(shí)認(rèn)知。

遇見名著中的自己之后,我們也許有必要細(xì)數(shù)這背后究竟隱藏著哪些技術(shù)因素。借此,或許可以精準(zhǔn)讀取出關(guān)于AI的未來能力。

“穿越回名著“是一個(gè)入口,曲徑通幽連著不同遠(yuǎn)近的未來圖景。而這條“徑”,被稱作百度大腦。

此刻的未來:AI能做的,遠(yuǎn)比想象中更多

對(duì)于AI帶來的識(shí)別能力,相信大家已經(jīng)并不陌生。今天機(jī)場(chǎng)車站都已經(jīng)運(yùn)用了人臉識(shí)別功能,解鎖手機(jī)也有3D人臉識(shí)別這一選項(xiàng)。

但是如果大家覺得AI只能識(shí)別人臉,那可能就大錯(cuò)特錯(cuò)了。

從“遇見著名的你”H5中,百度大腦最直接展現(xiàn)出的能力,是其所提供的AI能力種類,已經(jīng)遠(yuǎn)遠(yuǎn)超過了大眾想象。

換句話說,在大家剛剛開始習(xí)慣簡(jiǎn)單人臉識(shí)別的時(shí)候,百度大腦已經(jīng)小試牛刀展示出了AI技術(shù)在識(shí)別和理解層面可以達(dá)到的高度——對(duì)于大眾行業(yè)來說這是未來,對(duì)于百度大腦來說,這就是現(xiàn)在。

比如說,在這個(gè)H5中,百度大腦不只是能夠識(shí)別出人臉,還會(huì)更加復(fù)雜地進(jìn)行“人臉屬性識(shí)別”。具體來說,就是百度大腦能通過照片上的面部信息,識(shí)別出照片中人的性別、年齡、表情等信息。我在幾個(gè)同事身上做了測(cè)試,年齡識(shí)別這個(gè)很困難的技術(shù),百度大腦的判斷都相當(dāng)準(zhǔn)確。

而在人臉屬性識(shí)別之外,百度大腦這次還展現(xiàn)了另一個(gè)AI技術(shù):人體分析。顧名思義,這一技術(shù)的識(shí)別對(duì)象不是人臉,而是人的體態(tài)。在H5中,百度大腦通過對(duì)全身照用人體分析能力,可以識(shí)別出照片中用戶的性別、年齡、服飾類別及顏色、佩戴物、行為動(dòng)作等信息。最終通過把理解后的信息抽象出來,與AI所理解的名著段落進(jìn)行匹配,完成“穿越”。

同時(shí),H5中還融入了百度大腦的車輛識(shí)別能力,能夠識(shí)別圖片中的交通工具。

能夠看懂用戶的容貌體態(tài),才僅僅是個(gè)開始。要想準(zhǔn)確匹配到名著的段落,還需要對(duì)大量名著文本信息進(jìn)行理解,這就涉及語(yǔ)義理解這個(gè)AI能力。通過對(duì)Kindle提供的超過百萬(wàn)冊(cè)書籍進(jìn)行學(xué)習(xí),百度大腦將各部名著中的人物描寫和情節(jié)段落進(jìn)行了準(zhǔn)確抽離。讓AI把讀書學(xué)來的知識(shí),和看人識(shí)物的本事放在一起,多種能力融合,這才帶給用戶一場(chǎng)“名著穿越”。

作為測(cè)試,我拍了一張同事的照片交給百度大腦來匹配。通過識(shí)別出年齡29歲、表情是高興,然后搭配黑色長(zhǎng)褲,這張照片被匹配到了《鋼鐵是怎樣煉成的》中保爾回到冬妮婭身邊那一幕。

同事問我這代表了什么,我說這是AI覺得你像剛從戰(zhàn)場(chǎng)回來的。

以上多維度的AI能力綜合,才最終做到了這件很是神奇的“小事”。而其背后,則意味著我們期待的大量AI能力為人類服務(wù),這一非?!拔磥怼钡木跋螅鋵?shí)已經(jīng)被百度大腦帶入了我們身邊。

即將發(fā)生的未來:當(dāng)我們習(xí)慣用百度大腦來“智慧結(jié)繩”

更深一層的未來,在于這一H5背后展現(xiàn)的,并不是一個(gè)個(gè)單體的AI技術(shù),而是將大量技術(shù)融合到渾然天成。用戶在毫無知覺的情況下,就得到了經(jīng)過復(fù)雜識(shí)別與匹配的結(jié)果。

讓我們一同思考這樣一個(gè)問題:人的智慧和單一的機(jī)器,二者到底有什么區(qū)別?

最大的區(qū)別可能在于,無論多復(fù)雜的“機(jī)器”,都只能用單一能力完成單一目標(biāo)。無論是生產(chǎn)線還是電腦,莫不如是。而人的能力在于,我們可以利用手耳眼腳心,集成所有的感官和思考,在同一點(diǎn)上迸發(fā)出來,解決同一個(gè)問題。我們可以聽到命令,經(jīng)過思考,馬上實(shí)踐。這樣的綜合和轉(zhuǎn)化,是傳統(tǒng)意義上“機(jī)器”不具備的能力。

然而規(guī)則正在發(fā)生改變。

運(yùn)用之妙存乎一心,在這次“穿越名著”背后,百度大腦展示出了對(duì)多跟AI技術(shù)絲線的“結(jié)繩”。即通過整合調(diào)用,把大量技術(shù)融合解決同一個(gè)問題。這個(gè)思路的背后,事實(shí)上是百度大腦3.0的核心技術(shù)突破“多模態(tài)深度語(yǔ)義理解”。多模態(tài)融合與多信道統(tǒng)一,不僅讓AI能聽和看,還可以理解實(shí)物背后的含義。比如說理解一張照片如何匹配名著中的一段情節(jié),既要能夠看清看懂照片上有哪些因素,又要讀懂名著的大段內(nèi)容中,哪些是關(guān)于人物表情、服裝、配飾和交通工具的描寫。二者結(jié)合,才有智慧。

而現(xiàn)實(shí)世界中,也在經(jīng)歷必須讓AI從單獨(dú)的聽和看,走向多看多聽之后的自我理解這樣一個(gè)趨勢(shì)。這是一個(gè)極其廣泛的技術(shù)需求,甚至大量產(chǎn)業(yè)應(yīng)用AI能力都必須以其為基礎(chǔ)。而這樣的需求,就要求技術(shù)綜合體必須具備三個(gè)能力:平臺(tái)化、實(shí)用導(dǎo)向和多模態(tài)融合。

經(jīng)歷百度多年AI技術(shù)積累的百度大腦,恰好就處在這樣一個(gè)位置。它包括視覺、語(yǔ)音、自然語(yǔ)言處理、知識(shí)圖譜、深度學(xué)習(xí)等 AI 核心技術(shù)和 AI 開放平臺(tái),對(duì)內(nèi)支持百度所有業(yè)務(wù),對(duì)外全方位開放,賦能各行各業(yè)轉(zhuǎn)型升級(jí)。

從有技術(shù)到能夠用技術(shù),從單體智能走向泛智能,百度大腦已經(jīng)打開了開關(guān),這個(gè)即將發(fā)生的未來,意味著社會(huì)化生產(chǎn)的全新AI可能性。

未來的未來:或許,我們終將靠AI之舟跨過“莊子悖論”

為了凝視更遠(yuǎn)的未來,讓我們回到世界讀書日的意義。

哪怕每一天都是世界讀書日,必須承認(rèn)的是人類已經(jīng)徹底陷入了“莊子悖論”,即生有涯而知也無涯。在信息爆炸、知識(shí)碎片化、體系學(xué)習(xí)成本越來越重的未來,人類究竟如何與“知識(shí)”這個(gè)怪獸相處呢?

日本著名漫畫家、《圣斗士星矢》的作者浜津守,還有一部知名的作品,翻譯為《鐵甲神兵》。那部漫畫里有一個(gè)令我印象深刻的角色,他是一位哲學(xué)家,但面對(duì)浩如煙海的知識(shí),他感到生命如此短暫。最終他選擇把身體化為分子態(tài)以求永生,就是為了讀完所有的人類知識(shí)。

雖然是一個(gè)漫畫人物,但這卻是一個(gè)鮮明的隱喻。知識(shí)體系越來越細(xì)分,好內(nèi)容不計(jì)其數(shù),但適合自己的書籍又隱藏在我們難以意料的角落里,這樣一個(gè)時(shí)代,人類究竟該如何妥善地閱讀?

百度大腦在這一天,展示了這樣一個(gè)未來的一角:不僅僅是人去閱讀知識(shí),而是讓AI來閱讀人類,通過識(shí)別和理解,把最適合你的那一頁(yè)放在你的面前。

對(duì)抗人類與知識(shí)的鴻溝,或許會(huì)在未來成為人類主要難題之一。雖然那還是非常遙遠(yuǎn)的未來,但百度大腦無疑掀起了簾幕一角,讓我們看到不用追求永生,人類同樣可以更高效率地追逐知識(shí)。

當(dāng)然,這里不是教導(dǎo)大家放棄閱讀,一味等候智能。但不可否認(rèn)的是,人類與信息的交互方式正在快速迭代,從固定時(shí)空閱讀,到隨時(shí)閱讀,再到未來的AI來為你閱讀。世界讀書日這天,百度大腦帶來的終極人文關(guān)懷,是關(guān)于知識(shí)與生命交互的一次勇敢思考。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-04-24
這一天,我們讀了千頁(yè)往事,和一頁(yè)叫做“百度大腦”的未來
換句話說,在大家剛剛開始習(xí)慣簡(jiǎn)單人臉識(shí)別的時(shí)候,百度大腦已經(jīng)小試牛刀展示出了AI技術(shù)在識(shí)別和理解層面可以達(dá)到的高度——對(duì)于大眾行業(yè)來說這是未來,對(duì)于百度大腦來說,這就是現(xiàn)在。

長(zhǎng)按掃碼 閱讀全文