credit: 譯者畫(huà)的
中國(guó)的大數(shù)據(jù)可能帶領(lǐng)人類(lèi)走向真正的人工智能。
今年年初,兩片知秋之葉引起了全球?qū)θ斯ぶ悄?AI)發(fā)展的關(guān)注。其一,前微軟全球執(zhí)行副總裁陸奇一月份表示,因自行車(chē)事故受傷離職休養(yǎng)后,他不會(huì)再回到世界上最大的軟件公司,而是走馬上任中國(guó)領(lǐng)先的搜索引擎某度的首席運(yùn)營(yíng)官。其二,一月晚些的時(shí)候,美國(guó)人工智能協(xié)會(huì)(AAAI)決定推遲舉辦年度會(huì)議,只因原計(jì)劃位于一月的會(huì)議日期與中國(guó)農(nóng)歷新年相沖突。
最近的跡象顯示,在一些AI領(lǐng)域上中國(guó)可能緊跟美國(guó),甚至可能彎道超車(chē)。而這些AI領(lǐng)域被認(rèn)為對(duì)未來(lái)發(fā)展至關(guān)重要,包括從語(yǔ)音助手到自動(dòng)駕駛汽車(chē)。“百度是代表中國(guó)參與AI角逐的重要的選手”陸奇先生說(shuō),“我們有機(jī)會(huì)領(lǐng)導(dǎo)AI的未來(lái)?!?/p>
支持中國(guó)AI崛起的證據(jù)還有很多。白宮在2016年10月的一份報(bào)告中指出,在AI的分支“深度學(xué)習(xí)”上,中國(guó)發(fā)表的文章已經(jīng)超過(guò)美國(guó)。據(jù)咨詢公司普華永道預(yù)測(cè),在2030年前,與AI相關(guān)的產(chǎn)業(yè)增長(zhǎng)將將全球GDP增加16億美元。據(jù)估計(jì),近一半的收益將會(huì)累積在中國(guó)。在與AI有關(guān)的專(zhuān)利申請(qǐng)數(shù)量上,盡管美國(guó)在絕對(duì)數(shù)量上仍然領(lǐng)先,但中國(guó)研究人員提交的專(zhuān)利申請(qǐng)數(shù)量近幾年增加了近200%(見(jiàn)下圖)。
想要搞明白為什么中國(guó)玩AI玩得這么溜,需要考慮到AI領(lǐng)域所需的投入。計(jì)算能力和資本是最基本的兩個(gè)條件,而中國(guó)在這兩個(gè)條件上投入非常多。中國(guó)企業(yè)從某里巴巴和某企鵝等巨頭到興業(yè)數(shù)金公司和UCloud等初創(chuàng)公司都在迅速建立屬于自己的數(shù)據(jù)中心。據(jù)咨詢公司Gartner介紹,云計(jì)算市場(chǎng)近年來(lái)已經(jīng)增長(zhǎng)了30%以上,并將持續(xù)增長(zhǎng)下去。而根據(jù)智庫(kù)烏鎮(zhèn)研究所(Wuzhen Institute)的統(tǒng)計(jì),2012-2016年,中國(guó)的AI公司收到了26億美元的資金。雖然這遠(yuǎn)低于美國(guó)同行收到的179億美元,但金額總體增長(zhǎng)很快。
然而,真正使中國(guó)成為AI應(yīng)有之地的還有另外兩個(gè)資源。一個(gè)是研究人才。微軟的AI工作主管沈向洋(Harry Shum)說(shuō),除了強(qiáng)大的數(shù)學(xué)技能以外,中國(guó)還有在語(yǔ)言和翻譯領(lǐng)域上的歷史優(yōu)勢(shì)。負(fù)責(zé)領(lǐng)導(dǎo)某里巴巴150位數(shù)據(jù)科學(xué)家的閔萬(wàn)里說(shuō),尋找一流的AI專(zhuān)家在中國(guó)比在美國(guó)更難。但他預(yù)測(cè),未來(lái)幾年將會(huì)有所改變,因?yàn)榇蠖鄶?shù)大學(xué)都推出了AI專(zhuān)業(yè)。據(jù)某種形式的估計(jì),中國(guó)擁有世界五分之二以上訓(xùn)練有素的AI人才。
中國(guó)的第二個(gè)優(yōu)勢(shì)是數(shù)據(jù),數(shù)據(jù)是AI最重要的組成成分。在過(guò)去,軟件和數(shù)字產(chǎn)品大多數(shù)遵守代碼中的規(guī)則,榮耀歸于那些擁有最優(yōu)秀程序員的國(guó)家。隨著深度學(xué)習(xí)算法的出現(xiàn),這些規(guī)則越來(lái)越多地基于從數(shù)據(jù)庫(kù)中提取建立的模型。更多的可用數(shù)據(jù),就意味著可以學(xué)習(xí)更多的算法和產(chǎn)出更智能的AI產(chǎn)品。
中國(guó)國(guó)家的規(guī)模和多樣性為這一過(guò)程提供了強(qiáng)大的燃料。只要與日常生活相關(guān)的數(shù)據(jù),全國(guó)近14億人產(chǎn)生的數(shù)據(jù)幾乎等量與其他所有國(guó)家數(shù)據(jù)之和。即使在處理罕見(jiàn)疾病的情況下,也有足夠的樣本來(lái)教授算法如何識(shí)別它。因?yàn)闈h字打字比西方人的操作更為麻煩,人們往往比西方人更頻繁地使用語(yǔ)音識(shí)別服務(wù),所以互聯(lián)網(wǎng)企業(yè)擁有有更多的語(yǔ)音片段來(lái)改善語(yǔ)音產(chǎn)品。
數(shù)據(jù)土豪
真正使中國(guó)能一騎絕塵甩開(kāi)其他國(guó)家的關(guān)鍵點(diǎn)是其互聯(lián)網(wǎng)用戶數(shù)量:約7.3億。幾乎所有用戶都手機(jī)在線,智能手機(jī)比臺(tái)式電腦產(chǎn)生的數(shù)據(jù)更有價(jià)值,主要是因?yàn)樗鼈儼鞣N傳感器并隨時(shí)攜帶在用戶身邊。例如,在大型沿海城市,用現(xiàn)金進(jìn)行小額支付全部消失,人們使用手機(jī)上的某付寶和某信錢(qián)包這些服務(wù)來(lái)解決支付問(wèn)題
中國(guó)用戶似乎并不是非常關(guān)心隱私,這使得收集數(shù)據(jù)變得更容易。例如,這個(gè)席卷中國(guó)各大城市的共享單車(chē)服務(wù)不僅提供便宜的交通工具,而且是一種所謂的“數(shù)據(jù)狂歡”。當(dāng)用戶租用自行車(chē)時(shí),有些公司會(huì)使用安裝在自行車(chē)上的GPS設(shè)備來(lái)追蹤租賃者的軌跡。(譯者注:因?yàn)镚PS定位非常耗電,所以共享單車(chē)只會(huì)定位停車(chē)點(diǎn),據(jù)我所知摩拜是通過(guò)App開(kāi)啟手機(jī)GPS進(jìn)行軌跡繪制的。)
年輕的中國(guó)人似乎特別熱衷于AI為基礎(chǔ)的服務(wù),并且將他們自己數(shù)據(jù)交給這些服務(wù)區(qū)使用。微軟發(fā)布的一個(gè)積極向上的聊天機(jī)器人小冰現(xiàn)在擁有1億多中國(guó)用戶。大多數(shù)用戶在晚上11點(diǎn)到凌晨3點(diǎn)之間與小冰聊天,內(nèi)容常常是他們白天遇到的問(wèn)題。而小冰正在從用戶互動(dòng)中學(xué)習(xí),變得越來(lái)越聰明?,F(xiàn)在的小冰不再只是提供雞湯和笑話,而是創(chuàng)作了第一首以“陽(yáng)光失了玻璃窗”為題材寫(xiě)的詩(shī)集,這引起了中國(guó)文壇的激烈辯論,人工智能拼合文字寫(xiě)的詩(shī)能否被稱(chēng)為真正意義上的“詩(shī)歌”。
中國(guó)AI領(lǐng)域另一個(gè)重要支持力量就是政府。該領(lǐng)域在該國(guó)目前的五年計(jì)劃中占有重要地位。同時(shí)技術(shù)公司正在與政府機(jī)構(gòu)緊密合作:例如,百度被要求管理國(guó)家深度學(xué)習(xí)實(shí)驗(yàn)室。因此政府不太可能對(duì)AI公司進(jìn)行過(guò)分嚴(yán)格的監(jiān)管。該國(guó)有40多項(xiàng)含有細(xì)則的法律規(guī)定了如何在法律上保護(hù)個(gè)人資料,但這些法律很少得到執(zhí)行。
企業(yè)家們正在充分利用中國(guó)的人才和數(shù)據(jù)優(yōu)勢(shì)發(fā)展自身。許多AI公司只在一兩年前起步,但是與西方同行相比,這些公司的進(jìn)展更為迅速。李開(kāi)復(fù)解釋說(shuō)“中國(guó)AI創(chuàng)業(yè)公司經(jīng)常迭代更新得更快?!彼?000年左右在谷歌子中國(guó)公司擔(dān)任總裁,現(xiàn)在在風(fēng)險(xiǎn)投資公司創(chuàng)新工場(chǎng)當(dāng)老板。
因此,中國(guó)已經(jīng)擁有一群初生的AI牛犢,這些初創(chuàng)公司的總價(jià)值超過(guò)10億美元。某條新聞是一家位于北京的新聞推薦引擎,利用使用讀者興趣和位置等信息進(jìn)行機(jī)器學(xué)習(xí)來(lái)推薦的文章;它還使用人工智能過(guò)濾虛假信息(在中國(guó)主要是可疑的保健廣告)。另一個(gè)AI創(chuàng)業(yè)公司某飛開(kāi)發(fā)了一個(gè)語(yǔ)音助手可以將普通話翻譯成各種外語(yǔ),其中包括英語(yǔ)和德語(yǔ),即便用戶錄入的是方言或錄音混入了背景雜音都可順利完成翻譯。而曠視科技的臉部識(shí)別軟件Face++幾乎可以即時(shí)匹配不同人臉。
“天網(wǎng)”恢恢
在曠視科技總部,來(lái)訪者被均視為識(shí)別對(duì)象。大廳內(nèi)的攝像機(jī)取代了ID識(shí)別:公司員工不需要拿出工卡只需直接走過(guò)大廳就能識(shí)別身份。類(lèi)似的設(shè)備位于辦公室的各個(gè)地方,其反饋資料即使顯示在屏幕墻上。當(dāng)一張臉在屏幕墻上出現(xiàn)的時(shí)候,它立即被一個(gè)白色矩形包圍,在旁顯示有關(guān)該人的一些信息。而在該屏幕的右上角,用大寫(xiě)字母拼寫(xiě)“SKYNET”,這是終結(jié)者系列電影中旨在消滅人類(lèi)的AI系統(tǒng)“天網(wǎng)”的名稱(chēng)。該公司已經(jīng)與某付寶和迪迪(一家旅行公司)合作核查新用戶的身份(將新用戶的面孔與政府身份資料圖片進(jìn)行對(duì)比)。
鑒于類(lèi)似曠視的初創(chuàng)公司的成功,中國(guó)的科技巨頭也開(kāi)始大力投資AI。中國(guó)互聯(lián)網(wǎng)公司三巨頭(統(tǒng)稱(chēng)BAT):某度、某里巴巴和某企鵝,正在開(kāi)展許多相互重疊的服務(wù),包括語(yǔ)音識(shí)別和臉部識(shí)別。不過(guò)居于他們現(xiàn)在的優(yōu)勢(shì),他們同時(shí)也想在某一具體的AI領(lǐng)域拔得頭籌。
某企鵝現(xiàn)在在三巨頭中吊車(chē)尾,它的AI實(shí)驗(yàn)室才建立沒(méi)幾個(gè)月。但是,某企鵝必將在AI領(lǐng)域發(fā)揮重要作用:它比其他兩巨頭的數(shù)據(jù)多得多。其旗下某信app擁有近十億個(gè)賬戶,也是數(shù)千個(gè)其他服務(wù)的平臺(tái),這些服務(wù)包括從電子支付和提供新聞,到城市地圖和法律援助。某企鵝同時(shí)也是全球游戲界的大佬,其旗下LOL和部落沖突,在世界各地?fù)碛谐^(guò)1億玩家。
某里巴巴早已是電子商務(wù)中的翹楚,而同時(shí)其投資數(shù)十億美元來(lái)成為云計(jì)算領(lǐng)域的第一。在6月份在上海舉行的一次會(huì)議上,其展示了一個(gè)名為“ET City Brain”(ET城市大腦)的AI服務(wù),它使用視頻識(shí)別來(lái)實(shí)時(shí)優(yōu)化城市交通。它使用路邊攝像機(jī)的鏡頭預(yù)測(cè)汽車(chē)的行為,并可以即時(shí)調(diào)整交通燈。在其公司總部所在地杭州,其稱(chēng)該系統(tǒng)使道路車(chē)輛通行速度平均提升了11%。某里巴巴還計(jì)劃強(qiáng)化所謂的“ET醫(yī)學(xué)大腦”,它將提供基于AI的服務(wù)用于開(kāi)發(fā)新藥和診斷醫(yī)學(xué)影像。它已經(jīng)與十幾家醫(yī)院合作以獲取開(kāi)發(fā)所需的數(shù)據(jù)。
但是某度的命運(yùn)的紅線與AI纏得更緊密,部分原因在于AI技術(shù)可能是趕上其它兩巨頭的重要機(jī)會(huì)。其將大部分資源投入到自主駕駛中:它想在2018年前將無(wú)人駕駛汽車(chē)推向市場(chǎng),并在2020年之前為全自主汽車(chē)提供技術(shù)。7月5日,該公司在北京的AI開(kāi)發(fā)者大會(huì)上宣布推出首款自駕車(chē)系統(tǒng)阿波羅(Apollo)。
阿波羅的驚人之處不僅僅在于汽車(chē)能安全地在路上行駛,同時(shí)它是一項(xiàng)對(duì)外界開(kāi)放的項(xiàng)目。Google的子公司W(wǎng)aymo和電動(dòng)汽車(chē)公司特斯拉等競(jìng)爭(zhēng)對(duì)手均小心翼翼地保護(hù)他們的自動(dòng)駕駛軟件和數(shù)據(jù)不被盜用。某度的計(jì)劃中不僅要開(kāi)源其程序,而且要與其它人共享數(shù)據(jù)。這個(gè)想法的關(guān)鍵點(diǎn)在于,使用了某度AI技術(shù)的汽車(chē)制造商們也必須要共享其獲得的數(shù)據(jù),從而為自動(dòng)駕駛汽車(chē)創(chuàng)建一個(gè)開(kāi)放平臺(tái),用陸奇的話說(shuō)是“自動(dòng)駕駛汽車(chē)中的Android系統(tǒng)”。
在北京學(xué)當(dāng)老司機(jī)
中國(guó)企業(yè)在出口AI產(chǎn)品方面的成功還有待觀察:現(xiàn)在只有少數(shù)幾家公司將產(chǎn)品出口國(guó)外。在理論上他們應(yīng)該會(huì)獲得一個(gè)稱(chēng)心的出口合同:在中國(guó)混亂的街道上訓(xùn)練而成的自動(dòng)駕駛汽車(chē)在歐洲越來(lái)越文明的交通中應(yīng)該完全沒(méi)有問(wèn)題(相比之下,在德國(guó)訓(xùn)練的自動(dòng)駕駛車(chē)輛獲得的算法進(jìn)步可能遠(yuǎn)遠(yuǎn)還不如北京的一個(gè)交叉路口來(lái)的深遠(yuǎn))。但西方的消費(fèi)者使用這些自動(dòng)駕駛汽車(chē)可能會(huì)猶豫,因?yàn)樗鼈兪窃谒尚傅慕煌ò踩h(huán)境和對(duì)交通事故更容忍的大環(huán)境下訓(xùn)練而成的。據(jù)說(shuō)北京市政府正在千方百計(jì)使其能成為自動(dòng)駕駛汽車(chē)的試驗(yàn)城市。
AI領(lǐng)域還有另外一個(gè)風(fēng)險(xiǎn)。數(shù)據(jù)集是目前AI最有價(jià)值的投入,但其重要性可能會(huì)逐漸減小。AI公司已經(jīng)開(kāi)始使用模擬數(shù)據(jù),包括來(lái)自電腦游戲的數(shù)據(jù)。而新開(kāi)發(fā)的算法可能通過(guò)較少的樣本集獲得同樣的智能效果。馭勢(shì)CEO吳甘沙警告說(shuō),"最大的危機(jī)在于我們自滿于數(shù)據(jù)方面的優(yōu)勢(shì),而在算法創(chuàng)新上止步不前。"不過(guò),現(xiàn)在中國(guó)看起來(lái)只是躍躍欲試的樣子,而在未來(lái)爭(zhēng)奪AI皇冠的賽跑中,中國(guó)與美國(guó)的差距將越來(lái)越小。
本文譯自the economist,由譯者 幕后煮屎者 基于創(chuàng)作共用協(xié)議(BY-NC)發(fā)布。
譯者按:
(幕后煮屎者)明年打算轉(zhuǎn)職當(dāng)碼農(nóng),現(xiàn)在學(xué)了HTML、CSS、JS,暫時(shí)可以寫(xiě)個(gè)簡(jiǎn)單完整的網(wǎng)頁(yè),下半年學(xué)NodeJS,計(jì)劃從最簡(jiǎn)單入行,因?yàn)闆](méi)有其他編程語(yǔ)言基礎(chǔ),有人建議我入行后找機(jī)會(huì)跳人工智能領(lǐng)域,所以在學(xué)習(xí)一些機(jī)器學(xué)習(xí)相關(guān)的慕課什么的。不知道各位前輩對(duì)這條路有什么好建議沒(méi)?例如有什么坑?
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )