TVP尖峰對話李開復(fù)、沈春華:AI 未來式與技術(shù)的發(fā)展、價(jià)值

  從1956年的達(dá)特茅斯會議至今,AI已經(jīng)走過了近70年的歷程。這70年間,對于AI的期待有之,對于AI的恐慌有之,資本對于AI的追捧此起彼伏,技術(shù)人對于AI的探索應(yīng)用也從未停歇。

  千禧年時(shí)的我們,未曾暢想過移動互聯(lián)網(wǎng)的繁盛,2022 年的我們,又該如何暢享未來 20 年的AI 發(fā)展進(jìn)程?AI + 醫(yī)療會讓我們活到 100 歲嗎? AI 將如何讓元宇宙變?yōu)楝F(xiàn)實(shí)? AI 可以幫人類找到幸福嗎? AI 會加深偏見嗎? AI 會搶走人類的工作嗎? 傳統(tǒng)企業(yè)是否能享受到 AI 紅利?

  5月8日晚,騰訊云TVP尖峰對話創(chuàng)新工場董事長兼首席執(zhí)行官、創(chuàng)新工場人工智能工程院院長、《AI未來進(jìn)行式》聯(lián)合作者李開復(fù),浙江大學(xué)教授、騰訊優(yōu)圖實(shí)驗(yàn)室高級顧問、杰出科學(xué)家沈春華,第四范式副總裁、騰訊云 TVP鄭曌擔(dān)任主持,邀請了 50 位來自 AI 領(lǐng)域的 CTO 與技術(shù)專家參與論壇討論,碰撞出關(guān)于 AI 的未來火花。

  李開復(fù):《AI 未來進(jìn)行式》與技術(shù)發(fā)展的動向

  《AI 未來進(jìn)行式》的創(chuàng)作起源

  《AI未來進(jìn)行式》這本書的創(chuàng)作起源主要有兩方面原因,首先我認(rèn)為 AI 是一個(gè)特別重要的技術(shù),每個(gè)人都應(yīng)該去了解它能創(chuàng)造什么機(jī)會,和自己有什么關(guān)聯(lián)。父母可以幫助孩子做學(xué)習(xí)規(guī)劃,年輕人可以為自己做職業(yè)規(guī)劃,然后也會看到未來AI可能帶來很多新的工作機(jī)會,我希望用講故事的方式,把這本聚焦 AI 技術(shù)的科普書籍寫得讓每一個(gè)人都能讀懂,目前來看反響還是不錯的,讓很多完全不了解 AI 的人大概搞懂了 AI 是什么意思。

  另一方面,我自己作為一個(gè)理工科出身的技術(shù)人,在本科、博士的時(shí)候研究的就是機(jī)器學(xué)習(xí),我深深地感受到技術(shù)人普遍欠缺場景想象力,這也是為什么 AI 在語音識別、自然語言、計(jì)算機(jī)視覺這些領(lǐng)域做了近 40 年,卻還在關(guān)注類似的問題。很多新的場景落地是需要更有想象力的,所以我也希望用跟科幻作家合作的方式,把故事描述清楚,讓我們這些做技術(shù)的人可以看到未來 AI 可能的應(yīng)用場景,帶來的挑戰(zhàn),又將如何化解,給大家一些靈感與建議。

  所以這次和科幻小說作者陳楸帆合作創(chuàng)作《AI 未來進(jìn)行式》的兩個(gè)重要的目的,一是把難的技術(shù)給所有的人講懂;二是希望給一些技術(shù)很強(qiáng),但是場景想象力不是那么強(qiáng)的理工人,或做 AI的技術(shù)人,也讓他們對未來的這種愿景和未來的場景能有一些靈感和建議。

  AI 領(lǐng)域的投資經(jīng)歷與 AI+ 云的模式分析

  得益于很多投資的經(jīng)歷,我也在其中學(xué)會了一些跨領(lǐng)域的知識,我個(gè)人認(rèn)為 AI 創(chuàng)造的最大價(jià)值,一定是和場景的結(jié)合。在相關(guān)投資經(jīng)歷中,可以總結(jié)出三個(gè) AI 創(chuàng)業(yè)的發(fā)展階段:第一個(gè)是在比較早期的階段時(shí),因?yàn)?AI 技術(shù)人員很厲害,選擇了先創(chuàng)立公司,再做應(yīng)用;第二類是在某些領(lǐng)域,AI 已經(jīng)可以創(chuàng)造很大的價(jià)值,比如我們當(dāng)時(shí)投的第四范式、創(chuàng)新奇智、極飛科技等等,都有非常強(qiáng)的商業(yè)應(yīng)用和落地場景。它們先靠場景落地,之后再做平臺。而今天 AI 已經(jīng)進(jìn)入了第三個(gè)階段, AI 會和其他的科學(xué)交叉,也就是說 AI + Science,AI 可以被用在發(fā)明新藥、基因編輯、新材料新能源等方向?!禔I 未來進(jìn)行式》這本書里包含了這三種方向,比如說在智能交通、無人駕駛就是一個(gè)重要的領(lǐng)域,比如說剛才說的 AI 制藥,AI 在新能源方面的應(yīng)用,這本書都會涉及,因?yàn)槲覀兺顿Y也要關(guān)注和了解這些產(chǎn)業(yè)領(lǐng)域,所以我們也嘗試在書中描述出這些場景,而我們調(diào)研出的趨勢則會給寫作帶來一些新的靈感。

  創(chuàng)新工場投資的初創(chuàng)企業(yè)大多都會用到云,很多公司也有跟騰訊云在內(nèi)的一些云廠商合作,在私有云領(lǐng)域嘗試更快速地構(gòu)建一個(gè) AI 解決方案,這其實(shí)是跟云平臺非常好的結(jié)合點(diǎn)。我們也投資了一些幫助云在算力方面加速的項(xiàng)目,當(dāng)然包括 AI,也包括普通的 workload,我覺得這也代表了云的未來會快速提升。一個(gè)很有意思的現(xiàn)象是,中國的 AI 技術(shù)從創(chuàng)業(yè)公司、使用率、產(chǎn)生的價(jià)值等方面,并不輸于美國。雖然美國的科研能力更強(qiáng),但中國的落地成果也并不落后。在云計(jì)算領(lǐng)域,美國的領(lǐng)先優(yōu)勢比較大,但中國的成長空間很充足,美國的云計(jì)算雖然已經(jīng)完成了部署,但到現(xiàn)在才開始把 AI 能力放進(jìn)去,而中國的云計(jì)算已經(jīng)在做 AI 的解決方案了,這是很有意思的現(xiàn)象。

  在《AI 未來進(jìn)行式》這本書里沒有描述 AI+云,不是因?yàn)樵朴?jì)算不重要,恰恰是因?yàn)樵铺匾耍呀?jīng)成為了必須有的一個(gè)平臺型的(技術(shù)服務(wù)),就像操作系統(tǒng)、數(shù)據(jù)庫一樣,已經(jīng)不需要刻意去強(qiáng)調(diào)它的重要性。比如在無人駕駛領(lǐng)域中,我們假設(shè)的云和帶寬都比現(xiàn)在大和快很多,包括 5G、6G 發(fā)展以后,對于云上數(shù)據(jù)調(diào)動的挑戰(zhàn),跟邊緣計(jì)算的融合,這些在書中都有描繪。

  NLP 技術(shù)的發(fā)展與應(yīng)用

  《AI未來進(jìn)行式》書里有一個(gè)「雙雀」的故事章節(jié),在這個(gè)故事里,AI 成為了孩子成長的陪伴助手。在人類老師的主導(dǎo)下,AI 化身為一個(gè)長期陪伴的助教角色,將孩子的學(xué)習(xí)與興趣相結(jié)合,變得更有效率與主動性。雖然在 AI 時(shí)代,我認(rèn)為人類老師的教育工作 AI 是替代不了的,但是 AI 可以做很多有益的補(bǔ)充,因此在這樣的場景下,NLP(自然語言處理) 的技術(shù)就是其中的關(guān)鍵點(diǎn)。

  在我大二的時(shí)候,我剛開始接觸的第一個(gè) AI 技術(shù)就是NLP(自然語言處理)。與早期 NLP 的發(fā)展相比,最近幾年很多技術(shù)正在發(fā)揚(yáng)光大,深度學(xué)習(xí)是其中的一個(gè)重要核心。我們看到一個(gè)很大的突破就是自然語言處理的領(lǐng)域正在用自監(jiān)督學(xué)習(xí)的技術(shù)去做海量數(shù)據(jù)的標(biāo)注,這解決了一個(gè)巨大的瓶頸。從這個(gè)模型做出來以后,帶來了包括 bert、transformer、GPT3、LaMDA 在內(nèi)的諸多 NLP 領(lǐng)域的技術(shù)突破。

  我認(rèn)為 NLP 在未來三到五年應(yīng)該會有非常多的發(fā)展,一方面是在過去已有的應(yīng)用,比如語音識別、機(jī)器翻譯等方向有更多突破;另一方面是在還沒有發(fā)生的場景下得到很多嘗試,比如語音對話型的終極搜索引擎等等。NLP未來的發(fā)展,既會把已有的應(yīng)用從不可用變成可用,從可用變成好用,也會把過去不可能做的應(yīng)用變成可能做,這是我們現(xiàn)在重大的投資方向,也非??春眠@個(gè)領(lǐng)域。

  沈春華:優(yōu)圖實(shí)驗(yàn)室與騰訊AI的產(chǎn)業(yè)布局

  優(yōu)圖實(shí)驗(yàn)室的技術(shù)投入

  優(yōu)圖是騰訊旗下最頂級的人工智能實(shí)驗(yàn)室之一,過去多年一直專注于計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)研究和落地的探索。優(yōu)圖的 AI 能力,比較具有代表性的有大家耳熟能詳?shù)奈⑿潘⒛樦Ц?、自?AI 美顏等等消費(fèi)互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用; 同時(shí),實(shí)驗(yàn)室在工業(yè)質(zhì)檢、金融、教育等產(chǎn)業(yè)領(lǐng)域也有非常廣泛的落地。

  因?yàn)轵v訊是做消費(fèi)互聯(lián)網(wǎng)產(chǎn)品起家的,非常擅長洞察用戶的需求,這種能力現(xiàn)在在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域也正在進(jìn)行驗(yàn)證。我個(gè)人理解 C to B 肯定是產(chǎn)業(yè)互聯(lián)網(wǎng)非常重要的一環(huán),這個(gè)可能也是騰訊獨(dú)特的優(yōu)勢,因?yàn)轵v訊長于通過連接器類型的產(chǎn)品如公眾號、小程序、企業(yè)微信等等,幫助 B 端伙伴更好地服務(wù)下游的客戶。

  產(chǎn)業(yè)互聯(lián)網(wǎng)向縱深發(fā)展的過程中,更多考驗(yàn)的是綜合解決方案的能力,騰訊在這些垂直行業(yè)有很多年的深耕和非常多的技術(shù)落地的應(yīng)用場景,在幾個(gè)垂直領(lǐng)域也梳理出了一些標(biāo)準(zhǔn)化解決方案,可以得到快速的復(fù)制,這是騰訊做 AI 應(yīng)用和其他公司比最大的優(yōu)勢。

  騰訊如何用 AI 技術(shù)助力實(shí)體經(jīng)濟(jì)發(fā)展

  一方面,云和 AI 的深度融合將語音識別、圖像識別、NLP 等基礎(chǔ) AI 能力封裝成了適用不同場景的 API 或工具性軟件,讓 AI 成為各行各業(yè)優(yōu)化生產(chǎn)、提高效率的工具。比如在工業(yè)制造領(lǐng)域,騰訊工業(yè)云結(jié)合計(jì)算機(jī)視覺的經(jīng)典技術(shù),加上云端 GPU 強(qiáng)大的算力,可以為工廠提供超高準(zhǔn)確度的基于 AI 的質(zhì)檢方案系統(tǒng),將人工需要二十分鐘才能完成的質(zhì)檢工作壓縮到幾秒鐘,帶來了質(zhì)的飛躍,每年能節(jié)省數(shù)千萬成本。

  另一方面,云和 AI 的深度融合也將非常高深復(fù)雜的統(tǒng)計(jì)機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的算法和理論,轉(zhuǎn)化成了普通開發(fā)者也可以輕松調(diào)用的 API,極大降低了 AI 應(yīng)用的門檻,讓 AI 成為中小企業(yè)和普通開發(fā)者都可以輕松使用的工具,使得各行各業(yè)人才把AI帶到更多的產(chǎn)業(yè)落地場景,從而產(chǎn)生更大的經(jīng)濟(jì)和社會價(jià)值。

  騰訊通過騰訊云,為各行各業(yè)的行業(yè)伙伴和開發(fā)者提供了數(shù)百項(xiàng) AI 原子能力,覆蓋了機(jī)器視覺、NLP、模式識別等眾多領(lǐng)域,打造了面向不同行業(yè)場景下的 AI 解決方案,讓更多中小企業(yè)可以快速地部署、應(yīng)用 AI,讓 AI 產(chǎn)生價(jià)值,幫助產(chǎn)業(yè)進(jìn)一步數(shù)字化發(fā)展和轉(zhuǎn)型升級。

  AI 的價(jià)值與技術(shù)的雙刃劍

  如何看待 AI 的社會價(jià)值與意義

  李開復(fù):在《AI 未來進(jìn)行式》這本書里,我對 AI 的價(jià)值采取的是比較有建設(shè)性的思考態(tài)度。業(yè)界對 AI 的負(fù)面作用討論已經(jīng)比較多了,但我個(gè)人認(rèn)為技術(shù)本身是中性的,對技術(shù)的應(yīng)用正確與否才是造成不同影響的原因。我們可以看到,從長遠(yuǎn)來說 AI 肯定會持續(xù)創(chuàng)造巨大的經(jīng)濟(jì)價(jià)值,同時(shí)能夠更精準(zhǔn)、便宜、有效地把事情做好。

  同時(shí),AI 也是一把雙刃劍,它可以幫我們省去很多重復(fù)性的任務(wù)和工作,但在這個(gè)過程中必然會有一部分人的工作崗位被 AI 所取代。但從正面的角度來看,當(dāng)這些工作崗位的取代發(fā)生時(shí),也必然會創(chuàng)造一些新的工作機(jī)會。我認(rèn)為 20 年以后會達(dá)到一個(gè)非常美好的狀態(tài),這個(gè)狀態(tài)就是人類會有更多的時(shí)間去做只有人類能做的事情,符合個(gè)人的興趣和能力來做的事情,讓每個(gè)人的工作更有趣更滿意。

  同時(shí),伴隨著 AI 和其他多種技術(shù)的成熟,未來我們有可能將生產(chǎn)的成本降到非常低的程度,這就可能有機(jī)會把貧窮和饑荒徹底消滅,這也是一個(gè)重大的人類歷史里程碑。當(dāng)然,達(dá)成這些目標(biāo)還有很多挑戰(zhàn),但至少從技術(shù)層面來看是有機(jī)會的。

  雖然目前 AI 的應(yīng)用還有推薦算法的信息繭房效應(yīng)、隱私保護(hù)等等問題,這都是 AI 技術(shù)應(yīng)用后的一些普遍社會現(xiàn)象。不過我認(rèn)為,一個(gè)新技術(shù)推出的時(shí)候一定會對社會產(chǎn)生沖擊,但最后的解決方法都是技術(shù)人發(fā)明了新的技術(shù)來解決了這些負(fù)面影響,今天來聽直播的這批人可能就是未來化解 AI 大部分問題的工作者。

  沈春華:AI 理想國到底是什么樣的,沒有統(tǒng)一的答案,但我相信「科技向善」是其中的一種解讀。AI 最大的價(jià)值就是服務(wù)于人,服務(wù)于社會。

  一方面 AI 已經(jīng)能夠讓社會更便捷,比如 Siri 語音助手、微信刷臉支付,現(xiàn)實(shí)生活中已經(jīng)隨處可見。另一方面 AI 也在攻克社會領(lǐng)域中一些以前解決不了的問題。優(yōu)圖之前利用 AI 技術(shù)協(xié)助尋人,幫助很多走失多年的兒童找到了自己的父母。去年,優(yōu)圖聯(lián)合了國家天文臺發(fā)布探星計(jì)劃,利用優(yōu)圖的計(jì)算機(jī)視覺技術(shù)幫助中國天眼 FAST 大大提升了脈沖星的搜索效率,把以前一年甚至更長時(shí)間才能處理完的數(shù)據(jù),現(xiàn)在用機(jī)器學(xué)習(xí)的技術(shù)可能幾天就處理完了,這是幾個(gè)數(shù)量級的提升,可以極大加速科學(xué)探索的效率。

  另外,我自己剛剛開始接觸一點(diǎn) AI For Science 的研究,比如利用人工智能的算法,來做蛋白質(zhì)序列的分析,據(jù)我所知優(yōu)圖實(shí)驗(yàn)室、以及浙江大學(xué)上海高等研究院等機(jī)構(gòu)在這些方向上都取得了比較好的階段性的成果,這都是非常好的例子,我相信我們會看到越來越多這樣的例子。

  AI 與醫(yī)療的美妙結(jié)合

  李開復(fù):我們認(rèn)為從現(xiàn)在到未來的十年,甚至二十年間,醫(yī)療都會是一個(gè)非常好的投資領(lǐng)域。具體有幾方面原因,一是傳統(tǒng)的醫(yī)療行業(yè)現(xiàn)在正全方位數(shù)字化,包含醫(yī)療流程信息化、可穿戴設(shè)備記錄全程健康數(shù)據(jù)、以及新技術(shù)產(chǎn)生海量生物學(xué)數(shù)據(jù)等帶來的大量數(shù)據(jù)將成為 AI 的“養(yǎng)料”,產(chǎn)生有價(jià)值的算法,在疾病預(yù)警、診斷、治療、監(jiān)測、長期管理等方面輔助醫(yī)生進(jìn)行診斷和治療。二是醫(yī)療不僅僅是海量數(shù)據(jù)的practice 和 science,比如每種癌癥樣本可能很多醫(yī)學(xué)院一年也沒有太多,醫(yī)療的數(shù)據(jù)是用來教學(xué)的,我們的數(shù)據(jù)是用來教 AI 的,當(dāng)教學(xué)數(shù)據(jù)只有很少樣本的情況下,海量數(shù)據(jù)訓(xùn)練后的 AI 能力領(lǐng)先性就產(chǎn)生了。三是醫(yī)學(xué)知識太多了,醫(yī)生不可能做到全知全能,他看一個(gè)病人能夠了解病人的背景和病例的時(shí)間也是有限的,看病的時(shí)間更是有限的。

  因此,我認(rèn)為 AI 在醫(yī)療行業(yè)的優(yōu)化迭代,的確可以做得更好,但是還要綜合考慮各種利益、道德、法律的問題,所以在落地實(shí)際診斷方面,還是會需要更多的磨合和訓(xùn)練。我認(rèn)為在診斷方面更易被業(yè)界接受的是人機(jī)協(xié)作模式:以醫(yī)生為主,他是 AI 的老板,AI 協(xié)助他做診斷,這樣的話,在醫(yī)生的基礎(chǔ)之上,AI只會提高他正確診斷的概率。

  從投資的角度看,我們認(rèn)為其實(shí)在醫(yī)療行業(yè),做新藥研發(fā)是一個(gè)非常好的領(lǐng)域,這也與 AI 的目標(biāo)高度一致。因?yàn)樵谶@樣的場景下,人的想法和 AI 的想法是一致的,都是如何用最低成本、最短時(shí)間研制一個(gè)最有效的新藥,這樣的方向上,做 AI 的技術(shù)人群與真正的業(yè)務(wù)方訴求都是一致的,可以用合力把事情做好。這方面我們也有一些投資的案例在跟。

  最后我想講的是,醫(yī)療行業(yè)背后有很多生物學(xué)、化學(xué)、制藥等領(lǐng)域人員,他們處于電腦模擬之后、臨床之前的實(shí)驗(yàn)室工作階段,這其實(shí)也非常適合 AI 去做。它帶來的價(jià)值不是取代了人力成本,更重要的是機(jī)器本身可以 24 小時(shí)不間斷地做實(shí)驗(yàn),研發(fā)的進(jìn)程指數(shù)級提升。最終 AI 理想的效果是讓新藥研發(fā)更快,成本更低,讓很多罕見病,不可醫(yī)的并都變得可醫(yī),讓人享受更長久的健康,這是我們可以期待的,也是 AI 能做出的最大且沒有爭議的貢獻(xiàn)。

  沈春華:過去這幾年我在澳洲的大學(xué)工作的時(shí)候,也做了一些醫(yī)學(xué)圖像方面的研究。我非常贊同剛才開復(fù)老師提到的一點(diǎn),就是對醫(yī)學(xué)圖像的從業(yè)者來說,AI 的目標(biāo),至少從現(xiàn)階段來看,不能取代醫(yī)生來看病。 所以我們應(yīng)該去做工具,去幫助醫(yī)生去看 X 光、CT 圖像,更好更快地輔助醫(yī)生做診斷。

  AI 本身如果要徹底取代醫(yī)生的話,我覺得還有很多的問題要解決。比如說現(xiàn)在的 Deep Learning 算法的可解釋性。這個(gè)可解釋性問題如果不解決的話,沒有人敢直接拿 Deep model 預(yù)測出來的診斷給到病人,因?yàn)槟愣疾恢浪惴ǖ臎Q定是怎么做出來的。

  騰訊有一個(gè)醫(yī)學(xué)圖像的團(tuán)隊(duì)開發(fā)了一個(gè)系統(tǒng)叫做 “騰訊覓影”,這是個(gè)通過 AI 輔助診斷新冠肺炎的一個(gè)解決方案。這個(gè)系統(tǒng)利用患者的 CT 圖像,可以在一分鐘或者更短的時(shí)間里給醫(yī)生提供一個(gè)輔助的診斷結(jié)果,從而幫助醫(yī)生更準(zhǔn)確地來判斷患者肺炎的嚴(yán)重程度以及發(fā)展過程。

  大家都知道一次胸部的 CT 掃面往往可以會產(chǎn)生幾百張的影像,如果完全依靠人眼來看的話,要十幾二十分鐘,現(xiàn)在用 AI 的算法,可以把醫(yī)生的檢查效率提高一個(gè)數(shù)量級,這樣可以讓患者得到更及時(shí)的治療。

  所以我個(gè)人覺得, AI 是一個(gè)用來幫助醫(yī)生做快速診斷,提升效率的助手,這可能是未來幾年發(fā)展的一個(gè)方向。

  如何做好科技向善,避免數(shù)據(jù)隱患雙刃劍?

  李開復(fù):數(shù)據(jù)隱患的這些問題,已經(jīng)造成了很多人對 AI 的認(rèn)知是負(fù)面多于正面,這是一件很不幸的事情。正如前面所說,AI 確實(shí)帶來了一些問題,但也會隨著時(shí)間、新技術(shù)去化解,包括一些相關(guān)法律法規(guī)的健全和完善,Web 3.0 把數(shù)據(jù)還給個(gè)人等等方式。這些都是可以探索的方向,而且解決方案并沒有我們想象的那么難。

  比如隱私保護(hù)的問題,如何確保數(shù)據(jù)不被濫用,就涉及到很多隱私計(jì)算的算法,比如聯(lián)邦學(xué)習(xí)。以聯(lián)邦學(xué)習(xí)為代表的隱私算法,可以讓我們魚與熊掌兼得,既能把數(shù)據(jù)授權(quán)去做訓(xùn)練,又能確保對訓(xùn)練模型中的數(shù)據(jù)構(gòu)成脫敏的作用,不至于產(chǎn)生隱私問題。

  從大數(shù)據(jù)到推薦算法,這其中的確產(chǎn)生了很多不好的社會現(xiàn)象,這引出了 AI 領(lǐng)域一個(gè)很有趣的題目,我們?nèi)绾文茏屢粋€(gè)目標(biāo)函數(shù)去衡量一個(gè)相對長遠(yuǎn)、比較困難的事情。商業(yè)化落地的 AI 算法,最大化的是大公司的利益,但我們也應(yīng)該考慮個(gè)人對 AI 千人千面的需求。有沒有可能將個(gè)人的需求作為目標(biāo)函數(shù)參考進(jìn)來,去訓(xùn)練 AI 的模型,兼顧企業(yè)和個(gè)人的需求,這是非常值得去思考、突破的技術(shù)方向。

  而另一點(diǎn),偏見的問題其實(shí)主要來自于數(shù)據(jù)的不平衡,這些問題是做 AI 的技術(shù)人應(yīng)該警惕的,我們做產(chǎn)品之前要確保數(shù)據(jù)有合理的覆蓋度、平衡度,除了個(gè)人的觀念,也需要有一些工具的提醒校正。這背后涉及到的可解釋性相當(dāng)困難,一方面我們可以做一些可解釋的機(jī)器學(xué)習(xí)模型,另一方面可以試著對已有的標(biāo)準(zhǔn)模型做可解釋,但不要對結(jié)果的精確性、細(xì)膩度過于吹毛求疵。

  最后我想說的是,我們批評 AI 這么多,人難道就會做得更好嗎?人會比 AI 更沒有偏見嗎?其實(shí)不然,以色列做過一個(gè)實(shí)驗(yàn),法官在午餐之前做出的判決會比午餐之后更苛刻,代表他不爽了以后就不顧工作的公平了。人的偏見是很嚴(yán)重的,而且人會隱藏、拒絕承認(rèn)自己的偏見。AI 是一個(gè)客觀、公平、透明、基于數(shù)據(jù)的領(lǐng)域,所以我們有更大的希望把 AI 做成一個(gè)低偏見的決策者,遠(yuǎn)遠(yuǎn)比人的偏見來得低。我們不要因?yàn)橥獠康牧α糠糯笠恍﹤€(gè)別的案例,但其實(shí)我有信心在這四點(diǎn)上都能做的比現(xiàn)在好很多,而且跟人相比做得更好。

  對技術(shù)人來說,怎么看待AI技術(shù)的兩面性?

  沈春華:Deepfake 這樣的技術(shù)最早開源出來的時(shí)候,有些人用來它去替換、生成人臉圖片?,F(xiàn)在偽造出來的人臉圖片越來越逼真,已經(jīng)到了人眼都難以區(qū)分真假的地步。這確實(shí)會帶來很多風(fēng)險(xiǎn)。這些偽造的圖片、視頻信息在網(wǎng)絡(luò)上傳播,會帶來挑戰(zhàn)。Deepfake 實(shí)際上是基于過去幾年的 GAN 的技術(shù)。

  據(jù)我所知,至少針對 GAN 生成的圖像,即使人眼看不出真假的差別,但對于算法來說還是能夠捕捉到細(xì)微的差別,因?yàn)樯傻臄?shù)據(jù)和真實(shí)的數(shù)據(jù)之間,它們的分布存在一個(gè) domain gap。就是說你用大量的數(shù)據(jù)去訓(xùn)一個(gè)深度學(xué)習(xí)的判別真假圖像的模型,目前是很容易判斷這個(gè)圖像到底是生成的,還是真實(shí)的。至少目前是這樣。

  如果說,我們哪一天發(fā)明了一個(gè)算法, 不管是基于什么樣的生成模型,可以是 GAN,可以是別的生成模型,如果說它生成的合成數(shù)據(jù),算法也分辨不出真假。那么對于深度學(xué)習(xí)的研究人員來說將是重大的好消息。為什么?因?yàn)槲覀儸F(xiàn)在訓(xùn)練深度學(xué)習(xí)模型,比如分類器做識別的模型,往往需要大量的人工標(biāo)注的數(shù)據(jù)。如果說模型生成的合成數(shù)據(jù)和真實(shí)的數(shù)據(jù)之間已經(jīng)沒有domain gap,數(shù)據(jù)分布一模一樣,那么我們就可以利用這樣的技術(shù)去得到大量的訓(xùn)練數(shù)據(jù),不需要去做人工標(biāo)注了。這將極大降低數(shù)據(jù)成本。

  TVP 大咖發(fā)問關(guān)于 AI 的那些事兒

  傳統(tǒng)企業(yè)如何使用AI技術(shù),難點(diǎn)何在?

  李開復(fù):據(jù)我觀察,國內(nèi)很多傳統(tǒng)企業(yè)數(shù)字化并沒有做得很好,當(dāng)開始使用 AI 的時(shí)候碰到的問題是需要海量的資源和時(shí)間先把數(shù)據(jù)整合好,然后才能進(jìn)入到 AI 的落地環(huán)節(jié)。許多傳統(tǒng)企業(yè)的企業(yè)家或是沒有意識到這樣的挑戰(zhàn),或是下面的數(shù)字化團(tuán)隊(duì)沒有做好信息同步,最后發(fā)現(xiàn)做了很多努力 AI 還是不能起作用。其實(shí)數(shù)據(jù)的儲存、整理、分析是最難的部分,一旦做好了,落地 AI 反而是相對較小的問題。

  還有很多其他的挑戰(zhàn),比如每個(gè)行業(yè)需求都不一樣,沒法做到一個(gè)平臺解決所有行業(yè)的問題。我們投資的很多公司目前都還是在做解決方案,從長期來說,我們當(dāng)然是希望能解決一切問題,但這背后需要很多的時(shí)間和技術(shù)探索。整體來說,未來五年國內(nèi)大部分的 AI 應(yīng)用還是需要一個(gè)解決方案提供商,它可以是云,也可以是垂直的 AI 企業(yè)。同時(shí)我們?nèi)耘f需要繼續(xù)探索如何能誕生一個(gè)更標(biāo)準(zhǔn)化的 AI 能力或者平臺,可以覆蓋大部分行業(yè)場景下的用戶需求。

  沈春華:對,我覺得這可以說是所有的云計(jì)算的提供商他們正在做的一個(gè)事情, 目的就是使應(yīng)用 AI 技術(shù)的門檻大大的降低, 然后能夠快速的去鋪開,但是這還有很長的路要走。我相信隨著技術(shù)的發(fā)展,我們有一天是會達(dá)到那一步的,這個(gè)過程可能會比較長。

  AI 的理論是否遇到了實(shí)際應(yīng)用的天花板?

  李開復(fù):我覺得其實(shí)在深度學(xué)習(xí)的平臺上還有很大的機(jī)會,尤其是考慮到應(yīng)用的場景的話,其實(shí)問題不是在我們沒有發(fā)明足夠多的好算法,而是我們沒有能夠想出方法把它更快引入應(yīng)用,所以我覺得應(yīng)用還有很大的紅利空間。

  也有人提出,深度學(xué)習(xí)本身是一個(gè)黑盒為主的技術(shù)方向,背后的理論基礎(chǔ)不夠強(qiáng),希望能夠推進(jìn),這是可以理解的。也有人提出一些想法,認(rèn)為深度學(xué)習(xí)本身能不能像人一樣做可解釋化、可分析地發(fā)展,需要有辦法把人腦、人的思維特點(diǎn)與深度學(xué)習(xí)相結(jié)合,產(chǎn)生 1+1>2 的發(fā)展,這也是一個(gè)方向。我覺得做理論的多參與 AI 是好事,但至少從應(yīng)用的角度來說,我們現(xiàn)在并不是因?yàn)榍啡崩碚摶A(chǔ)讓我們碰到了應(yīng)用的瓶頸。

  沈春華:我補(bǔ)充一點(diǎn)。我一直在做計(jì)算機(jī)視覺相關(guān)的算法。我個(gè)人理解,不管是計(jì)算機(jī)視覺也好,還是 NLP 也好,在過去幾年有人覺得深度學(xué)習(xí)的技術(shù)發(fā)展是不是到了一個(gè)瓶頸了,下面就很難發(fā)展了。但是,過去幾年我們看到的是,突然一下子就又出來一個(gè)突破性的算法,帶動整個(gè)領(lǐng)域的發(fā)展。這樣的例子在過去幾年非常多。這一次的人工智能發(fā)展起來到今天算的話可能也就 10 年時(shí)間, 如果從 2012 年 Hinton 的那篇 ImageNet 的圖片分類的論文開始算,剛好 10 年時(shí)間。

  你看它的發(fā)展過程就是從 AlexNet 開始,從各種各樣的卷積神經(jīng)網(wǎng)絡(luò)到了一個(gè)瓶頸期, 大家都覺得是不是好像沒得做了,發(fā)展到了一個(gè)瓶頸,突然 Transformer 被發(fā)明出來, Transformer 又大大地提升了很多任務(wù)上的性能。然后剛才提到的 GAN 技術(shù), GAN 到現(xiàn)在也沒幾年時(shí)間。GAN這樣的生成模型現(xiàn)在能達(dá)到的效果放在短短幾年前也是很難想象的:生成模型怎么能得到這么漂亮的結(jié)果?

  三年前 GPT3 技術(shù)被發(fā)明出來,GPT3 顛覆了過去幾十年的 NLP 的研究成果。我個(gè)人覺得 AI遠(yuǎn)沒有到天花板,或者是到瓶頸期這樣的程度。AI 這個(gè)領(lǐng)域的發(fā)展非常快。

  分享最后,本場主持人鄭曌感慨良多,他表示李開復(fù)老師長期對AI領(lǐng)域的研究和探索給了我們非常多新鮮的觀點(diǎn)和視角,沈春華老師作為AI領(lǐng)域的頂級學(xué)者,也帶領(lǐng)我們領(lǐng)略到人工智能技術(shù)的深度魅力。

  結(jié)語

  通往未來的道路從來不是一片坦途,這要求創(chuàng)造未來的這批先驅(qū)能夠堅(jiān)定自己的信念,秉持科技向善的原則去應(yīng)用并無好壞之分的技術(shù)本身。20年后的AI發(fā)展將是怎樣的,本次討論所勾勒出的僅僅只是冰山一角,還有更多的場景等待每個(gè)從業(yè)者去想象、去突破。

  TVP 自成立之初,便希望能夠“用科技影響世界”,讓技術(shù)普惠大家,踐行科技向善的初心與本心。未來的路上,愿我們一路攜手并肩,共同前行。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )