谷歌AI負(fù)責(zé)人Jeff Dean:一文回顧谷歌的2018技術(shù)進(jìn)展

一年一度的谷歌AI總結(jié)公布了。

1月15日,谷歌高級研究員、谷歌AI負(fù)責(zé)人Jeff Dean發(fā)表了博文,回顧總結(jié)了2018年谷歌的技術(shù)研究進(jìn)展。

Jeff Dean從谷歌的人工智能、量子計算、感知技術(shù)、算法理論、AutoML、機(jī)器人以及TPU等多個技術(shù)層面,系統(tǒng)地還原了谷歌AI的2018。

眾所周知,在去年一整年,谷歌遭遇了諸多危機(jī),尤其是不作惡的原則受到內(nèi)外的質(zhì)疑。Jeff Dean博客中首要提到的便是谷歌的道德原則和AI。

道德原則和人工智能

今年,我們發(fā)布了Google AI原則,但是,由于AI的發(fā)展非常迅速,AI原則中諸如“避免制造或加強(qiáng)不公平的偏見”、“對人民負(fù)責(zé)”等也在不斷變化和改進(jìn)。

其中,機(jī)器學(xué)習(xí)公平性和模型可解釋性等領(lǐng)域的新研究,正反向推動我們的產(chǎn)品進(jìn)步,使其更具包容性。例如我們在谷歌翻譯中減少“性別偏見”,并允許探索和發(fā)布更具包容性的圖像數(shù)據(jù)集和模型,使計算機(jī)視覺能夠適應(yīng)全球文化的多樣性。

社會公益

Jeff Dean舉例了AI應(yīng)用于解決現(xiàn)實公共問題的案例:

洪水預(yù)測工作。該研究與Google的許多團(tuán)隊合作,旨在提供有關(guān)洪水發(fā)生可能和范圍的準(zhǔn)確細(xì)粒度信息,使洪水易發(fā)地區(qū)的人們能夠更好地保護(hù)自己及其財產(chǎn)。

地震余震預(yù)測的工作。谷歌展示了機(jī)器學(xué)習(xí)(ML)模型可以比傳統(tǒng)的基于物理的模型更準(zhǔn)確地預(yù)測余震位置。

除此之外,還有許多Google研究人員和工程師合作,使用TensorFlow等開源軟件解決各種科學(xué)和社會問題,例如使用卷積神經(jīng)網(wǎng)絡(luò)來識別座頭鯨的位置,檢測新的系外行星,識別患病的木薯植物等。

AI輔助技術(shù)

為了使ML和計算機(jī)科學(xué)幫助用戶更快更有效地完成任務(wù),谷歌推出了智能語音技術(shù)Google Duplex。

這是一個囊括自然語言研究和對話理解以及文本、語言識別的技術(shù)。其核心是一個循環(huán)神經(jīng)網(wǎng)絡(luò),使用的是TensorFlow Extend(TFX)的機(jī)器學(xué)習(xí)平臺構(gòu)建。

當(dāng)Google Duplex撥打電話時,它的聲音近乎真實的普通人。你可以聽到Google Duplex幫你打電話預(yù)約理發(fā)。

其他應(yīng)用案例還包括Smart Compose,它可以使用預(yù)測模型提供有關(guān)如何撰寫電子郵件的相關(guān)建議,使電子郵件撰寫過程更快更容易的工具。

我們研究的一個重點是讓Google智能助理這樣的產(chǎn)品支持更多語言,并且可以更好地理解語義相似性。

量子計算

在過去的一年里,我們制作了許多令人興奮的量子計算新成果,包括開發(fā)了一種新的72比特通用量子計算設(shè)備Bristlecone,該設(shè)備可以擴(kuò)大量子計算機(jī)在量子領(lǐng)域可以解決的問題。

我們還發(fā)布了量子計算機(jī)的開源編程框架Cirq,并探討了量子計算機(jī)如何用于神經(jīng)網(wǎng)絡(luò)。最后,我們分享了量子處理器性能波動的經(jīng)驗和技術(shù)以及量子計算機(jī)如何作為神經(jīng)網(wǎng)絡(luò)計算基板的一些想法。

自然語言理解

2018年,Google的自然語言研究在基礎(chǔ)研究和以產(chǎn)品為中心的合作上都取得了非常棒的成果。我們在之前的機(jī)器學(xué)習(xí)模型基礎(chǔ)上開發(fā)了一個新的并行版本的模型 Universal Transformer,它在包括翻譯和語言推理在內(nèi)的許多自然語言任務(wù)中都顯示出強(qiáng)大的技術(shù)能力。

我們還開發(fā)了BERT,這是第一個深度雙向,無監(jiān)督的自然語言處理模型,僅使用純文本語料庫進(jìn)行預(yù)訓(xùn)練,就能使用遷移學(xué)習(xí)對各種自然語言任務(wù)進(jìn)行微調(diào)。

感知

我們的感知研究解決了允許計算機(jī)理解圖像,聲音以及為圖像獲取,壓縮,處理,創(chuàng)造性表達(dá)和增強(qiáng)現(xiàn)實提供更強(qiáng)大工具的難題。

Google AI使命的一個關(guān)鍵是讓其他人能夠從我們的技術(shù)中受益,今年我們在改進(jìn)作為Google API一部分的功能和構(gòu)建塊方面取得了很大進(jìn)展。比如通過ML Kit 在Cloud ML API和面部相關(guān)設(shè)備構(gòu)建塊中實現(xiàn)視覺和視頻的改進(jìn)和新功能。

MobileNetV2是谷歌的下一代移動計算機(jī)視覺模型,我們的MobileNets廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界。MorphNet提出了一種有效的方法來學(xué)習(xí)深層網(wǎng)絡(luò)的結(jié)構(gòu),從而在計算資源有限的同時,改進(jìn)圖像和音頻模型上的性能。

計算攝影

手機(jī)拍照性能的提升不僅僅在于物理傳感器的改進(jìn),更大部分要歸咎于計算攝影技術(shù)的發(fā)展。

我們的計算攝影技術(shù)正在與Google的Android和消費者硬件團(tuán)隊密切合作,將這項研究交付給最新的Pixel和Android手機(jī)及其他設(shè)備。2014年,我們推出了HDR +,可以在軟件中對齊幀,并將它們與計算軟件結(jié)合,使圖片具有比單次曝光更高的動態(tài)范圍。這是2018年我們能夠在Pixel 2中開發(fā)Motion Photos,以及Motion Stills中開發(fā)增強(qiáng)現(xiàn)實模式的基礎(chǔ)。

今年,我們在計算攝影研究方面的主要工作之一就是創(chuàng)造一種名為Night Sight的新功能,即便在沒有閃光燈的情況下,也能讓Pixel用戶在非?;璋档膱鼍爸信某銮逦恼掌?。

算法和理論

在過去的一年中,我們的研究涵蓋從理論基礎(chǔ)到應(yīng)用算法,從圖形挖掘到隱私保護(hù)計算等廣泛領(lǐng)域。我們在優(yōu)化方面的工作涉及從研究機(jī)器學(xué)習(xí)的持續(xù)優(yōu)化到分布式組合優(yōu)化的領(lǐng)域。在前一領(lǐng)域,我們研究用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的隨機(jī)優(yōu)化算法的收斂性(其贏得了ICLR 2018)最佳論文獎),展示了流行的基于梯度的優(yōu)化方法(例如ADAM的一些變體)的問題,為新的基于梯度的優(yōu)化方法提供了堅實的基礎(chǔ)。

軟件系統(tǒng)

我們對軟件系統(tǒng)的大部分研究仍然與構(gòu)建機(jī)器學(xué)習(xí)模型,尤其是TensorFlow有關(guān)。我們的一些新研究引入了Mesh TensorFlow,這使得用模型并行性指定大規(guī)模分布式計算變得容易。另外,我們還使用TensorFlow發(fā)布了一個可擴(kuò)展的深度神經(jīng)排序庫。

另一個重要的研究方向是將ML應(yīng)用于軟件系統(tǒng)的堆棧層面。在安全漏洞問題方面,我們的編譯器研究團(tuán)隊將他們用于測量機(jī)器指令延遲和端口壓力的工具集成到LLVM中,從而可以做出更好的編譯決策。

我們研究了Google軟件定義網(wǎng)絡(luò)WAN,這是一個獨立的聯(lián)合查詢處理平臺,可以在許多存儲系統(tǒng)中對基于不同文件格式存儲的數(shù)據(jù)執(zhí)行SQL查詢(BigTable,Spanner, Google Spreadsheets等)

運行內(nèi)容托管等大型Web服務(wù)需要在動態(tài)環(huán)境中實現(xiàn)穩(wěn)定的負(fù)載平衡。我們開發(fā)了一致的哈希方案,對每臺服務(wù)器的最大負(fù)載提供了嚴(yán)格的可證明保證,并將其部署到Google Cloud Pub / Sub中的云客戶。

AutoML

去年,我們展示了如何使用進(jìn)化算法自動發(fā)現(xiàn)最先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu),快速構(gòu)建計算機(jī)視覺模型的AutoML。還探討了強(qiáng)化學(xué)習(xí)如何應(yīng)用于除神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索之外的其他問題,表明它可以用于1)自動生成圖像變換序列,以提高各種圖像模型的準(zhǔn)確性,以及2)找到新的符號優(yōu)化表達(dá)式,比常用的優(yōu)化更新規(guī)則更有效。

我們的另一個重點是自動發(fā)現(xiàn)計算效率高的神經(jīng)網(wǎng)絡(luò)架構(gòu),以便它們可以在自動駕駛環(huán)境中運行,這些環(huán)境對計算資源或推理時間有嚴(yán)格的限制。為此,我們認(rèn)為在強(qiáng)化學(xué)習(xí)架構(gòu)搜索的獎勵函數(shù)中將模型的準(zhǔn)確性與其推理計算時間相結(jié)合,可以找到高度準(zhǔn)確的模型,同時滿足特定的性能約束。我們還探索了使用ML來學(xué)習(xí)自動壓縮ML模型以獲得更少的參數(shù)并使用更少的計算資源。

TPU

TPU已經(jīng)實現(xiàn)了谷歌研究方面的突破,例如BERT(前面已討論過)。它還允許世界各地的研究人員通過開源建立谷歌研究,并尋求自己的新突破。例如,任何人都可以通過Colab免費對TPU上的BERT進(jìn)行微調(diào),而TensorFlow Research Cloud讓數(shù)千名研究人員有機(jī)會從更大量的免費云TPU計算能力中受益。

在谷歌內(nèi)部,TPU還推動了Google的核心產(chǎn)品的重大改進(jìn),包括搜索,YouTube,Gmail,Google智能助理,谷歌翻譯等等。

開源軟件和數(shù)據(jù)集

我們的開源工具TensorFlow已經(jīng)被下載超過3000萬。2018年,TensorFlow有八個主要版本,并增加了快速執(zhí)行和分發(fā)策略等功能。隨著TensorFlow Lite、TensorFlow.js 和TensorFlow Probability等相關(guān)產(chǎn)品的推出,TensorFlow生態(tài)系統(tǒng)在2018年大幅增長。

除了繼續(xù)開發(fā)現(xiàn)有的開源生態(tài)系統(tǒng)之外,我們在2018年引入了一個新的框架,用于靈活和可重復(fù)強(qiáng)化學(xué)習(xí)的可視化工具,可以快速了解數(shù)據(jù)集的特征(無需編寫任何代碼)。

今年,我們很高興發(fā)布Google數(shù)據(jù)集搜索,這是一種從所有網(wǎng)絡(luò)中查找公共數(shù)據(jù)集的新工具。多年來,我們還策劃并發(fā)布了許多新穎的數(shù)據(jù)集。

我們發(fā)布了Open Images V4數(shù)據(jù)集,包含190萬張圖片,共計600個類別,共標(biāo)記了1540萬個邊界框,這是迄今的有對象位置注釋的最大數(shù)據(jù)集。這些邊界框大部分都是由專業(yè)注釋人員手動繪制的,確保了它們的準(zhǔn)確性和一致性。

健康

在過去幾年中,我們一直將ML應(yīng)用于健康,我們在這個領(lǐng)域的一般方法是與醫(yī)療保健組織合作解決基礎(chǔ)研究問題(利用臨床專家的反饋優(yōu)化技術(shù)),然后將結(jié)果發(fā)表在同行評審的科學(xué)和臨床期刊上。一旦研究得到臨床和科學(xué)驗證,我們就會進(jìn)行用戶和HCI研究,以了解我們?nèi)绾卧诂F(xiàn)實臨床環(huán)境中進(jìn)行部署。2018年,我們在計算機(jī)輔助診斷上取得新的突破。

2018年,我們研發(fā)了一個可以與視網(wǎng)膜專家相媲美的深度學(xué)習(xí)模型。我們與Verily的Alphabet同事合作,在印度的Aravind Eye Hospitals和泰國衛(wèi)生部附屬的Rajavithi醫(yī)院等 10多個地點部署了這種糖尿病視網(wǎng)膜病變檢測系統(tǒng)。

我們還發(fā)表了一種機(jī)器學(xué)習(xí)模型的研究,該模型可以評估視網(wǎng)膜圖像的心血管風(fēng)險,可以幫助臨床醫(yī)生更好地了解患者的健康狀況。

研究之外

2018年,我們在加納阿克拉建立了我們在非洲的第一個人工智能研究辦公室,同時擴(kuò)大了在巴黎,東京和阿姆斯特丹的人工智能研究,并在普林斯頓開設(shè)了一個研究實驗室。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2019-01-17
谷歌AI負(fù)責(zé)人Jeff Dean:一文回顧谷歌的2018技術(shù)進(jìn)展
1月15日,谷歌高級研究員、谷歌AI負(fù)責(zé)人Jeff Dean發(fā)表了博文,回顧總結(jié)了2018年谷歌的技術(shù)研究進(jìn)展。

長按掃碼 閱讀全文