11月3日消息,Google在2日舉辦的年度AI活動中集中介紹了GoogleAI目前取得的成果,以及在解決人類挑戰(zhàn)方面的創(chuàng)新,重點(diǎn)包括GoogleAI目前在3個變革性領(lǐng)域取得了突出成果。
這些新成果包括Google用AI技術(shù),預(yù)測洪水和野火、提升人類的健康等解決人類面臨的挑戰(zhàn);Google再次擴(kuò)充所支持語言,宣布“一千種語言計劃”,將支持全球1000種最常用語言的模型;同時Google集中展示生成式AI取得的進(jìn)展,包括推出新的LaMDA語言工具Wordcraft等,更好地幫助創(chuàng)作者提升創(chuàng)意能力。
用AI技術(shù)應(yīng)對氣候變化和健康挑戰(zhàn)
Google使用改造后的衛(wèi)星圖像來訓(xùn)練AI模型,使其能識別和實(shí)時跟蹤野火,從而幫助預(yù)測火勢演變和蔓延趨勢,幫助消防隊和救援人員及時了解野火事件。Google介紹,目前這一野火追蹤系統(tǒng)已在美國、加拿大、墨西哥和澳大利亞的部分地區(qū)推出,自7月以來,報道了美國和加拿大的30多起大型野火事件,在GoogleSearch和Maps中觸達(dá)超700多萬次展示,有效幫助用戶和消防人員了解了火勢情況。
2021年,GoogleAI洪水預(yù)測系統(tǒng)通過GoogleSearch和Maps向2300萬人發(fā)送了1.15億條洪水警報通知,讓無數(shù)生命免遭洪災(zāi)。Google還宣布在全球范圍內(nèi)推出新的模型GoogleFloodHub,該模型在GoogleSearch和Maps上線,通過顯示洪水可能發(fā)生的時間和地點(diǎn),來幫助更多的人在洪災(zāi)侵襲時轉(zhuǎn)移到安全地點(diǎn)。
Google的自動視網(wǎng)膜疾病評估工具(ARDA)已經(jīng)在印度、泰國、德國、美國和英國等國家部署使用和前瞻性研究中,成功篩查了超過15萬名患者,其中一半以上發(fā)生在2022年,Google透露之后還將繼續(xù)這一合作項(xiàng)目。此外,GoogleHealth團(tuán)隊目前正積極探索如何使用AI讓用戶通過手機(jī)就能檢測呼吸和心率。
AI模型賦能創(chuàng)作者和藝術(shù)家
在生成式AI方面,Imagen和Parti由Google研發(fā)、在質(zhì)量方面領(lǐng)先業(yè)內(nèi)的兩款圖像生成模型。Imagen是視頻序列的擴(kuò)散模型;Phenaki則是為文本提示序列,可以生成長且連貫視頻的模型。這兩款模型的研發(fā)團(tuán)體一直在合作使用這兩種模型制作視頻,在GoogleAI@的的活動上,Google首次分享了由AI技術(shù)生成的超分辨率視頻。接下來,Google將把這一技術(shù)帶到AITestKitchen(一個為人們提供了解、體驗(yàn)和反饋新興AI技術(shù)的渠道)。在第二代AITestKitchen中,用戶能使用"城市夢想家(CityDreamer)"建造主題城市,用"Wobble"設(shè)計能夠移動、跳舞和跳躍的友好怪物角色。所有這些都能通過文本提示(textprompts)來實(shí)現(xiàn)。
二維圖像外,文字轉(zhuǎn)3D現(xiàn)在也已經(jīng)成為現(xiàn)實(shí)。Google的DreamFusion可以生成一個能從任何角度觀看,并合成到任何三維環(huán)境中的三維模型。音頻生成領(lǐng)域,GoogleAudioLM模型僅通過聆聽音頻樣本就能學(xué)習(xí)生成逼真語音和鋼琴音樂,并預(yù)測在音頻提示幾秒鐘后應(yīng)該有哪些聲音。通過與使用Wordcraft的作家們合作,Google測試了由AI驅(qū)動的,建立在Google最先進(jìn)對話系統(tǒng)LaMDA上的文本生成系統(tǒng)。“當(dāng)我們開發(fā)這些工具時,我們與全球的創(chuàng)作者群體合作。用戶現(xiàn)在就可以在Wordcraft作家研討會上閱讀到這些故事的第一卷”JeffDean表示。
一千種語言計劃
語言,是人們與技術(shù)互動的最自然的方式,然而,隨著傳統(tǒng)的語言訓(xùn)練模型方法不再適應(yīng)全球交流方式的多樣性,大量的語言無法在互聯(lián)網(wǎng)上得到良好體現(xiàn),為全球信息互聯(lián)互通造成了巨大阻礙。為了解決這一難題,Google宣布了“一千種語言計劃”,該計劃承諾去構(gòu)建一個可支持1000種最常用語言的AI模型,為世界各地邊緣化社區(qū)的數(shù)十億人帶去更大的包容性。
作為該計劃的一部分,Google目前開發(fā)了一個支持超400種語言的通用語音模型(USM),據(jù)了解,這是迄今為止覆蓋范圍最大的語音模型。同時,隨著項(xiàng)目擴(kuò)展,Google與世界各地的社區(qū)合作,以獲取有代表性的語音數(shù)據(jù)。通過與非洲的研究人員和組織密切合作,Google近期宣布在Gboard上為另外9種非洲語言輸入語音,以創(chuàng)建和發(fā)布數(shù)據(jù)。在南亞,Google攜手當(dāng)?shù)卣⒎钦M織和學(xué)術(shù)機(jī)構(gòu),成功收集了來自所有地區(qū)方言和語言中有代表性的音頻樣本。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )