人工智能是一個涵蓋圖像識別、自然語言處理(NLP)和機器人等多方面維度的廣泛領(lǐng)域。AI也在以一種有時看似瘋狂的速度發(fā)展,因此很難跟上正在發(fā)生的一切。
不出所料,許多組織轉(zhuǎn)向他們的IT供應(yīng)商合作伙伴,幫助他們開發(fā)和部署AI解決方案,以最好地滿足他們的需求。大衛(wèi)·埃里森是聯(lián)想公司的高級人工智能數(shù)據(jù)科學(xué)家,他的職責(zé)包括使用先進的人工智能技術(shù)為客戶組織提供解決方案,同時在內(nèi)部支持聯(lián)想全球數(shù)據(jù)中心集團的整體人工智能戰(zhàn)略。
聯(lián)想已投入商業(yè)運營的項目包括利用卷積神經(jīng)網(wǎng)絡(luò)從圖像中提取特征,并將其歸類為缺陷,以檢測工廠的制造缺陷。聯(lián)想還為一家賽車公司開發(fā)了一套計算機視覺系統(tǒng),以決定是否應(yīng)該讓特定的汽車進入維修站進行維修。
埃利森表示,今年和不久的將來,人工智能的主要趨勢包括基于計算機視覺的應(yīng)用程序、用于訓(xùn)練人工智能模型的數(shù)據(jù)生成和數(shù)據(jù)標記算法的開發(fā),以及基于轉(zhuǎn)換模型的自然語言處理的快速進展。
聯(lián)想對人工智能近期主要趨勢有如下展望:
計算機視覺
在計算機視覺方面,開發(fā)人員和研究人員現(xiàn)在開始探索將這種能力與人工智能的其他一些領(lǐng)域相結(jié)合的實用方法,比如機器人技術(shù)或自動應(yīng)用圖像字幕等應(yīng)用的自然語言處理。據(jù)埃里森介紹,這部分是因為計算機視覺的一些基本問題已經(jīng)被證明很難解決,研究人員正在尋找新的方法來解決這些問題,而不是簡單地推動研究領(lǐng)域向前發(fā)展。
埃里森:“我認為我們在解決一些核心的計算機視覺任務(wù)時遇到了問題,比如3D投影,當(dāng)你看到一張圖片,一棟建筑的二維圖像,人類的大腦可以將其推斷成三維形狀,但機器很難做到這一點。”在這方面已經(jīng)有很多研究,但這是一個尚未解決的核心問題,我認為人們會感到沮喪,會嘗試一些新東西,或者嘗試將它與其他領(lǐng)域相結(jié)合,找到更好的用途?!?/p>
埃里森認為,這就是為什么機器人技術(shù)是目前最廣泛研究的人工智能領(lǐng)域之一,因為它為人們提供了一個明確的目標。他列舉的例子包括使人工智能能夠使用視覺感應(yīng)在其周圍的空間中安全移動——無論是制造工廠的機械臂,還是使用人工智能導(dǎo)航到目的地的自動車輛。
訓(xùn)練數(shù)據(jù)
熟悉人工智能的人會知道,成功訓(xùn)練一個模型的關(guān)鍵因素之一是數(shù)據(jù),這需要大量的數(shù)據(jù)。事實上,它所訓(xùn)練的數(shù)據(jù)越多,就越能更好地交付你所尋求的結(jié)果。據(jù)埃里森不是,計算機視覺目前很困難,因為用于訓(xùn)練模型的數(shù)據(jù)集沒有包含足夠多的樣本。例如,吉布森三維空間數(shù)據(jù)庫(Gibson Database of 3D Spaces)是一個廣泛使用的數(shù)據(jù)集,用于訓(xùn)練模型在室內(nèi)空間中導(dǎo)航,它包括572棟完整的建筑,共1447層。雖然令人印象深刻,但這不太可能是一個人工智能系統(tǒng)在現(xiàn)實世界中可能遇到的全面集合。
當(dāng)物體的方向與計算機視覺模型所訓(xùn)練的方向不同時,也會出現(xiàn)類似的問題。在被廣泛用于人工智能訓(xùn)練的ImageNet數(shù)據(jù)集中,埃里森:“一把椅子只是一張椅子的照片,面對著鏡頭。如果你把椅子翻過來,電腦視覺應(yīng)用程序突然就認不出它了。”
這個缺點是一個名為ObjectNet的新數(shù)據(jù)集的靈感來源,它以不同的配置顯示日常項目,例如椅子翻轉(zhuǎn)或倒置。這個訓(xùn)練集被用來解決計算機視覺的一些缺點,例如不能識別方向不正?;虿糠帜:奈矬w。
但是為人工智能訓(xùn)練獲取足夠大和多樣化的數(shù)據(jù)集的問題仍然存在,這導(dǎo)致了埃里森發(fā)現(xiàn)的另一個主要趨勢,即首先使用人工智能來生成數(shù)據(jù)集。
自我監(jiān)督和綜合數(shù)據(jù)
數(shù)據(jù)集需要大量的人工數(shù)據(jù)標簽,因此越來越多的研究項目現(xiàn)在都集中在自我監(jiān)督算法上,它可以獲取已經(jīng)收集到的數(shù)據(jù),并讓計算機自動給數(shù)據(jù)貼上標簽。
埃里森解釋:“一個典型的例子就是一個具有計算機視覺應(yīng)用和接近傳感器機器人。計算機視覺能夠比接近傳感器看得更遠。但是當(dāng)機器人向前移動時,出現(xiàn)在計算機視覺中的東西最終會以物體的形式出現(xiàn)在近距離傳感器中?!备鶕?jù)傳感器的數(shù)據(jù),回溯到物體第一次被發(fā)現(xiàn)的時間,然后對其進行標記。
人工智能系統(tǒng)一旦部署就不太可能遇到這樣的問題,因此可能無法在訓(xùn)練數(shù)據(jù)集中表示出來,這是開發(fā)人員面臨的另一個挑戰(zhàn)。然而,如果這些邊緣情況代表了真實場景,那么就需要考慮這些情況,以確保AI模型正確地處理它們。
“關(guān)鍵的例子是自動駕駛。在你的數(shù)據(jù)集中有多少次在昏暗的暴風(fēng)雪中開車上山?你的數(shù)據(jù)集中不會有很多這樣的情況,所以他們本質(zhì)上必須做模擬數(shù)據(jù)?!?/p>
換句話說,邊緣案例是通過使用合成數(shù)據(jù)來處理的,合成數(shù)據(jù)是使用各種方法來創(chuàng)建的,例如生成模型。但這也產(chǎn)生了一個問題,即數(shù)據(jù)科學(xué)家或開發(fā)人員如何才能確保這些合成數(shù)據(jù)準確地反映出人工智能在現(xiàn)實生活中會遇到什么情況。
12下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )