人工智能歷史由來已久,早在1308年,加泰羅尼亞詩人兼神學(xué)家者雷蒙·盧爾(Ramon Llull)出版《The Ultimate General Art》,詳細(xì)描述了其“邏輯機(jī)”的概念,這便是最早人工智能理念的誕生。隨著時(shí)代發(fā)展,如今的人工智能早已發(fā)生了翻天覆地的變化,以前的機(jī)器只關(guān)注算法本身,如今進(jìn)入到大數(shù)據(jù)時(shí)代,一切都將發(fā)生變化。
黃宜華(中國計(jì)算機(jī)學(xué)會大數(shù)據(jù)專家委員會常務(wù)委員、副秘書長)
11月13至14日,由OFweek中國高科技行業(yè)門戶主辦,OFweek人工智能網(wǎng)承辦的“OFweek2017中國人工智能大會”在深圳舉辦。中國計(jì)算機(jī)學(xué)會大數(shù)據(jù)專家委員會常務(wù)委員、副秘書長黃宜華教授在《大數(shù)據(jù)機(jī)器學(xué)習(xí)---從算法到系統(tǒng)》主題演講中,重點(diǎn)分析了目前機(jī)器該如何在大數(shù)據(jù)之下進(jìn)行學(xué)習(xí)。
大數(shù)據(jù)下的機(jī)器學(xué)習(xí)
首先,黃宜華教授對于大數(shù)據(jù)定義做了簡單介紹。他認(rèn)為,一般意義上大數(shù)據(jù)是指無法在可容忍的時(shí)間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。
近幾年,大數(shù)據(jù)逐漸成為學(xué)術(shù)界和產(chǎn)業(yè)界的熱點(diǎn),已在很多技術(shù)和行業(yè)內(nèi)廣泛應(yīng)用。從大規(guī)模數(shù)據(jù)庫到商業(yè)智能和數(shù)據(jù)挖掘應(yīng)用、從搜索引擎到推薦系統(tǒng)、以及最新的語音識別、翻譯等。大數(shù)據(jù)算法的設(shè)計(jì)、分析和工程涉及很多方面,包括大規(guī)模并行計(jì)算、流算法、云技術(shù)等。由于大數(shù)據(jù)存在復(fù)雜、高維、多變等特性,如何從真實(shí)、凌亂、無模式和復(fù)雜的大數(shù)據(jù)中挖掘出人類感興趣的知識,迫切需要更深刻的機(jī)器學(xué)習(xí)理論進(jìn)行指導(dǎo)。
大數(shù)據(jù)強(qiáng)大的計(jì)算能力,已成為推動大數(shù)據(jù)時(shí)代人工智能技術(shù)和應(yīng)用發(fā)展的動力,將大數(shù)據(jù)機(jī)器學(xué)習(xí)和人工智能推上了新一輪發(fā)展浪潮。大數(shù)據(jù)隱含著很多深度知識和價(jià)值,大數(shù)據(jù)智能化分析挖掘可為行業(yè)/企業(yè)帶來巨大的商業(yè)價(jià)值。大數(shù)據(jù)的深度價(jià)值發(fā)現(xiàn)需要使用基于機(jī)器學(xué)習(xí)的智能化復(fù)雜分析才能完成,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘已成為將大數(shù)據(jù)轉(zhuǎn)換成有用知識的關(guān)鍵技術(shù)。傳統(tǒng)計(jì)算時(shí)代,僅僅關(guān)注機(jī)器學(xué)習(xí)算法本身,而大數(shù)據(jù)時(shí)代的機(jī)器學(xué)習(xí),已經(jīng)不僅僅是一個算法問題,更是一個完整的大數(shù)據(jù)學(xué)習(xí)系統(tǒng)問題。
大數(shù)據(jù)學(xué)習(xí)系統(tǒng)未來發(fā)展趨勢
要實(shí)現(xiàn)高效的大數(shù)據(jù)機(jī)器學(xué)習(xí),需要構(gòu)建一個能同時(shí)支持機(jī)器學(xué)習(xí)算法設(shè)計(jì)和大規(guī)模數(shù)據(jù)處理的一體化大數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)。研究設(shè)計(jì)高效、可擴(kuò)展且易于使用的大數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)面臨諸多技術(shù)挑戰(zhàn)。近年來,大數(shù)據(jù)浪潮的興起,推動了大數(shù)據(jù)機(jī)器學(xué)習(xí)的迅猛發(fā)展,使大數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)成為大數(shù)據(jù)領(lǐng)域的一個熱點(diǎn)研究問題。
隨后,黃宜華教授還具體介紹了國內(nèi)外大數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)的基本概念、基本研究問題、技術(shù)特征、系統(tǒng)分類以及典型系統(tǒng)。
在整個機(jī)器學(xué)習(xí)的發(fā)展歷程中,主要有兩大研究方向。一是研究學(xué)習(xí)機(jī)制,注重探索、模擬人的學(xué)習(xí)機(jī)制;二是研究如何有效利用信息,注重從巨量數(shù)據(jù)中獲取隱藏的、有效的、可理解的知識。學(xué)習(xí)機(jī)制的研究是機(jī)器學(xué)習(xí)產(chǎn)生的源泉,但隨著大數(shù)據(jù)時(shí)代各行業(yè)對數(shù)據(jù)分析需求的持續(xù)增加,通過機(jī)器學(xué)習(xí)高效地獲取知識,已逐漸成為當(dāng)今機(jī)器學(xué)習(xí)技術(shù)發(fā)展的主要推動力。
最后,黃宜華教授具體解釋道,大數(shù)據(jù)時(shí)代的機(jī)器學(xué)習(xí)更強(qiáng)調(diào)“學(xué)習(xí)本身是手段”,機(jī)器學(xué)習(xí)成為一種支持技術(shù)和服務(wù)技術(shù),如何基于機(jī)器學(xué)習(xí)對復(fù)雜多樣的數(shù)據(jù)進(jìn)行深層次的分析,更高效地利用信息成為當(dāng)前機(jī)器學(xué)習(xí)研究的主要方向。機(jī)器學(xué)習(xí)越來越朝著智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術(shù)的一個重要源泉。另外,在大數(shù)據(jù)時(shí)代,隨著數(shù)據(jù)產(chǎn)生速度的持續(xù)加快,數(shù)據(jù)的體量有了前所未有的增長,而需要分析的新的數(shù)據(jù)種類也在不斷涌現(xiàn),如文本的理解、文本情感的分析、圖像的檢索和理解、圖形和網(wǎng)絡(luò)數(shù)據(jù)的分析等,機(jī)器學(xué)習(xí)研究領(lǐng)域涌現(xiàn)了很多新的研究方向,很多新的機(jī)器學(xué)習(xí)方法被提出并得到了廣泛應(yīng)用。
更多詳細(xì)內(nèi)容,敬請關(guān)注OFweek人工智能網(wǎng)后續(xù)專題報(bào)道!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )