黃宜華教授:大數(shù)據(jù)時代下機器學習的革新

人工智能歷史由來已久,早在1308年,加泰羅尼亞詩人兼神學家者雷蒙·盧爾(Ramon Llull)出版《The Ultimate General Art》,詳細描述了其“邏輯機”的概念,這便是最早人工智能理念的誕生。隨著時代發(fā)展,如今的人工智能早已發(fā)生了翻天覆地的變化,以前的機器只關(guān)注算法本身,如今進入到大數(shù)據(jù)時代,一切都將發(fā)生變化。

黃宜華教授:大數(shù)據(jù)時代下機器學習的革新

黃宜華(中國計算機學會大數(shù)據(jù)專家委員會常務(wù)委員、副秘書長)

11月13至14日,由OFweek中國高科技行業(yè)門戶主辦,OFweek人工智能網(wǎng)承辦的“OFweek2017中國人工智能大會”在深圳舉辦。中國計算機學會大數(shù)據(jù)專家委員會常務(wù)委員、副秘書長黃宜華教授在《大數(shù)據(jù)機器學習---從算法到系統(tǒng)》主題演講中,重點分析了目前機器該如何在大數(shù)據(jù)之下進行學習。

大數(shù)據(jù)下的機器學習

首先,黃宜華教授對于大數(shù)據(jù)定義做了簡單介紹。他認為,一般意義上大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。

近幾年,大數(shù)據(jù)逐漸成為學術(shù)界和產(chǎn)業(yè)界的熱點,已在很多技術(shù)和行業(yè)內(nèi)廣泛應(yīng)用。從大規(guī)模數(shù)據(jù)庫到商業(yè)智能和數(shù)據(jù)挖掘應(yīng)用、從搜索引擎到推薦系統(tǒng)、以及最新的語音識別、翻譯等。大數(shù)據(jù)算法的設(shè)計、分析和工程涉及很多方面,包括大規(guī)模并行計算、流算法、云技術(shù)等。由于大數(shù)據(jù)存在復(fù)雜、高維、多變等特性,如何從真實、凌亂、無模式和復(fù)雜的大數(shù)據(jù)中挖掘出人類感興趣的知識,迫切需要更深刻的機器學習理論進行指導(dǎo)。

大數(shù)據(jù)強大的計算能力,已成為推動大數(shù)據(jù)時代人工智能技術(shù)和應(yīng)用發(fā)展的動力,將大數(shù)據(jù)機器學習和人工智能推上了新一輪發(fā)展浪潮。大數(shù)據(jù)隱含著很多深度知識和價值,大數(shù)據(jù)智能化分析挖掘可為行業(yè)/企業(yè)帶來巨大的商業(yè)價值。大數(shù)據(jù)的深度價值發(fā)現(xiàn)需要使用基于機器學習的智能化復(fù)雜分析才能完成,機器學習和數(shù)據(jù)挖掘已成為將大數(shù)據(jù)轉(zhuǎn)換成有用知識的關(guān)鍵技術(shù)。傳統(tǒng)計算時代,僅僅關(guān)注機器學習算法本身,而大數(shù)據(jù)時代的機器學習,已經(jīng)不僅僅是一個算法問題,更是一個完整的大數(shù)據(jù)學習系統(tǒng)問題。

大數(shù)據(jù)學習系統(tǒng)未來發(fā)展趨勢

要實現(xiàn)高效的大數(shù)據(jù)機器學習,需要構(gòu)建一個能同時支持機器學習算法設(shè)計和大規(guī)模數(shù)據(jù)處理的一體化大數(shù)據(jù)機器學習系統(tǒng)。研究設(shè)計高效、可擴展且易于使用的大數(shù)據(jù)機器學習系統(tǒng)面臨諸多技術(shù)挑戰(zhàn)。近年來,大數(shù)據(jù)浪潮的興起,推動了大數(shù)據(jù)機器學習的迅猛發(fā)展,使大數(shù)據(jù)機器學習系統(tǒng)成為大數(shù)據(jù)領(lǐng)域的一個熱點研究問題。

隨后,黃宜華教授還具體介紹了國內(nèi)外大數(shù)據(jù)機器學習系統(tǒng)的基本概念、基本研究問題、技術(shù)特征、系統(tǒng)分類以及典型系統(tǒng)。

在整個機器學習的發(fā)展歷程中,主要有兩大研究方向。一是研究學習機制,注重探索、模擬人的學習機制;二是研究如何有效利用信息,注重從巨量數(shù)據(jù)中獲取隱藏的、有效的、可理解的知識。學習機制的研究是機器學習產(chǎn)生的源泉,但隨著大數(shù)據(jù)時代各行業(yè)對數(shù)據(jù)分析需求的持續(xù)增加,通過機器學習高效地獲取知識,已逐漸成為當今機器學習技術(shù)發(fā)展的主要推動力。

最后,黃宜華教授具體解釋道,大數(shù)據(jù)時代的機器學習更強調(diào)“學習本身是手段”,機器學習成為一種支持技術(shù)和服務(wù)技術(shù),如何基于機器學習對復(fù)雜多樣的數(shù)據(jù)進行深層次的分析,更高效地利用信息成為當前機器學習研究的主要方向。機器學習越來越朝著智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術(shù)的一個重要源泉。另外,在大數(shù)據(jù)時代,隨著數(shù)據(jù)產(chǎn)生速度的持續(xù)加快,數(shù)據(jù)的體量有了前所未有的增長,而需要分析的新的數(shù)據(jù)種類也在不斷涌現(xiàn),如文本的理解、文本情感的分析、圖像的檢索和理解、圖形和網(wǎng)絡(luò)數(shù)據(jù)的分析等,機器學習研究領(lǐng)域涌現(xiàn)了很多新的研究方向,很多新的機器學習方法被提出并得到了廣泛應(yīng)用。

更多詳細內(nèi)容,敬請關(guān)注OFweek人工智能網(wǎng)后續(xù)專題報道!

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2017-11-16
黃宜華教授:大數(shù)據(jù)時代下機器學習的革新
人工智能歷史由來已久,早在1308年,加泰羅尼亞詩人兼神學家者雷蒙·盧爾(Ramon Llull)出版《The Ultimate General Art》,詳細描述了其“邏輯機”的概念,這便是最早人工

長按掃碼 閱讀全文