6月7日消息,據(jù)國外媒體報(bào)道,IBM今日宣布發(fā)布名為“數(shù)據(jù)科學(xué)實(shí)驗(yàn)”( Data Science Experience)的通用數(shù)據(jù)平臺(tái)。其寄希望于通過該平臺(tái)整合各個(gè)不兼容系統(tǒng)中獨(dú)立存儲(chǔ)的數(shù)據(jù),從而對這些數(shù)據(jù)進(jìn)行深入分析。
數(shù)據(jù)科學(xué)家,有人也稱之為硅谷的統(tǒng)計(jì)學(xué)家,其潛力毋庸置疑。但目前對其作用不乏出現(xiàn)了一些失望。這個(gè)問題并不是關(guān)于大數(shù)據(jù)本身,而是相關(guān)技術(shù)的實(shí)用性。簡單的說,我們最先設(shè)計(jì)的系統(tǒng)能夠執(zhí)行特定的任務(wù),進(jìn)行特定的數(shù)據(jù)分析,隨后發(fā)現(xiàn)我們想讓它做的更多,作用更大。當(dāng)需求明確起來時(shí),會(huì)發(fā)現(xiàn)最大的問題是系統(tǒng)的兼容性。
而現(xiàn)在IBM發(fā)布的通用平臺(tái)就是用于解決不同系統(tǒng)的兼容性問題,通過整合不同系統(tǒng)、各種格式的數(shù)據(jù),有助于公司進(jìn)行管理,或參與市場競爭。
通用平臺(tái)的重要性
歐洲核研究組織CERN一直以來是世界上最大的科研機(jī)構(gòu)之一。它曾經(jīng)發(fā)現(xiàn)了反物質(zhì)的分離,近期正在進(jìn)行希格斯玻色子的相關(guān)研究。這里的工作與六個(gè)諾貝爾獎(jiǎng)的誕生有關(guān)。
然而,當(dāng)?shù)倌贰げ{斯·李(Tim Berners-Lee)于1980年在那里工作時(shí),他注意到該研究中心有一個(gè)非常棘手的問題。世界各地的研究人員來到這里進(jìn)行科學(xué)實(shí)驗(yàn),并記錄下他們的結(jié)果。但是,這些實(shí)驗(yàn)結(jié)果被以不同的格式存儲(chǔ)在不同的系統(tǒng)中,使得相互之間難以共享。
因此,李于1989年11月創(chuàng)建了三個(gè)著名協(xié)議:HTTP、URL以及HTML,創(chuàng)建了關(guān)于文檔的通用平臺(tái)。最終這三個(gè)協(xié)議構(gòu)成了現(xiàn)有互聯(lián)網(wǎng)的基石,使得我們能夠以前所未有的方式共享信息,在很多方面最終改變了世界。
盡管如此,李在回憶錄中還是承認(rèn)這種網(wǎng)絡(luò)的缺點(diǎn):雖然它能夠以前所未有的方式使人與人進(jìn)行溝通,但是對于機(jī)器與機(jī)器之間的通信卻做得很少。換句話說,它讓我們呢的思想能夠自由流動(dòng),但我們的數(shù)據(jù)卻依舊被困在各自的系統(tǒng)中。
數(shù)據(jù)的問題
現(xiàn)在的每個(gè)組織在數(shù)據(jù)上都存在類似CERN在上世紀(jì)80年代所遇到的問題。他們通過各個(gè)系統(tǒng)收集數(shù)據(jù),由不同的部門管理,很多系統(tǒng)有幾十年的歷史,所應(yīng)用的計(jì)算環(huán)境也完全不同。
諸如一個(gè)典型的零售企業(yè),其有各自獨(dú)立的采購、銷售、庫存以及市場業(yè)務(wù)。所有的這些業(yè)務(wù)在與真實(shí)世界交互的過程中,都在不斷地產(chǎn)生和存儲(chǔ)數(shù)據(jù)。理想情況下,這些系統(tǒng)應(yīng)當(dāng)是緊密集成的,一個(gè)業(yè)務(wù)產(chǎn)生的新數(shù)據(jù)可以影響到另外業(yè)務(wù)的決策。
但事實(shí)上,不同的業(yè)務(wù)之間很難無縫對接、攜手共進(jìn)。這些系統(tǒng)往往以不同的格式存儲(chǔ)信息,這使得人們很難獲得數(shù)據(jù)的全部價(jià)值,譬如現(xiàn)實(shí)中營銷活動(dòng)的相關(guān)數(shù)據(jù)會(huì)影響網(wǎng)站和商店的客流量,但是作為決策者經(jīng)常需要將其從系統(tǒng)中提取出來加載到分析表格中。
實(shí)際上,我們有了分析海量數(shù)據(jù)并獲得相應(yīng)決策的工具。屈臣氏所使用的高級認(rèn)知系統(tǒng)可以利用大數(shù)據(jù)進(jìn)行學(xué)習(xí),指導(dǎo)相應(yīng)的行動(dòng)決策。但對于這些工作的共性前提是,需要訪問不同系統(tǒng)的信息數(shù)據(jù)。
建立綜合數(shù)據(jù)環(huán)境
這一切并不是說,我們處理數(shù)據(jù)的方式在過去十年并沒有真正的進(jìn)步。于2003年上線的Hadoop可以將數(shù)據(jù)分散存儲(chǔ)在成千上萬個(gè)世界各地的服務(wù)器中,并將其看作一個(gè)數(shù)據(jù)集進(jìn)行分析。而2014年發(fā)布的星火系統(tǒng),可以幫助人們實(shí)時(shí)分析數(shù)據(jù)。但是,目前不同系統(tǒng)的兼容性仍是數(shù)據(jù)分析面臨的最大問題。
讓我們回到零售業(yè)的例子,假設(shè)我們能夠?qū)崟r(shí)的營銷活動(dòng)建立一個(gè)采購預(yù)測模型,將其與庫存系統(tǒng)的數(shù)據(jù)整合到一起,使我們能夠避免缺貨或是庫存過多??雌饋砗芎唵?,但是由于數(shù)據(jù)分散在各個(gè)獨(dú)立的系統(tǒng)中,所以很難實(shí)現(xiàn)。
這也是IBM的數(shù)據(jù)科學(xué)實(shí)驗(yàn)這個(gè)通用平臺(tái)所要解決的問題。IBM副總裁羅伯·托瑪斯(Rob Thomas)、大數(shù)據(jù)革命一書的作者告訴我,“今天數(shù)據(jù)科學(xué)是一項(xiàng)個(gè)人項(xiàng)目。我們現(xiàn)在所做的就是要把它變成一項(xiàng)團(tuán)隊(duì)項(xiàng)目,各個(gè)獨(dú)立的組織可以共同創(chuàng)建、分析以及共享數(shù)據(jù)。”
可以說,IBM數(shù)據(jù)科學(xué)家在實(shí)現(xiàn)李對互聯(lián)網(wǎng)所做的工作,只不過處理對象從文檔換成了數(shù)據(jù)。將分布于世界上的各個(gè)孤島數(shù)據(jù)整合到單一的系統(tǒng)環(huán)境,使人們更有效的工作。
管理的挑戰(zhàn)
美國意識流文學(xué)作家,諾貝爾文學(xué)獎(jiǎng)獲得者威廉·??思{(William Faulkner)曾寫道,“過去的從未消逝,它甚至并沒有過去。”在計(jì)算機(jī)技術(shù)發(fā)展的過程中,各種新老技術(shù)交織存在。我們呢并不是重新構(gòu)建技術(shù),而是停滯在一個(gè)個(gè)技術(shù)的頂端,這些技術(shù)羅列開來,仿佛精心制作的俄羅斯套娃。
當(dāng)我們嘗試將新老系統(tǒng)進(jìn)行結(jié)合,但隨之而來的問題是管理措施顯得更加落后。我們設(shè)計(jì)開發(fā)的計(jì)算機(jī)系統(tǒng)很大程度上反映了當(dāng)時(shí)的組織形式和思維方式。一旦平臺(tái)建立,技術(shù)壁壘被打破,我們的管理思維在很大程度上受到自身的限制。
今天,我們生活在一個(gè)語義經(jīng)濟(jì)環(huán)境中,信息在整個(gè)市場上自由流動(dòng)。各色設(shè)備和傳感器令人眼花繚亂,也讓我們能夠在現(xiàn)實(shí)世界自由互動(dòng)。但我們往往希望按照計(jì)劃行事,希望世界有序運(yùn)行。
當(dāng)代創(chuàng)新大師史蒂夫·布蘭克(Steve Blank)經(jīng)常說,與客戶的第一次接觸沒有任何商業(yè)計(jì)劃。但我們都停留在規(guī)劃思維的定勢,傾向于用歷史數(shù)據(jù)來預(yù)測事態(tài)發(fā)展,隨后根據(jù)預(yù)測結(jié)果進(jìn)行決策分析。經(jīng)常會(huì)在會(huì)議室里就決策討論數(shù)月,也會(huì)糾結(jié)于工作為什么不能按照計(jì)劃進(jìn)行,無法掌控。
很顯然,這種心態(tài)站不住腳。從技術(shù)層面,我們需要采取諸如貝葉斯的方法策略。雖然并不期望預(yù)測的結(jié)果完全正確,但可以讓大數(shù)據(jù)幫助我們減少錯(cuò)誤的發(fā)生。大數(shù)據(jù)并不是靈丹妙藥,但它的確可以幫助我們把這個(gè)世界看的更加清晰。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 密態(tài)計(jì)算技術(shù)助力農(nóng)村普惠金融 螞蟻密算、網(wǎng)商銀行項(xiàng)目入選大數(shù)據(jù)“星河”案例
- 專利糾紛升級!Netflix就虛擬機(jī)專利侵權(quán)起訴博通及VMware
- 兩大難題發(fā)布!華為啟動(dòng)2024奧林帕斯獎(jiǎng)全球征集
- 2025年工業(yè)軟件市場格局:7個(gè)關(guān)鍵統(tǒng)計(jì)數(shù)據(jù)與分析
- Commvault持續(xù)業(yè)務(wù)策略:應(yīng)對現(xiàn)代數(shù)據(jù)保護(hù)挑戰(zhàn)的新范式
- 2025年網(wǎng)絡(luò)安全主要趨勢
- 2025年值得關(guān)注的數(shù)據(jù)中心可持續(xù)發(fā)展趨勢
- 量子計(jì)算火熱,投資者又在大舉尋找“量子概念股”
- 從量子威脅到人工智能防御:2025年網(wǎng)絡(luò)安全將如何發(fā)展
- 后人工智能時(shí)代:2025年,在紛擾中重塑數(shù)據(jù)、洞察和行動(dòng)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。