很多人都在說,現(xiàn)在已經(jīng)進(jìn)入大數(shù)據(jù)時代,大數(shù)據(jù)已經(jīng)在影響著社會以及個體生活的方方面面,正如作者的觀點,大數(shù)據(jù)是不容忽視的。書中提到,“大數(shù)據(jù)”這個概念,最早是由天文學(xué)和基因?qū)W等學(xué)科創(chuàng)造的,這表明在計算機領(lǐng)域以外,在網(wǎng)絡(luò)得到發(fā)展之前,人們就已經(jīng)看到數(shù)據(jù)的重要性,并重視對數(shù)據(jù)的分析和利用。
在計算機領(lǐng)域,大數(shù)據(jù)的價值得到突顯。計算機的發(fā)展、網(wǎng)絡(luò)的優(yōu)化,以及在背后起推動作用的存儲技術(shù)、數(shù)據(jù)處理技術(shù)等技術(shù)的進(jìn)步,無疑形成了大數(shù)據(jù)茁壯成長的肥沃土壤。在這樣的條件下,大數(shù)據(jù)快速積累。一些公司或機構(gòu)主動增加數(shù)據(jù),比如谷歌的全球定位系統(tǒng),收集了大量的位置和地理信息;而更多的數(shù)據(jù)是來源于被動的收集,每一位上網(wǎng)的用戶,他們的瀏覽記錄和發(fā)布的信息,都將被積累保存到數(shù)據(jù)庫。
越來越龐大的數(shù)據(jù)量、不斷升級的存儲技術(shù),和大量的大數(shù)據(jù)應(yīng)用實例,都在顯示,現(xiàn)在已經(jīng)是大數(shù)據(jù)時代。
大數(shù)據(jù)不僅僅是字面上的意義,指大量,或者說是超大規(guī)模的數(shù)據(jù)。現(xiàn)在更多的是指利用相關(guān)的技術(shù),來對這些主動或被動收集來的數(shù)據(jù),進(jìn)行存儲、分析和處理,讓它們?yōu)槟稠椆娴幕蛏虡I(yè)的研究服務(wù)。
書中提到了很多利用大數(shù)據(jù)的例子,“大數(shù)據(jù)的核心是預(yù)測”。利用收集到的大量數(shù)據(jù),對其進(jìn)行分析,可以預(yù)測流感爆發(fā)的大致時間和地點,可以預(yù)測個人的犯罪傾向,可以幫助企業(yè)判斷客戶的狀態(tài)和需求,以便準(zhǔn)確地向他們推薦產(chǎn)品。
這些具體的例子,都在證明大數(shù)據(jù)給這個社會帶來的好處。除了推動技術(shù)的進(jìn)步,它還讓很多難以解決的社會問題,變得簡單和清晰。對于個人來說,我們也不得不承認(rèn),大數(shù)據(jù)給我們的生活帶來了便利。我們可以通過網(wǎng)絡(luò)查找我們想要的信息,某些新聞客戶端會推送我們感興趣的新聞,大大節(jié)省了我們的時間。
但是,沒有什么是完美無缺的,大數(shù)據(jù)優(yōu)勢突出,缺陷也同樣明顯。為了更好地利用大數(shù)據(jù),作者希望我們能改變思維,要更看重“是什么”,而不是為什么,不需要追求精確性,要接受混雜性。這在一定程度上,也是由大數(shù)據(jù)的局限性決定的,因為數(shù)據(jù)庫避免不了會混進(jìn)一些錯誤的數(shù)據(jù),這樣就得不到精確的結(jié)果,而在大數(shù)據(jù)的現(xiàn)有條件下,想要知道現(xiàn)象背后的原因,也幾乎是不可能。
另外,數(shù)據(jù)可以從很多不可能的地方提取,甚至可以說,世間萬物都可以數(shù)據(jù)化。面對大數(shù)據(jù)帶來的種種好處,有些人會變得過于依賴數(shù)據(jù),而數(shù)據(jù)遠(yuǎn)沒有我們所想的那么可靠。過度地依賴大數(shù)據(jù),單純地為了“數(shù)據(jù)”而“數(shù)據(jù)”,而不去考慮其他的因素,可能會得到事與愿違的結(jié)果。這是在大數(shù)據(jù)產(chǎn)生之前就存在的問題,只是數(shù)據(jù)增多,問題也就隨之升級了。因此,只有得到了合理地利用,大數(shù)據(jù)才會發(fā)揮出它強大的能量。
最令人擔(dān)憂的,應(yīng)該是大數(shù)據(jù)對用戶隱私的威脅,這在技術(shù)上幾乎是難以解決的。提到大數(shù)據(jù)時代的隱私泄露,有人會用奧威爾的《1984》作類比,雖然過于夸張,但這也表明了人們的擔(dān)心。作為一個普通的網(wǎng)絡(luò)用戶,最直觀的感受,就是一打開電腦,便被各種購物網(wǎng)站支配的恐懼。你近期在某購物網(wǎng)站搜過什么,各種廣告彈窗就會出現(xiàn)什么。一些企業(yè),尤其是電子商務(wù)公司,熱衷于使用大數(shù)據(jù)分析,他們可以根據(jù)用戶的檢索習(xí)慣、消費習(xí)慣和其他信息的收集,對用戶的狀態(tài)進(jìn)行判斷,比較準(zhǔn)確的為他們推薦可能需要的產(chǎn)品。除此之外,越來越多的個人信息,在網(wǎng)絡(luò)上都能夠找得到,你根本沒有辦法去防止你的信息不會被利用,就算發(fā)現(xiàn)被利用,你可能也不會知道是從什么地方泄露的。
“大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的將來”。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 華為研發(fā)中心入駐上海青浦致小鎮(zhèn)房租大漲,帶動周邊租房市場熱潮
- 華為員工涌入蘇滬兩地,房東狂歡:租金幾近翻倍,跨省租房成新常態(tài)
- 制造業(yè)巨頭空客計劃裁員2500人,應(yīng)對航天業(yè)務(wù)虧損與供應(yīng)鏈挑戰(zhàn)
- 科技創(chuàng)新引領(lǐng)產(chǎn)業(yè)發(fā)展:江陰市與清華大學(xué)攜手推進(jìn)重大科技項目
- 美國或再升級出口管制:考慮限制AI芯片對中東出口
- 劉強東章澤天報案:京東發(fā)言人證實夫婦倆遭有組織造謠,警方已介入
- 東方甄選擬15億出售教育業(yè)務(wù)
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設(shè)立5億元AI創(chuàng)投基金
- 聯(lián)想發(fā)布 ThinkStation P8工作站
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。