875名受訪者得出6條重要結論,解析數(shù)據(jù)分析和可視化應用的現(xiàn)狀

各行各業(yè)的企業(yè)在收集、存儲和分析來自不同格式的數(shù)據(jù)。在數(shù)據(jù)競爭下,要想獲得成功,利用數(shù)據(jù)進行商業(yè)決策則變成了比業(yè)務本身更重要的事情。

數(shù)據(jù)分析和可視化技術的快速發(fā)展意味著企業(yè)和個人非常希望通過正確的技術選擇盡快地獲得業(yè)務上的成功。

創(chuàng)業(yè)者們需要知道他們是否選擇了正確的語言、產(chǎn)品、架構和數(shù)據(jù)源,而個人則需要知道他們是否正在學習正確的技能來獲得更有前途的工作。那些沒有選擇正確的人會面臨被淘汰的危險,因為他們沒有充分利用實時的數(shù)據(jù)分析和可視化程序提供的洞察理解。

基于數(shù)據(jù)分析和可視化技術的迅速發(fā)展,大數(shù)據(jù)分析和可視化工具提供商Zoomdata聯(lián)合橫跨多領域的科技媒體公司O’Reilly Media進行了一次調(diào)查,以評估數(shù)據(jù)分析和可視化應用的現(xiàn)狀。有875名受訪者提供了他們使用這些技術的情況。在詳細分析調(diào)研結果之前,我們先把主要的結論列出,以便大家閱讀:

大數(shù)據(jù)分析和可視化應用在制造業(yè)、金融服務和科技/軟件公司中是最成熟的。這些技術通常是企業(yè)級用戶及業(yè)務分析師來使用,他們通常是依靠可視化儀表盤來獲取所需的見解,以優(yōu)化業(yè)務流程并更好的了解客戶。關系型數(shù)據(jù)庫仍然是最常見的數(shù)據(jù)源(雖然分析型數(shù)據(jù)庫和Hadoop是大數(shù)據(jù)領域最常見的數(shù)據(jù)源)。企業(yè)非常需要Python、SQL和關系型數(shù)據(jù)庫的能力。Kafka和Spark正在成為流數(shù)據(jù)技術(streaming data technology)的首選。360度客戶洞察是最常見的使用場景。

數(shù)據(jù)分析和可視化使用概覽

875個受訪者來自不同的行業(yè)(如圖1所示),其中超過35%來自科技/軟件行業(yè),接近10%來自金融服務,8%來自醫(yī)療健康/醫(yī)療科技領域,還有制造業(yè)、政府、零售和教育/學術這幾個領域分別占約5%。

圖1?受訪者所在的行業(yè)及占比

從受訪者的工作崗位來看,18%是是工程師/開發(fā)人員,17%是數(shù)據(jù)科學家,15%是數(shù)據(jù)分析師/業(yè)務分析師,還有13%是架構師,他們的公司規(guī)模各異。有趣的是,企業(yè)CXO們和經(jīng)理的占比也非常高(14%),甚至高于IT專家(8%)。

還有一個值得關注的是,有26%的受訪者是來自員工人數(shù)少于50人的企業(yè),這也表明了小型企業(yè)是使用這些新技術和業(yè)務流程的領導者。

超過50%的受訪者表示,他們使用分析來獲得全方位的客戶洞察,43%的受訪者使用分析來優(yōu)化業(yè)務流程(如圖2所示)。客戶和業(yè)務流程是直接影響業(yè)務的重要因素,因此這些環(huán)節(jié)也是企業(yè)需要使用數(shù)據(jù)分析和可視化工具從而通過數(shù)據(jù)來輔助決策的重要方面。

圖2?數(shù)據(jù)分析和可視化工具使用的主要領域和占比

主要領域分析

在圖2中,我們看到360度客戶洞察是數(shù)據(jù)分析和可視化工具使用最多的領域,但是從不同的行業(yè)來看情況可能就有所不同,而且也能顯示出一些趨勢。

在科技/軟件、金融服務和零售行業(yè),360度客戶洞察無疑是使用分析技術最主要的領域,占比在50%以上。令我們感到驚訝的是在教育/學術行業(yè),使用分析技術最主要的領域也是360度客戶洞察。毫無疑問這些行業(yè)都是客戶至上的行業(yè),只有全面的了解客戶,才能給客戶更好的體驗,才能獲得更多的收入。

醫(yī)療保健/醫(yī)療科技行業(yè)中醫(yī)療數(shù)據(jù)分析是使用分析技術的主要領域,這并不令人驚訝,因為能稱作是醫(yī)療科技的醫(yī)療企業(yè)都需要分析醫(yī)療數(shù)據(jù),否則很難做出有現(xiàn)實意義的成果。

業(yè)務流程優(yōu)化也是一個重度使用分析技術的主要領域,在調(diào)查報告里的所有涉及到的行業(yè),業(yè)務流程優(yōu)化使用技術分析技術的占比都排在前三位,在制造業(yè)和政府行業(yè)則排名第一。優(yōu)化業(yè)務流程通常會降低運營成本,并可能提高客戶的滿意度,因此這也是在許多行業(yè)中建立競爭優(yōu)勢的戰(zhàn)略途徑之一。

制造業(yè)和零售行業(yè)也把重點放在了供應鏈分析上。及時發(fā)現(xiàn)供應鏈環(huán)節(jié)中存在的問題,可以幫助零售商和制造企業(yè)節(jié)省換供應商的時間。一個優(yōu)化的供應鏈結構也是一個企業(yè)的競爭優(yōu)勢和技術壁壘。

欺詐檢測/網(wǎng)絡安全情報是金融服務和政府行業(yè)的重要領域。欺詐檢測對于任何金融服務都至關重要,離錢越近的地方越容易出現(xiàn)欺詐行為。檢測并消除欺詐行為有助于與客戶建立信任并降低運營成本。網(wǎng)絡安全情報是眾多政府機構關注的焦點,在選舉和可持續(xù)運營層面,防止欺詐也至關重要。

我們還向受訪者提了這樣一個問題“貴公司的大數(shù)據(jù)分析處于什么階段?是剛剛開始,還是已經(jīng)應用在工作的各個方面?”,有助于我們理解各行業(yè)的采用率如何變化。令我們驚訝的是制造業(yè)行業(yè)有26%的受訪者表示他們的公司在多個方面都已經(jīng)使用了數(shù)據(jù)分析技術,是所有行業(yè)中最高的,而最低的是政府行業(yè),只有7%的人認為公司在多個方面已經(jīng)應用了數(shù)據(jù)分析技術。政府行業(yè)也是“我們沒有使用大數(shù)據(jù)分析技術”這個選項占比最多的行業(yè),達到33%,科技/軟件行業(yè)則占比最低。

如何使用數(shù)據(jù)

在如何獲取數(shù)據(jù)來源的問題中,數(shù)據(jù)倉庫/數(shù)據(jù)集市是最多的回答,在零售行業(yè)最為明顯。虛擬聯(lián)合/糅合(Virtual federation/mashup,即時混合數(shù)據(jù)而不移入倉庫)在醫(yī)療健康/醫(yī)療科技、科技/軟件和政府行業(yè)應用的最多。

圖3 數(shù)據(jù)來源在各行業(yè)的分布占比

關系型數(shù)據(jù)庫仍然是各行業(yè)使用最多的,在醫(yī)療健康/醫(yī)療科技行業(yè)的占有率達到39%。非關系型數(shù)據(jù)庫以及大數(shù)據(jù)存儲的分析型數(shù)據(jù)庫、Hadoop、NoSQL數(shù)據(jù)庫、云數(shù)據(jù)存儲、內(nèi)存數(shù)據(jù)庫和搜索數(shù)據(jù)庫中,金融服務和政府使用分析型數(shù)據(jù)庫最多,而零售和科技/軟件行業(yè)使用云數(shù)據(jù)庫存儲最多。

Kafka和Spark是分析流數(shù)據(jù)最常用的技術,在我們的調(diào)查中,這兩個技術占流數(shù)據(jù)分析的65%以上。科技/軟件行業(yè)是使用Kafka的主要行業(yè),其次是金融服務。政府中最普遍的是使用Confluence。

大數(shù)據(jù)分析的必備技術

在我們分析使用數(shù)據(jù)分析和可視化工具的技術人員的相關技能時,我們發(fā)現(xiàn)總體上需求最大的是Python、SQL和關系型數(shù)據(jù)庫,其次是Hadoop和Java。政府行業(yè)最需要的是會Python的人才,其次是關系型數(shù)據(jù)庫的人才,而醫(yī)療健康/醫(yī)療科技最需要的事SQL的人才。

大數(shù)據(jù)的價值所在

衡量大數(shù)據(jù)的價值有四個方面:準確性、實時性、多樣性和數(shù)據(jù)量。準確性指的是數(shù)據(jù)接近“真相”的程度,實時性指的是數(shù)據(jù)收集和分析的速度,多樣性指的是結構化和非結構化數(shù)據(jù)的多種來源和類型,數(shù)據(jù)量指的是能夠收集和分析的總數(shù)據(jù)量。我們通過了解各個企業(yè)看重這四個方面的哪幾個方面,來深入理解數(shù)據(jù)分析是如何影響公司業(yè)務的。

從整體來看,衡量數(shù)據(jù)的價值最重要的方面是準確性,這并不令人意外,因為沒有真實的數(shù)據(jù),那么分析結果就沒有任何意義。其次重要的是多樣性,這表明無論什么行業(yè),做數(shù)據(jù)分析和可視化必須要結合多種來源和類型的數(shù)據(jù),才能更好的提供企業(yè)所需的見解。實時性是最不重要的,這表明典型的商業(yè)數(shù)據(jù)獲取是否及時并不影響分析的結果和業(yè)務的決策,這也是流數(shù)據(jù)分析相對少的原因之一。但實時性對于科技/軟件和制造業(yè)來說卻是最有價值的。

總之,為了更好的給企業(yè)提供商業(yè)價值,數(shù)據(jù)分析和可視化工具越來越多的應用在日常工作中,給業(yè)務分析師和管理人員提供所需的信息。這些信息通常嵌入到生產(chǎn)環(huán)境的應用程序或獨立的BI應用中,并通過儀表盤進行操作。我們通過這個調(diào)研希望可以給企業(yè)一個直觀的感受,讓各個行業(yè)的從業(yè)人員都了解到大數(shù)據(jù)分析技術已經(jīng)發(fā)展到什么程度以及采用度如何,在今后采用這些新技術或拓展大數(shù)據(jù)收集、存儲、分析和可視化應用時,有一個參考。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2017-12-01
875名受訪者得出6條重要結論,解析數(shù)據(jù)分析和可視化應用的現(xiàn)狀
各行各業(yè)的企業(yè)在收集、存儲和分析來自不同格式的數(shù)據(jù)。在數(shù)據(jù)競爭下,要想獲得成功,利用數(shù)據(jù)進行商業(yè)決策則變成了比業(yè)務本身更重要的事情。 數(shù)據(jù)分析和可視化技術的快

長按掃碼 閱讀全文