隨著科技的不斷更新,移動互聯(lián)網的流行改良了人類記錄數(shù)據的方式,進而數(shù)據暴增進入大數(shù)據時代。今天正是國家全力投入發(fā)展數(shù)據技術的時代,定義數(shù)據科學這個新專業(yè)也越來越收到重視,截至目前,全國34個行省級行政區(qū)中有29個省級行政區(qū)的481所院校成功新增備案數(shù)據科學與大數(shù)據技術專業(yè),其中有個別院校開設了兩個不同學位的數(shù)據科學與大數(shù)據技術專業(yè)。
那么為什么就業(yè)市場會如此青睞擁有數(shù)據科學專業(yè)呢?
主要是因為面對這個信息爆炸的時代,數(shù)據的高數(shù)量、高維度、高更新速度以及背后的高商業(yè)價值,都對傳統(tǒng)的硬件存儲、數(shù)據管理和統(tǒng)計分析方法提出了更高的要求。原先的統(tǒng)計大多都是適用于小樣本的情況,原先的統(tǒng)計分析工具也以Excel為主,而面對這樣的大數(shù)據往往顯得無能為力。
舉個例子,一個人觀看某視頻網站的娛樂節(jié)目,下次刷新網頁,他會看到新的娛樂節(jié)目或者上一個視頻博主新的視頻。視頻中插播的廣告也是關于視頻內容相關的。這就是網站一個重要的廣告盈利模式,通過數(shù)據分析來預測觀眾的偏好,這個就是數(shù)據科學中的Predictive Analytics預測分析,而預測分析也只是它的冰山一角。
因此,數(shù)據科學需要包含更全面、更綜合的內容,它更像是一個對于實際數(shù)據問題所需要具備的一些基本和專業(yè)的知識。另外,數(shù)據科學涉及到如何從數(shù)據過渡到模型,再過渡到應用程序。因此,數(shù)據科學學科需要的不同的角色和技能,包括:統(tǒng)計學家、計算機科學家和軟件工程師等,其中不同的角色所交付的成果也不同。
那么在數(shù)據科學教學應該如何實施呢?
國內領先的數(shù)據科學協(xié)同平臺和鯨科技聯(lián)合TalkingData旗下騰云大學、全球知名云計算服務平臺AWS、開源學習社群Datawhale多家機構共同發(fā)布了《數(shù)據科學教育白皮書》(以下簡稱白皮書),旨聚焦于數(shù)據科學教育領域,研究基于全球視角下,數(shù)據科學教育的發(fā)展軌跡與方向。
《白皮書》認為,數(shù)據科學可以分成三個不同的核心:編程技能、數(shù)學和統(tǒng)計學能力、行業(yè)知識。這些領域共同構成了定義中的技能和技術,包括獲取數(shù)據、數(shù)據清理、數(shù)據分析、創(chuàng)建假設、算法、機器學習、優(yōu)化、結果可視化等等,數(shù)據科學匯集了這些領域和技能,支持和改進了從原始數(shù)據中提取見解和知識的過程。
而數(shù)據科學與其他學科也密切相關,一方面,作為高新技術產業(yè)的支柱,數(shù)據科學與信息技術在材料、器件等方面的需求帶動了物理、生物等學科的發(fā)展;另一方面,數(shù)據處理、存儲、檢索等技術推動了物理、生物、地球科學等現(xiàn)代科學進行更為復雜和全面的深入研究。
數(shù)據科學是系統(tǒng)的、跨學科的研究領域,用于從各種不同形式的數(shù)據中獲取知識和洞察。它就像粘合劑一樣,把不同領域的知識和不同人的想法融合到一起,共同來解決關于數(shù)據的問題,把信息轉換成知識,以及可以采取行動的洞察,合作將成為數(shù)據科學領域的常態(tài)。
想要了解更多數(shù)據科學教育項目發(fā)展現(xiàn)狀和學科建設路徑,關注和鯨公眾號,后臺回復“數(shù)據科學教育白皮書”,即可獲得完整內容。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )