亞馬遜云科技:釋放數(shù)據(jù)價值,安全是前提條件

一直以來,數(shù)據(jù)安全都是重中之重。

隨著生成式AI的興起,大語言模型就像一把“雙刃劍”,帶來生產(chǎn)力飛速提升的同時,也需要海量數(shù)據(jù)進(jìn)行持續(xù)訓(xùn)練,隨之而來就是數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)隱私保護(hù)等一系列全新的挑戰(zhàn)。

可以說,生成式AI等人工智能新趨勢正在打開數(shù)據(jù)安全、數(shù)據(jù)治理的全新格局。用戶們需要重新全面審視自身的數(shù)據(jù)安全與數(shù)據(jù)治理。正如亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建所言:“數(shù)據(jù)已經(jīng)是現(xiàn)代發(fā)明和創(chuàng)新之源。進(jìn)入到數(shù)智化時代,數(shù)據(jù)安全是企業(yè)的首要優(yōu)先級。”

那么,面對數(shù)據(jù)安全與數(shù)據(jù)治理的新趨勢,企業(yè)應(yīng)該如何在保證數(shù)據(jù)本身安全合規(guī)的前提下,全面釋放出數(shù)據(jù)的價值?為此,亞馬遜云科技圍繞業(yè)務(wù)數(shù)據(jù)的可識別、可見、可協(xié)作和安全數(shù)據(jù)的可操作四大場景提供創(chuàng)新服務(wù)和解決方案,并助力生成式AI基礎(chǔ)模型廣泛獲取內(nèi)外部數(shù)據(jù)并實現(xiàn)安全訓(xùn)練。

識別敏感數(shù)據(jù)

一直以來,數(shù)據(jù)價值的釋放與數(shù)據(jù)合規(guī)就像一對“矛盾體”,讓很多企業(yè)左右為難。

事實上,數(shù)據(jù)合規(guī)乃大勢所趨。近年來,全球主要經(jīng)濟(jì)體均在推動數(shù)據(jù)合規(guī)的完善。從歐盟的GDPR,到美國的 ADPPA,再到中國的《個人信息保護(hù)法》、《數(shù)據(jù)出境安全評估辦法》等,各個國家均希望數(shù)據(jù)在合規(guī)的前提下有序流動、共享與應(yīng)用。

比如,今年生成式AI浪潮興起,大語言模型帶來了數(shù)據(jù)安全與數(shù)據(jù)隱私等一系列的新問題。國家馬上出臺了《生成式人工智能服務(wù)管理暫行辦法》來規(guī)范大模型的訓(xùn)練和保障數(shù)據(jù)安全。

在數(shù)據(jù)合規(guī)方面,敏感數(shù)據(jù)的識別、管理和分級至關(guān)重要,且耗時費(fèi)力,尤其是從多個數(shù)據(jù)源中自動識別敏感數(shù)據(jù)是很多企業(yè)面臨的挑戰(zhàn)。陳曉建認(rèn)為,數(shù)據(jù)的安全合規(guī)需要人、流程、工具全鏈路的相互配合,并且充分利用機(jī)器學(xué)習(xí)、模式匹配等方式自動識別敏感數(shù)據(jù),降低數(shù)據(jù)合規(guī)的操作難度。

為此,亞馬遜云科技打造出敏感數(shù)據(jù)保護(hù)解決方案(Sensitive Data Protection on Amazon Web Services, 簡稱 SDP)等量身定制的工具產(chǎn)品與解決方案,允許客戶創(chuàng)建數(shù)據(jù)目錄、使用內(nèi)置或定制數(shù)據(jù)識別規(guī)則定義敏感數(shù)據(jù)類型,中心化的管理平臺讓客戶通過網(wǎng)頁應(yīng)用程序?qū)γ舾袛?shù)據(jù)資產(chǎn)進(jìn)行可視化管理,實現(xiàn)業(yè)務(wù)數(shù)據(jù)合規(guī),為釋放數(shù)據(jù)價值鋪平道路。

“SDP是開源的云原生解決方案,可以自動發(fā)現(xiàn)敏感數(shù)據(jù)并管理數(shù)據(jù)資產(chǎn),適合存量數(shù)據(jù)多、數(shù)據(jù)類型不好判斷這兩個典型的場景?!标悤越ū硎镜?。

提高數(shù)據(jù)可見性

數(shù)據(jù)如何充分共享永遠(yuǎn)是數(shù)據(jù)價值釋放過程中的一道難題。

因為企業(yè)通常組織架構(gòu)復(fù)雜、涉及人員眾多,并且數(shù)據(jù)根據(jù)不同階段和場景散落在企業(yè)各個數(shù)據(jù)系統(tǒng),數(shù)據(jù)安全有效的進(jìn)行共享與協(xié)作具有極高的難度。如今,數(shù)據(jù)可見已經(jīng)成為企業(yè)數(shù)據(jù)治理和釋放數(shù)據(jù)價值的基礎(chǔ)。陳曉建認(rèn)為,數(shù)據(jù)可見是企業(yè)內(nèi)不同部門、不同角色高效挖掘數(shù)據(jù)價值的前提。

因此,企業(yè)需要構(gòu)建連接數(shù)據(jù)提供者與數(shù)據(jù)消費(fèi)者的橋梁,但出于數(shù)據(jù)安全的考慮又不能無限制地將所有數(shù)據(jù)共享給所有人。通常,在數(shù)據(jù)治理與高效協(xié)同方面,集中式和聯(lián)邦式是企業(yè)中最為常見的聯(lián)眾類型。這兩種方式有著各自的優(yōu)劣勢和適應(yīng)的企業(yè)規(guī)模,且均需要多個角色的高效協(xié)同。

對此,亞馬遜云科技帶來了數(shù)據(jù)管理服務(wù)Amazon DataZone,幫助企業(yè)加速數(shù)據(jù)網(wǎng)格建設(shè)以對不同網(wǎng)格來源的數(shù)據(jù)進(jìn)行共享和治理。該服務(wù)可以讓客戶更快、更輕松地對存儲在亞馬遜云科技、客戶本地和第三方來源的數(shù)據(jù)進(jìn)行編目、發(fā)現(xiàn)、共享和治理。此外,務(wù)Amazon DataZone通過數(shù)據(jù)所有權(quán)的去中心化、聯(lián)邦式數(shù)據(jù)治理、點(diǎn)對點(diǎn)的數(shù)據(jù)共享等功能讓數(shù)據(jù)生產(chǎn)者輕松管理和控制數(shù)據(jù)訪問,讓廣大數(shù)據(jù)開發(fā)者、數(shù)據(jù)科學(xué)家、分析師和業(yè)務(wù)用戶可以快速實現(xiàn)協(xié)作分析。

“Amazon DataZone可幫助企業(yè)實現(xiàn)數(shù)據(jù)一站式管理,實現(xiàn)快速實現(xiàn)協(xié)作分析,并且大幅簡化數(shù)據(jù)治理難度。”陳曉建補(bǔ)充道。

賦能協(xié)作,激發(fā)數(shù)據(jù)價值

眾所周知,數(shù)據(jù)只有充分的流動、共享和應(yīng)用才能發(fā)揮出最大的價值。如今,除了企業(yè)自身內(nèi)部業(yè)務(wù)數(shù)據(jù)之外,產(chǎn)業(yè)上下游和合作伙伴等第三方數(shù)據(jù)的加入也成為大勢所趨

但多方數(shù)據(jù)的協(xié)作依然面臨著數(shù)據(jù)安全、數(shù)據(jù)泄露等風(fēng)險,比如有些產(chǎn)業(yè)鏈上下游是通過給合作伙伴提供數(shù)據(jù)副本的方式,雖然數(shù)據(jù)實現(xiàn)了共享,但依然面臨著很大的數(shù)據(jù)泄露風(fēng)險。因此,近年來多方計算、聯(lián)邦學(xué)習(xí)等隱私計算技術(shù)開始興起,成為企業(yè)與第三方數(shù)據(jù)實現(xiàn)數(shù)據(jù)共享與應(yīng)用的保障。

陳曉建認(rèn)為,數(shù)據(jù)協(xié)作參與方增多之后,必然會面臨著數(shù)據(jù)保護(hù)與業(yè)務(wù)價值安全之間的權(quán)衡,而多方安全合規(guī)計算就是目前最為合適的方式。尤其是生成式AI興起之后,大語言模型的訓(xùn)練更加渴望第三方數(shù)據(jù)。為此,亞馬遜云科技推出了Amazon Clean Rooms分析服務(wù),幫助企業(yè)與其合作伙伴在互相不暴露原始數(shù)據(jù)的情況下進(jìn)行數(shù)據(jù)協(xié)作,也無需在云上移動數(shù)據(jù),從而最大化數(shù)據(jù)價值。

通過Amazon Clean Rooms分析服務(wù),企業(yè)只需幾分鐘即可創(chuàng)建一個安全的數(shù)據(jù) Clean Room,創(chuàng)建協(xié)作項目實現(xiàn)數(shù)據(jù)的多方協(xié)作。此外,Amazon Clean Rooms還提供了一個密態(tài)計算的環(huán)境,數(shù)據(jù)提供方在 Clean Rooms 環(huán)境中的數(shù)據(jù)能夠以加密的形態(tài)完成數(shù)據(jù)分析操作,并將分析結(jié)果解密并返回,在數(shù)據(jù)安全得到最大保護(hù)的同時,還在協(xié)作方之間充分開發(fā)了數(shù)據(jù)價值。

“多方安全合規(guī)計算還處于發(fā)展的早期階段。目前來看,非常適合亞馬遜云科技這種云環(huán)境。全球像汽車、生命科學(xué)非??释舷掠螖?shù)據(jù)交易,并且都在使用Amazon Clean Rooms服務(wù)?!标悤越ㄑa(bǔ)充道。

此外,針對生成式AI的大語言模型所需要的海量第三方非結(jié)構(gòu)化數(shù)據(jù),亞馬遜云科技Amazon Data Exchange提供來自300多家提供商的3500多種公共數(shù)據(jù)產(chǎn)品,數(shù)據(jù)來源包括金融、天氣、地理空間、健康醫(yī)療等非常多的行業(yè)和領(lǐng)域??蛻艨梢暂p松查找、訂閱和使用所需的各種第三方數(shù)據(jù)。Amazon Data Exchange與Amazon EMR Serverless等分析服務(wù)相結(jié)合,可以大大簡化企業(yè)生成式AI應(yīng)用開發(fā)方面的數(shù)據(jù)獲取難題,加速生成式AI落地。

提升數(shù)據(jù)可操作性

不可否認(rèn),如今企業(yè)的IT環(huán)境正在變得越來越復(fù)雜。這其中,以安全環(huán)境尤為明顯。

眾所周知,安全供應(yīng)商多、產(chǎn)品類型豐富,通常一家企業(yè)往往具有多家安全供應(yīng)商和種類繁多的安全產(chǎn)品。加上企業(yè)對于安全越來越重視,直接造成了企業(yè)的安全環(huán)境走向復(fù)雜化。針對安全類的數(shù)據(jù),實現(xiàn)數(shù)據(jù)可操作,即安全日志的統(tǒng)一管理及分析,已是業(yè)界共識。

Gartner《2022 年網(wǎng)絡(luò)安全重點(diǎn)趨勢》就認(rèn)為:安全供應(yīng)商的整合排到了趨勢的第 4 位。在 2020 年有 29% 的客戶在尋求安全供應(yīng)商的整合,僅僅過了 2 年,到 2022 年這個數(shù)字就變成了 75%。

陳曉建表示,企業(yè)要想在短時間內(nèi)做到整合安全廠商,是有相當(dāng)大的挑戰(zhàn)和難度。因為,各類安全日志和安全事件的數(shù)據(jù)來自不同安全產(chǎn)品供應(yīng)商的不同產(chǎn)品,這些安全數(shù)據(jù)的整合與管理難度極大。“一個用戶可能擁有超過十家安全供應(yīng)商,安全整合是大勢所趨,需要通過更好的工具去解決安全數(shù)據(jù)問題?!标悤越ū硎镜馈?/p>

為此,亞馬遜云科技推出了Amazon Security Lake安全數(shù)據(jù)湖服務(wù),統(tǒng)一管理來自不同廠商的日志,并且讓這些日志可被用來進(jìn)行安全事件的分析。Amazon Security Lake支持包括亞馬遜云科技、安全合作伙伴和第三方分析服務(wù)提供商在內(nèi)的80多個安全數(shù)據(jù)源。

企業(yè)可將不同來源的安全數(shù)據(jù)傳入該數(shù)據(jù)湖中并轉(zhuǎn)換為符合開放網(wǎng)絡(luò)安全架構(gòu)框架(Open Cybersecurity Schema Framework,OCSF)要求的格式,從而自動收集、組合和分析這些安全數(shù)據(jù)。此外,Amazon Security Lake還與亞馬遜云科技成熟的數(shù)據(jù)分析工具集成,助力企業(yè)安全團(tuán)隊在熟悉的分析環(huán)境中實現(xiàn)更快的威脅檢測、調(diào)查和事件響應(yīng),有效解決潛在安全隱患。

“從第一天起,亞馬遜云科技就把安全作為最高優(yōu)先級。針對業(yè)務(wù)數(shù)據(jù)可識別、可見、可協(xié)作和安全數(shù)據(jù)的可操作等難題,亞馬遜云科技通過豐富的工具集和創(chuàng)新的解決方案,致力于通過數(shù)據(jù)分析與安全服務(wù)的融合幫助客戶釋放數(shù)據(jù)價值,確??蛻粼跀?shù)據(jù)安全上無后顧之憂?!标悤越ㄗ詈蟊硎镜?。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-10-08
亞馬遜云科技:釋放數(shù)據(jù)價值,安全是前提條件
亞馬遜云科技:釋放數(shù)據(jù)價值,安全是前提條件

長按掃碼 閱讀全文