123,123

Amazon SageMaker Data Wrangler 為開發(fā)人員做機(jī)器學(xué)習(xí)數(shù)據(jù)準(zhǔn)備工作提供了快捷而簡便的工具。

Amazon SageMaker Feature Store提供一個用于更新、檢索和共享機(jī)器學(xué)習(xí)特征的專用數(shù)據(jù)存儲

Amazon SageMaker Pipelines為開發(fā)人員提供了首個專為機(jī)器學(xué)習(xí)而構(gòu)建、方便易用的CI/CD(持續(xù)集成和持續(xù)交付)服務(wù)

Amazon SageMaker Clarify為開發(fā)人員提供了更多的訓(xùn)練數(shù)據(jù)可見性,以便他們能有效控制機(jī)器學(xué)習(xí)模型的偏差、并對預(yù)測作出解釋

Deep profiling for Amazon SageMaker Debugger可監(jiān)控機(jī)器學(xué)習(xí)訓(xùn)練任務(wù),幫助開發(fā)人員更快地訓(xùn)練模型

Distributed Training on Amazon SageMaker可以將大型模型的訓(xùn)練速度最高提高2倍

Amazon SageMaker Edge Manager 監(jiān)控和管理部署在邊緣設(shè)備上的機(jī)器學(xué)習(xí)模型,以確保模型正確運(yùn)行

Amazon SageMaker JumpStart提供了一個查看和檢索預(yù)訓(xùn)練模型和預(yù)構(gòu)建工作流的開發(fā)者門戶

“近日”,在亞馬遜云服務(wù)(AWS)舉辦的年度盛會——AWS re:Invent上,AWS宣布為其業(yè)界領(lǐng)先的機(jī)器學(xué)習(xí)服務(wù)Amazon SageMaker推出九項(xiàng)新的功能,使開發(fā)人員更容易自動化、規(guī)?；臉?gòu)建端到端的機(jī)器學(xué)習(xí)工作流。今天的發(fā)布匯集了多項(xiàng)強(qiáng)大的新功能,包括更易用的數(shù)據(jù)預(yù)處理、專用的特征存儲、自動化工作流、更多的訓(xùn)練數(shù)據(jù)可見性以減少數(shù)據(jù)傾斜和更好的預(yù)測解釋、大型模型的分布式訓(xùn)練速度可最多提升兩倍,以及監(jiān)控邊緣設(shè)備上的模型。要開始使用Amazon SageMaker,請?jiān)L問:https://aws.amazon.com/sagemaker。

機(jī)器學(xué)習(xí)日益成為主流,但它仍在快速發(fā)展。隨著機(jī)器學(xué)習(xí)受到廣泛關(guān)注,機(jī)器學(xué)習(xí)模型的創(chuàng)建似乎應(yīng)該很簡單,但事實(shí)并非如此。為了創(chuàng)建一個模型,開發(fā)人員需要先準(zhǔn)備數(shù)據(jù),而數(shù)據(jù)準(zhǔn)備是重度依賴人工手動工作的。然后,他們將數(shù)據(jù)可視化以進(jìn)行數(shù)據(jù)探索,選擇合適的算法和框架,訓(xùn)練模型,調(diào)整和優(yōu)化模型訓(xùn)練參數(shù),部署模型,并監(jiān)控其性能。這個過程需要不斷重復(fù),才能確保模型在一段時間內(nèi)的表現(xiàn)符合預(yù)期。在過去,只有最熟練的開發(fā)人員才能開展機(jī)器學(xué)習(xí)相關(guān)的工作。然而,Amazon SageMaker 已經(jīng)改變了這一現(xiàn)狀。Amazon SageMaker 是一項(xiàng)全托管的服務(wù),它消除了機(jī)器學(xué)習(xí)過程中每個階段的挑戰(zhàn),使開發(fā)人員和數(shù)據(jù)科學(xué)家能夠從根本上更輕松、更快速地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。數(shù)以萬計(jì)的客戶利用Amazon SageMaker加速了他們的機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)和部署,包括3M、ADP、阿斯利康、Avis、拜耳、Bundesliga、Capital One、Cerner、Chick-fil-A、Convoy、達(dá)美樂比薩、富達(dá)投資、GE醫(yī)療、Georgia-Pacific、赫斯特、iFood、iHeartMedia、摩根大通、Intuit、聯(lián)想、Lyft、國家橄欖球聯(lián)盟、Nerdwallet、T-Mobile、湯森路透、Vanguard等等。

AWS在過去一年已經(jīng)交付了50多項(xiàng)Amazon SageMaker的新功能。在此基礎(chǔ)上,今天的發(fā)布使得開發(fā)人員和數(shù)據(jù)科學(xué)家更容易準(zhǔn)備、構(gòu)建、訓(xùn)練、部署和管理機(jī)器學(xué)習(xí)模型。

AmazonSageMakerData Wrangler實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備自動化。Amazon SageMaker Data Wrangler 為機(jī)器學(xué)習(xí)數(shù)據(jù)準(zhǔn)備提供了快速、簡便的工具。機(jī)器學(xué)習(xí)的數(shù)據(jù)準(zhǔn)備是一個復(fù)雜的過程。這種復(fù)雜在于:用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)字段(也稱為特征)通常來自不同的來源,并且格式多樣。這意味著開發(fā)人員必須花費(fèi)相當(dāng)多的時間提取和規(guī)范這些數(shù)據(jù)?？蛻粢部赡芟Ｍ麑⑻卣鹘M合成復(fù)合特征,以向機(jī)器學(xué)習(xí)模型提供更多有用的輸入。例如,客戶可能希望創(chuàng)建一個復(fù)合特征來描述一組經(jīng)常消費(fèi)的客戶,結(jié)合以前購買的項(xiàng)目、消費(fèi)金額和購買頻率等特征,為他們提供會員獎勵。將數(shù)據(jù)轉(zhuǎn)化為特征的工作稱為特征工程,在構(gòu)建機(jī)器學(xué)習(xí)模型流程中要消耗開發(fā)人員大量的時間。Amazon SageMaker Data Wrangler 從根本上簡化了數(shù)據(jù)準(zhǔn)備和特征工程的工作。通過Amazon SageMaker Data Wrangler,客戶可以從各種數(shù)據(jù)存儲中選擇他們想要的數(shù)據(jù),并一鍵導(dǎo)入。Amazon SageMaker Data Wrangler 包含超過 300 個內(nèi)置的數(shù)據(jù)轉(zhuǎn)換器,可以幫助客戶在無需編寫任何代碼的情況下,對特征進(jìn)行規(guī)范化、轉(zhuǎn)換和組合。客戶可以通過在SageMaker Studio(首個用于機(jī)器學(xué)習(xí)的端到端集成開發(fā)環(huán)境)中查看這些轉(zhuǎn)換,快速預(yù)覽和檢查這些轉(zhuǎn)換是否符合預(yù)期。特征設(shè)計(jì)出來之后,Amazon SageMaker Data Wrangler會把它們保存在 Amazon SageMaker Feature Store 中,以供重復(fù)使用。

AmazonSageMakerFeatureStore存儲和管理機(jī)器學(xué)習(xí)特征。Amazon SageMaker Feature Store 提供了一個新的存儲庫,可以輕松地存儲、更新、檢索和共享用于訓(xùn)練和推理的機(jī)器學(xué)習(xí)特征。當(dāng)前,客戶可以將他們的特征保存到Amazon Simple Storage Service(S3)。如果只是簡簡單單把一組特征用于一個模型,這種做法是可行的。但實(shí)際情況是,大多數(shù)特征并不是只用于一個模型,而是被多個開發(fā)人員和數(shù)據(jù)科學(xué)家重復(fù)用于多個模型中。當(dāng)創(chuàng)建了新的特征時,開發(fā)人員也希望能夠重復(fù)使用這些特征。這樣就導(dǎo)致需要管理多個S3對象,并將變得越來越難以管理。開發(fā)人員和數(shù)據(jù)科學(xué)家試圖使用電子表格、筆記和電子郵件來解決這個問題。他們甚至要嘗試開發(fā)一個應(yīng)用程序來跟蹤管理特征,但這個工作量很大,而且容易出錯。此外,開發(fā)人員和數(shù)據(jù)科學(xué)家不僅需要使用這些相同的特征和所有可用的數(shù)據(jù)來訓(xùn)練多個模型,這個過程可能耗時長達(dá)幾個小時,而且還需要在推理時使用這些特征,這需要在幾毫秒內(nèi)返回預(yù)測結(jié)果,并且往往只使用相關(guān)特征的一個子集。例如,開發(fā)人員可能希望創(chuàng)建一個預(yù)測播放列表中下一首最佳歌曲的模型。要做到這一點(diǎn),開發(fā)人員要在數(shù)千首歌曲上訓(xùn)練模型,然后在推理過程中向模型提供最后播放的三首歌曲,以預(yù)測下一首歌曲。訓(xùn)練和推理是非常不同的使用場景。在訓(xùn)練過程中,模型可以離線、批量地訪問特征,對于推理,模型需要實(shí)時的訪問特征子集。由于機(jī)器學(xué)習(xí)模型使用一樣的特征源,并且需要保持?jǐn)?shù)據(jù)的一致性,然而這兩種不同的訪問模式,使得開發(fā)者不容易保持特征的一致性和更新的及時性。Amazon SageMaker Feature Store 解決了這一問題,它提供了一個專門構(gòu)建的特征庫,供開發(fā)人員訪問和共享特征,使開發(fā)人員和數(shù)據(jù)科學(xué)家團(tuán)隊(duì)容易協(xié)調(diào)特征的命名、組織、查找和共享。Amazon SageMaker Feature Store 集成在 Amazon SageMaker Studio 中,它可以為推理提供單毫秒級的低延遲訪問。Amazon SageMaker Feature Store 使得開發(fā)人員可以簡單方便地組織和更新用于訓(xùn)練的大批量特征,以及用于推理的小批量特征子集。這樣,就為機(jī)器學(xué)習(xí)模型提供了一致的特征視圖,降低生成模型的難度,并提供高精度的預(yù)測。

AmazonSageMakerPipelines實(shí)現(xiàn)工作流管理和自動化。Amazon SageMaker Pipelines是第一個專門為機(jī)器學(xué)習(xí)構(gòu)建的、易于使用的CI/CD(持續(xù)集成和持續(xù)交付)服務(wù)?？蛻粼谔卣鞴こ讨锌梢园l(fā)現(xiàn),機(jī)器學(xué)習(xí)包含的多個步驟都可以受益于編排和自動化。這與傳統(tǒng)的編程并無二致。在傳統(tǒng)編程中,客戶有CI/CD等工具幫助他們更快地開發(fā)和部署應(yīng)用程序。然而,目前的機(jī)器學(xué)習(xí)中很少使用CI/CD工具,因?yàn)橐礇]有這樣的工具,要么難以設(shè)置、配置和管理。借助 Amazon SageMaker Pipelines,開發(fā)人員可以定義端到端機(jī)器學(xué)習(xí)工作流的每一步。這些工作流包括數(shù)據(jù)加載步驟、用Amazon SageMaker Data Wrangler 做轉(zhuǎn)換、在 Amazon SageMaker Feature Store保存特征、訓(xùn)練配置及算法設(shè)置、調(diào)試步驟,以及優(yōu)化步驟。通過 Amazon SageMaker Pipelines,開發(fā)人員可以輕松地從 Amazon SageMaker Studio 使用相同的設(shè)置重復(fù)運(yùn)行端到端工作流,,每次都能獲得完全相同的模型,或者,他們可以定期使用新數(shù)據(jù)重新運(yùn)行工作流,更新模型。每次運(yùn)行工作流時,Amazon SageMaker Pipelines 都會記錄 Amazon SageMaker Experiments(Amazon SageMaker 的一項(xiàng)功能,用于組織和跟蹤機(jī)器學(xué)習(xí)實(shí)驗(yàn)和模型版本)中的每個步驟。這有助于開發(fā)人員可視化并進(jìn)行機(jī)器學(xué)習(xí)模型的迭代、訓(xùn)練參數(shù)和結(jié)果比較。借助 Amazon SageMaker Pipelines,工作流可以在團(tuán)隊(duì)之間共享和重復(fù)使用,既可以重新創(chuàng)建模型,也可以作為一個通過新的特征、算法或優(yōu)化改進(jìn)模型的起點(diǎn)。

使用AmazonSageMakerClarify進(jìn)行偏差檢測和模型解釋。Amazon SageMaker Clarify 在整個機(jī)器學(xué)習(xí)工作流中提供偏差檢測,使開發(fā)人員能夠在其模型中實(shí)現(xiàn)更大的公平性和更高的透明度。一旦開發(fā)人員為訓(xùn)練和推理準(zhǔn)備了數(shù)據(jù),就需要盡量確保數(shù)據(jù)沒有統(tǒng)計(jì)偏差,并且模型預(yù)測是透明的,以便可以解釋模型特征是如何預(yù)測的。如今,開發(fā)人員有時會嘗試使用開源工具檢測數(shù)據(jù)中的統(tǒng)計(jì)偏差,但這些工具需要大量的人工編程的工作,而且經(jīng)常容易出錯。借助 Amazon SageMaker Clarify,開發(fā)人員現(xiàn)在可以更輕松地檢測整個機(jī)器學(xué)習(xí)工作流中的統(tǒng)計(jì)偏差,并為其機(jī)器學(xué)習(xí)模型所做的預(yù)測提供解釋。Amazon SageMaker Clarify已集成到Amazon SageMaker Data Wrangler,它運(yùn)行了一系列基于特征數(shù)據(jù)的算法,用以識別數(shù)據(jù)準(zhǔn)備過程中的偏差,并且清晰描述可能的偏差來源及其嚴(yán)重程度。這樣,開發(fā)人員就可以采取措施來減小偏差。Amazon SageMaker Clarify還與Amazon SageMaker Experiments集成,使開發(fā)人員更容易地檢查訓(xùn)練好的模型是否存在統(tǒng)計(jì)偏差。它還詳細(xì)說明了輸入到模型中的每個特征是如何影響預(yù)測的。最后,Amazon SageMaker Clarify 與 Amazon SageMaker Model Monitor(Amazon SageMaker 的一項(xiàng)功能,可持續(xù)監(jiān)控正式使用中的機(jī)器學(xué)習(xí)模型的質(zhì)量)集成,一旦模型特征的重要性發(fā)生偏移,導(dǎo)致模型預(yù)測質(zhì)量發(fā)生改變,它就會提醒開發(fā)人員。

用Deep Profiling for AmazonSageMakerDebugger做模型訓(xùn)練剖析。Deep Profiling for Amazon SageMaker Debugger能夠自動監(jiān)控系統(tǒng)資源利用率,為訓(xùn)練瓶頸提供告警,以方便開發(fā)者更快地訓(xùn)練模型。當(dāng)前,開發(fā)人員沒有一個標(biāo)準(zhǔn)的監(jiān)控系統(tǒng)利用率的方法(例如 GPU、CPU、網(wǎng)絡(luò)吞吐量和內(nèi)存 I/O)以識別和排除訓(xùn)練作業(yè)中的瓶頸。因此,開發(fā)人員無法以最快的速度、最高的成本效益來訓(xùn)練模型。Amazon SageMaker Debugger 通過最新的 Deep Profiling功能解決了這一問題,該功能為開發(fā)人員提供了在 Amazon SageMaker Studio 中可視化剖析和監(jiān)控系統(tǒng)資源利用率的能力。這讓開發(fā)人員更容易尋根問底,減少訓(xùn)練機(jī)器學(xué)習(xí)模型的時間和成本。借助這些新功能,Amazon SageMaker Debugger 擴(kuò)大了監(jiān)控系統(tǒng)資源利用率的范圍,在 Amazon SageMaker Studio 中或通過 AWS CloudWatch 發(fā)送訓(xùn)練期間的問題告警,將使用情況關(guān)聯(lián)到訓(xùn)練作業(yè)中的不同階段,或者訓(xùn)練期間的特定時間點(diǎn)(如訓(xùn)練作業(yè)開始后第28 分鐘)。Amazon SageMaker Debugger 還可以根據(jù)告警觸發(fā)行動(例如,當(dāng)檢測到 GPU 使用情況不正常時,即停止訓(xùn)練作業(yè))。Amazon SageMaker Debugger Deep Profiling 可以用于PyTorch、Apache MXNet 和 TensorFlow的訓(xùn)練任務(wù),自動收集必要的系統(tǒng)和訓(xùn)練指標(biāo),無需在訓(xùn)練腳本中更改任何代碼。這允許開發(fā)人員在Amazon SageMaker Studio中可視化其訓(xùn)練期間的系統(tǒng)資源使用情況。

用Distributed Training onAmazonSageMaker縮短訓(xùn)練時間。Distributed Training on Amazon SageMaker使得訓(xùn)練大型復(fù)雜深度學(xué)習(xí)模型的速度比當(dāng)前的方法快兩倍。當(dāng)前,高級的機(jī)器學(xué)習(xí)使用場景,例如智能助手的自然語言處理、自動駕駛車輛的對象檢測和分類,以及大規(guī)模內(nèi)容審核的圖像分類,需要越來越大的數(shù)據(jù)集和更多的GPU (圖形處理單元 ) 內(nèi)存進(jìn)行訓(xùn)練。然而,其中一些模型太大,無法容納在單個GPU提供的內(nèi)存中?？蛻艨梢試L試在多個GPU間拆分模型,但尋找拆分模型的最佳方式和調(diào)整訓(xùn)練代碼往往需要數(shù)周的繁瑣實(shí)驗(yàn)。為了克服這些挑戰(zhàn),Distributed Training on Amazon SageMaker提供了兩種分布式訓(xùn)練功能,使開發(fā)人員能夠在不增加成本的情況下,將大型模型的訓(xùn)練速度提高兩倍。Distributed Training與 Amazon SageMake的數(shù)據(jù)并行引擎一起,通過在多個 GPU間自動分割數(shù)據(jù),將訓(xùn)練作業(yè)從一個 GPU 擴(kuò)展到數(shù)百個或數(shù)千個 GPU,將訓(xùn)練時間縮短多達(dá) 40%。之所以能夠縮短訓(xùn)練時間,是因?yàn)锳mazon SageMaker的數(shù)據(jù)并行引擎使用了專門的算法來管理GPU,充分利用AWS基礎(chǔ)設(shè)施,實(shí)現(xiàn)最佳同步,具有近乎線性的擴(kuò)展效率。Distributed Training 與Amazon SageMaker 模型并行引擎一起,可以自動剖析和識別分割模型的最佳方式,在多個 GPU 上高效分割具有數(shù)十億參數(shù)的大型復(fù)雜模型。它們通過使用圖分區(qū)算法來完成這樣工作,優(yōu)化了平衡計(jì)算,最大限度地減少GPU之間的通信,從而最少化代碼重構(gòu),減少GPU內(nèi)存限制造成的錯誤。

使用AmazonSageMakerEdge Manager管理邊緣設(shè)備模型。Amazon SageMaker Edge Manager 可以幫助開發(fā)人員優(yōu)化、保護(hù)、監(jiān)控和維護(hù)部署在邊緣設(shè)備集群上的機(jī)器學(xué)習(xí)模型。目前,客戶使用Amazon SageMaker Neo為邊緣設(shè)備優(yōu)化模型,這使得模型的運(yùn)行速度可以提高到多達(dá)兩倍,且內(nèi)存占用率不到十分之一,準(zhǔn)確性也沒有損失。然而,在邊緣設(shè)備上部署后,客戶仍然需要管理和監(jiān)控模型,以確保它們?nèi)匀灰愿呔冗\(yùn)行。Amazon SageMaker Edge Manager 可以優(yōu)化模型,使其在目標(biāo)設(shè)備上運(yùn)行得更快,并為邊緣設(shè)備管理模型,以便客戶可以在邊緣設(shè)備集群中準(zhǔn)備、運(yùn)行、監(jiān)控和更新機(jī)器學(xué)習(xí)模型?？蛻艨梢允褂肁mazon SageMaker Edge Manager對其模型進(jìn)行加密簽名,從邊緣設(shè)備上傳預(yù)測數(shù)據(jù)到 Amazon SageMaker以進(jìn)行監(jiān)控和分析,并在 Amazon SageMaker 控制臺中查看報表,來跟蹤和可視化模型的運(yùn)行狀況。Amazon SageMaker Edge Manager 擴(kuò)展了以前只能在云端使用的功能,它可以從邊緣設(shè)備中采樣數(shù)據(jù),將其發(fā)送到 Amazon SageMaker Model Monitor進(jìn)行分析,當(dāng)模型的準(zhǔn)確性隨著時間的推移而下降時,重新訓(xùn)練模型以便開發(fā)人員不斷提高模型的質(zhì)量。

通過AmazonSageMakerJumpStart開啟機(jī)器學(xué)習(xí)之旅。Amazon SageMaker JumpStart 為開發(fā)人員提供了一個易于使用、可搜索的界面,用于查找同類最佳解決方案、算法和notebook示例。當(dāng)前,缺乏機(jī)器學(xué)習(xí)經(jīng)驗(yàn)的客戶很難開始機(jī)器學(xué)習(xí)部署,而高級的開發(fā)人員發(fā)現(xiàn)很難將機(jī)器學(xué)習(xí)應(yīng)用到所有應(yīng)用場景。通過Amazon SageMaker JumpStart,客戶現(xiàn)在可以快速找到針對其機(jī)器學(xué)習(xí)場景的相關(guān)信息。新接觸機(jī)器學(xué)習(xí)的開發(fā)人員可以從多個完整的端到端機(jī)器學(xué)習(xí)解決方案中進(jìn)行選擇(例如欺詐檢測、客戶流失預(yù)測或時序預(yù)測),并且可以直接部署到Amazon SageMaker Studio環(huán)境中。有經(jīng)驗(yàn)的用戶則可以從一百多個機(jī)器學(xué)習(xí)模型中選擇,快速開始模型構(gòu)建和訓(xùn)練。

AWS負(fù)責(zé)亞馬遜機(jī)器學(xué)習(xí)的副總裁Swami Sivasubramanian表示:"成千上萬的開發(fā)人員和數(shù)據(jù)科學(xué)家已經(jīng)使用我們業(yè)界領(lǐng)先的機(jī)器學(xué)習(xí)服務(wù)Amazon SageMaker,消除了他們在構(gòu)建、訓(xùn)練和部署定制化機(jī)器學(xué)習(xí)模型時的障礙。擁有SageMaker這樣一個廣泛采用的服務(wù),最大的好處就是受益于很多客戶的建議,為我們的下一套產(chǎn)品的交付提供了動力。今天,我們宣布為Amazon SageMaker提供一套工具,使開發(fā)人員更容易構(gòu)建端到端機(jī)器學(xué)習(xí)流程,準(zhǔn)備、構(gòu)建、訓(xùn)練、解釋、檢查、監(jiān)控、調(diào)試和運(yùn)行定制化機(jī)器學(xué)習(xí)模型,提供更高的可視性、可解釋性和大規(guī)模的自動化。"

3M公司在全球70個國家運(yùn)營,并在200個國家開展銷售業(yè)務(wù),公司創(chuàng)造的技術(shù)和產(chǎn)品,正在推動著每一家公司的發(fā)展,改善每一個家庭的日常生活。"3M的成功源于我們具有企業(yè)家精神的研究人員和我們對科學(xué)的持續(xù)關(guān)注。我們推進(jìn)產(chǎn)品科學(xué)化的一種方式是在AWS上使用機(jī)器學(xué)習(xí)技術(shù)。"3M企業(yè)系統(tǒng)研究實(shí)驗(yàn)室技術(shù)總監(jiān)David Frazee說。"利用機(jī)器學(xué)習(xí),3M正在改進(jìn)砂紙這樣久經(jīng)考驗(yàn)的產(chǎn)品,并推動其它一些領(lǐng)域包括醫(yī)療保健在內(nèi)的創(chuàng)新。隨著我們計(jì)劃將機(jī)器學(xué)習(xí)擴(kuò)展到3M的更多領(lǐng)域,我們的數(shù)據(jù)和模型快速增長,每年翻倍。我們對Amazon SageMaker的新功能充滿熱情,因?yàn)樗鼈儗椭覀償U(kuò)大規(guī)模。Amazon SageMaker Data Wrangler 使得為模型訓(xùn)練來準(zhǔn)備數(shù)據(jù)變得更容易,Amazon SageMaker Feature Store 使得我們不需要重復(fù)創(chuàng)建相同的模型特征。最后,Amazon SageMaker Pipelines 可以幫助我們將數(shù)據(jù)準(zhǔn)備、模型構(gòu)建和模型部署,變成自動化的端到端工作流,加速模型上生產(chǎn)的時間。我們的研究人員期待著在3M公司利用這些工具,提高科學(xué)創(chuàng)新速度。"

德勤正在幫助全球各地的組織轉(zhuǎn)型。德勤不斷演進(jìn)其工作方式和看待市場挑戰(zhàn)的方式,不斷為客戶和社區(qū)提供可衡量、可持續(xù)的成果。德勤AI生態(tài)系統(tǒng)和平臺負(fù)責(zé)人Frank Farrall表示:"Amazon SageMaker Data Wrangler提供了豐富的數(shù)據(jù)轉(zhuǎn)換工具,滿足了我們數(shù)據(jù)準(zhǔn)備的需求,縮短了新產(chǎn)品上市的時間。反過來,我們的客戶也受益于我們規(guī)模化部署的速度,使我們能夠在幾天內(nèi)、而不是幾個月內(nèi),提供可衡量、可持續(xù)的結(jié)果,滿足客戶需求。"

英威達(dá)自2004年起成為Koch Industries的子公司,為市場提供尼龍6,6的專有成分,擁有STAINMASTER、CORDURA和ANTRON等的知名品牌。它是全球最大的化學(xué)中間體、聚合物和纖維的綜合生產(chǎn)商之一。"在英威達(dá),我們以轉(zhuǎn)型為動力,努力開發(fā)出惠及全球客戶的產(chǎn)品和技術(shù)。"英威達(dá)首席數(shù)據(jù)科學(xué)家Caleb Wilkinson表示:"我們認(rèn)為機(jī)器學(xué)習(xí)是改善客戶體驗(yàn)的一種方式。但面對數(shù)億條記錄的數(shù)據(jù)集,我們需要一個解決方案來幫助我們準(zhǔn)備數(shù)據(jù),大規(guī)模地開發(fā)、部署和管理機(jī)器學(xué)習(xí)模型。為了加快這些流程,我們與 AWS 團(tuán)隊(duì)攜手開發(fā)了一些新特征。通過Amazon SageMaker Data Wrangler,我們現(xiàn)在可以交互式地選擇、清理、探索和有效地理解我們的數(shù)據(jù),使我們的數(shù)據(jù)科學(xué)團(tuán)隊(duì)有能力創(chuàng)建特征工程管道,可以毫不費(fèi)力地?cái)U(kuò)展到跨越數(shù)億條記錄的數(shù)據(jù)集。我們還可以使用 Amazon SageMaker Pipelines 輕松地大規(guī)模自動化和管理機(jī)器學(xué)習(xí)工作流,這樣我們可以輕松地將機(jī)器學(xué)習(xí)工作流的各個步驟連接在一起。結(jié)合Amazon SageMaker Data Wrangler和Amazon SageMaker Pipelines,我們可以更快地運(yùn)行機(jī)器學(xué)習(xí)工作流。"

Snowflake Data Cloud打破了阻礙不同規(guī)模企業(yè)從數(shù)據(jù)中釋放真正價值的障礙。Snowflake產(chǎn)品高級副總裁Christian Kleinerman說:"我們的企業(yè)客戶面臨的最大挑戰(zhàn)之一是為機(jī)器學(xué)習(xí)項(xiàng)目準(zhǔn)備數(shù)據(jù)。我們對Amazon SageMaker Data Wrangler感到很興奮,它使得企業(yè)為機(jī)器學(xué)習(xí)匯總和準(zhǔn)備數(shù)據(jù)變得更加容易。隨著Snowflake作為數(shù)據(jù)源加入Amazon SageMaker Data Wrangler,我們共同的客戶很快就能利用Snowflake集成的平臺能力,以及Amazon SageMaker的交互式數(shù)據(jù)準(zhǔn)備和機(jī)器學(xué)習(xí)能力?？蛻魧⒛軌虮纫郧案斓貜脑紨?shù)據(jù)中獲得機(jī)器學(xué)習(xí)模型和見解。"

Databricks成立于2013年,由Apache Spark™、Delta Lake和MLflow的初創(chuàng)者創(chuàng)立。它將數(shù)據(jù)工程、數(shù)據(jù)科學(xué)和數(shù)據(jù)分析匯集在一個開放、統(tǒng)一的平臺上,使數(shù)據(jù)團(tuán)隊(duì)能夠更快地進(jìn)行協(xié)作和創(chuàng)新。"在Databricks,我們致力于將數(shù)據(jù)工程和科學(xué),與數(shù)據(jù)分析結(jié)合在一起,以便數(shù)據(jù)團(tuán)隊(duì)能夠更快地協(xié)作和創(chuàng)新,"Databricks產(chǎn)品高級副總裁Adam Conway說。"我們期待著在2021年繼續(xù)與AWS合作,特別是我們的客戶可以無縫的體驗(yàn)到Amazon SageMaker Data Wrangler。通過這種合作關(guān)系,我們的客戶可以利用Delta Lake與Amazon SageMaker來準(zhǔn)備訓(xùn)練數(shù)據(jù),以創(chuàng)建最準(zhǔn)確的機(jī)器學(xué)習(xí)模型。"

MongoDB Atlas是MongoDB的完全托管服務(wù),MongoDB是一種流行的數(shù)據(jù)庫,旨在幫助團(tuán)隊(duì)快速建立、擴(kuò)展和迭代。"我們MongoDB的使命是,讓數(shù)據(jù)令人驚嘆地易于操作,釋放每個人的天賦。MongoDB Atlas運(yùn)行著超過150萬個數(shù)據(jù)庫集群,為客戶的關(guān)鍵應(yīng)用提供動力;我們希望根據(jù)這些應(yīng)用產(chǎn)生的數(shù)據(jù),輕松構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。"MongoDB首席技術(shù)官M(fèi)ark Porter說。"我們很高興,我們的客戶現(xiàn)在可以使用Amazon SageMaker Data Wrangler,為機(jī)器學(xué)習(xí)采集和準(zhǔn)備數(shù)據(jù)的環(huán)節(jié)提供一種更快的、可視化的方式。在即將到來的2021年,我們的客戶很快能夠在Amazon SageMaker Data Wrangler中查詢、分析Amazon S3和MongoDB Atlas中的數(shù)據(jù),使他們能夠更快地從數(shù)據(jù)中獲得更多價值。"

Intuit是一家使命驅(qū)動的全球財(cái)務(wù)平臺公司,創(chuàng)造了引以為豪的產(chǎn)品TurboTax、QuickBooks和Mint。"我們于2017年選擇在AWS上構(gòu)建Intuit新的機(jī)器學(xué)習(xí)平臺,將Amazon SageMaker在模型開發(fā)、訓(xùn)練和托管方面的強(qiáng)大功能,與Intuit自身在編排和特征工程方面的能力相結(jié)合。"Intuit數(shù)據(jù)平臺工程副總裁Mammad Zadeh表示。"因此,我們大幅縮短了模型開發(fā)的生命周期,能夠以非?？斓乃俣?將AI功能推進(jìn)到我們的TurboTax、QuickBooks和Mint產(chǎn)品中。這在過去需要整整六個月的時間,而現(xiàn)在只需要不到一周的時間,在Amazon SageMaker Feature Store發(fā)布之前,我們與AWS進(jìn)行了密切的協(xié)作,我們?yōu)槿泄芴卣鲙斓那熬案械脚d奮,這樣我們就不再需要在整個組織中維護(hù)多個特征庫。我們的數(shù)據(jù)科學(xué)家將能夠從一個中央特征庫中使用現(xiàn)有的特征,并且推動各團(tuán)隊(duì)和模型之間特征的標(biāo)準(zhǔn)化和重用。"

Climate Corporation是拜耳的子公司,也是利用數(shù)字工具提高農(nóng)民生產(chǎn)力、為全球農(nóng)民帶來數(shù)字創(chuàng)新的行業(yè)領(lǐng)導(dǎo)者。Climate致力于幫助農(nóng)民以前所未有的方式了解他們的田地,從農(nóng)業(yè)數(shù)據(jù)中獲得有影響力的建議。"在Climate,我們相信通過為世界上的農(nóng)民提供準(zhǔn)確的信息,做出數(shù)據(jù)驅(qū)動的決策,可以最大化他們在每一畝土地上的回報,"Climate數(shù)據(jù)和分析副總裁Daniel McCaffrey說。"為了實(shí)現(xiàn)這一目標(biāo),我們投資了諸如機(jī)器學(xué)習(xí)工具之類的技術(shù),以使用稱為特征的可測量實(shí)體(例如種植者的田間產(chǎn)量)來構(gòu)建模型。有了Amazon SageMaker Feature Store,我們可以通過集中的特征庫加速機(jī)器學(xué)習(xí)模型的開發(fā),多個團(tuán)隊(duì)都可以輕松訪問和重復(fù)使用這些特征。Amazon SageMaker Feature Store 可讓我們通過在線特征庫實(shí)時訪問特征,或定期訪問離線特征庫,以滿足不同的使用場景。通過Amazon SageMaker Feature Store,我們可以更快地開發(fā)機(jī)器學(xué)習(xí)模型。"

DeNA是日本領(lǐng)先的移動和在線服務(wù)提供商,提供游戲、電子商務(wù)和娛樂內(nèi)容發(fā)行。"在DeNA,我們的使命是利用人工智能和機(jī)器學(xué)習(xí)為客戶帶來影響和愉悅。提供基于價值的服務(wù)是我們的首要目標(biāo),我們希望確保我們的業(yè)務(wù)和服務(wù)為實(shí)現(xiàn)這一目標(biāo)做好準(zhǔn)備。"DeNA人工智能系統(tǒng)總經(jīng)理山田健信說。"我們的關(guān)鍵舉措之一是增強(qiáng)我們在人工智能和機(jī)器學(xué)習(xí)方面的能力。Amazon SageMaker提供廣泛的功能來訓(xùn)練和部署精確的模型,幫助我們在眾多業(yè)務(wù)部署機(jī)器學(xué)習(xí)。為我們的工程團(tuán)隊(duì)提供方便易用的數(shù)據(jù)準(zhǔn)備并是我們關(guān)注的領(lǐng)域。有了Amazon SageMaker Data Wrangler,我們可以在不需要額外編寫代碼的情況下,利用豐富的轉(zhuǎn)換工具套件一站式解決問題。隨著我們在數(shù)據(jù)準(zhǔn)備方面變得更加高效,我們也希望確保我們不同業(yè)務(wù)團(tuán)隊(duì)在為應(yīng)用程序構(gòu)建特征時避免重復(fù)勞動。我們希望在整個組織中探索和復(fù)用特征,Amazon SageMaker Feature Store 幫助我們以簡單有效的方式,為不同的應(yīng)用程序復(fù)用特征。Amazon SageMaker Feature Store 還幫助我們維護(hù)標(biāo)準(zhǔn)的特征定義,在我們訓(xùn)練模型并將其部署到實(shí)際應(yīng)用時,保持特征的一致性。借助Amazon SageMaker的這些新特性,我們可以更快地訓(xùn)練和部署機(jī)器學(xué)習(xí)模型,讓我們繼續(xù)不斷創(chuàng)新,以最佳服務(wù)為客戶帶來愉悅。"

iFood是一家在線食品配送網(wǎng)站,是拉丁美洲最大的食品配送公司之一,為消費(fèi)者提供優(yōu)質(zhì)服務(wù)。"在iFood,我們力求使用機(jī)器學(xué)習(xí)等技術(shù),為客戶提供使其滿意的服務(wù)。"iFood首席數(shù)據(jù)科學(xué)家Sandor Caetano說。"我們一直在使用Amazon SageMaker來進(jìn)行機(jī)器學(xué)習(xí)任務(wù),在整個業(yè)務(wù)中構(gòu)建高質(zhì)量的應(yīng)用程序。我們進(jìn)一步擴(kuò)展機(jī)器學(xué)習(xí)工作的重要內(nèi)容,就是構(gòu)建一個完整而無縫的工作流,并在其中開發(fā)、訓(xùn)練和部署模型。Amazon SageMaker Pipelines 可幫助我們快速構(gòu)建多個可擴(kuò)展的自動化機(jī)器學(xué)習(xí)工作流,使我們能夠輕松有效地部署和管理模型,使我們的開發(fā)周期更加高效。我們將進(jìn)一步強(qiáng)化我們在人工智能和機(jī)器學(xué)習(xí)技術(shù)的領(lǐng)先地位,通過使用Amazon SageMaker所有的新功能,提供卓越的客戶服務(wù)和效率。"

DFL Deutsche Fußball Liga是德國頂級足球聯(lián)賽德甲和德乙的組織者和營銷者,于2020年1月指定AWS為其官方技術(shù)供應(yīng)商,通過由AWS提供技術(shù)支持的Bundesliga Match Facts (德甲比賽事實(shí)),為全球球迷和電視轉(zhuǎn)播商帶來先進(jìn)的體育分析。"Amazon SageMaker Clarify與德甲比賽事實(shí)數(shù)字平臺的其它部分無縫集成,我們長期戰(zhàn)略的關(guān)鍵部分是在Amazon SageMaker上實(shí)現(xiàn)機(jī)器學(xué)習(xí)工作流標(biāo)準(zhǔn)化。"DFL集團(tuán)數(shù)字創(chuàng)新執(zhí)行副總裁Andreas Heyden表示。"通過使用AWS的機(jī)器學(xué)習(xí)等創(chuàng)新技術(shù),我們提供了更深入的見解,讓球迷更好地理解球場上瞬間,德甲比賽事實(shí)使觀眾能夠更深入地了解每場比賽中球員的關(guān)鍵決定。"

CS DISCO是一家SaaS供應(yīng)商,提供自動化解決方案簡化各種法律任務(wù)。"在CS DISCO,我們已經(jīng)通過我們用于電子發(fā)現(xiàn)的DISCO AI平臺,徹底改變了審查法律證據(jù)的方式,"CS DISCO首席數(shù)據(jù)科學(xué)家Alan Lockett說。"我們一直在努力加快我們高級深度學(xué)習(xí)模型的訓(xùn)練速度。我們與AWS的Amazon SageMaker團(tuán)隊(duì)協(xié)作,利用分布式訓(xùn)練等技術(shù)加速我們的AI應(yīng)用場景。"

Turbine是一家以模擬技術(shù)為驅(qū)動的藥物研發(fā)公司,為患者提供靶向癌癥療法。"我們基于專有的網(wǎng)絡(luò)架構(gòu)使用機(jī)器學(xué)習(xí)來訓(xùn)練我們的生物信息學(xué)人類細(xì)胞模型,稱為Simulated Cell™。通過準(zhǔn)確預(yù)測分子水平上的各種干預(yù)措施,Simulated Cell™幫助我們發(fā)現(xiàn)新的癌癥藥物,為現(xiàn)有療法尋找組合方案,"Turbine的CTO Kristóf Szalay說。"我們對細(xì)胞模擬的訓(xùn)練是不斷迭代的,但在一臺機(jī)器上,每次訓(xùn)練都需要幾天時間,阻礙了我們快速迭代新想法的需求。我們對Amazon SageMaker上的分布式訓(xùn)練感到非常興奮,它能將我們的訓(xùn)練時間減少90%,并幫助我們專注于主要任務(wù),即為細(xì)胞模型訓(xùn)練編寫最優(yōu)的代碼。Amazon SageMaker最終使我們能夠更高效地完成我們的主要任務(wù):為患者識別和開發(fā)新型癌癥藥物。"

Latent Space是一家致力于構(gòu)建全球首個完全AI渲染的3D游戲引擎的創(chuàng)業(yè)公司。"在Latent Space,我們正在打造一個基于神經(jīng)渲染的游戲引擎,任何人都可以快速的進(jìn)行創(chuàng)作。在高級語言建模的推動下,我們正在努力結(jié)合對文本和圖像的語義理解,以確定生成的內(nèi)容。"Latent Space的聯(lián)合創(chuàng)始人兼首席科學(xué)官Sara Jane說。"我們目前的重點(diǎn)是利用信息檢索,加強(qiáng)大規(guī)模的模型訓(xùn)練,為此我們有復(fù)雜的機(jī)器學(xué)習(xí)流程。這種設(shè)置為分布式訓(xùn)練帶來了挑戰(zhàn),因?yàn)橛卸鄠€數(shù)據(jù)源,以及多個模型同時進(jìn)行訓(xùn)練。因此,我們正在利用Amazon SageMaker的分布式訓(xùn)練功能,高效地?cái)U(kuò)展大型生成模型的訓(xùn)練。"

聯(lián)想是全球最大的個人電腦制造商。聯(lián)想設(shè)計(jì)和制造的設(shè)備包括記事本電腦、平板電腦、智能手機(jī)和各種智能物聯(lián)網(wǎng)設(shè)備。"在聯(lián)想,我們不僅僅是一家硬件供應(yīng)商,還致力于成為客戶值得信賴的合作伙伴,改變客戶使用設(shè)備的體驗(yàn),實(shí)現(xiàn)客戶的業(yè)務(wù)目標(biāo)。聯(lián)想Device Intelligence就是我們使用Amazon SageMaker來增強(qiáng)機(jī)器學(xué)習(xí)能力的一個很好的例證。"聯(lián)想個人電腦和智能設(shè)備部門云與軟件副總裁Igor Bergman說。"通過聯(lián)想Device Intelligence,IT管理員可以主動診斷個人電腦問題,提前預(yù)測潛在的系統(tǒng)故障,減少宕機(jī)時間,提高員工的工作效率。結(jié)合Amazon SageMaker Neo,我們已經(jīng)實(shí)質(zhì)性的提高了設(shè)備預(yù)測模型的效果,從而促使我們在未來幾周內(nèi)進(jìn)一步采用Amazon SageMaker Edge Manager。Amazon SageMaker Edge Manager 將有助于消除模型部署后進(jìn)行優(yōu)化、監(jiān)控和持續(xù)改進(jìn)所需的人工工作?；诖?預(yù)計(jì)我們的模型將比其它同類機(jī)器學(xué)習(xí)平臺運(yùn)行得更快,消耗的內(nèi)存更少。隨著我們將人工智能擴(kuò)展到聯(lián)想整個服務(wù)組合中的新應(yīng)用,我們將繼續(xù)采用高性能的機(jī)器學(xué)習(xí)管道,在云端和數(shù)百萬邊緣設(shè)備上靈活擴(kuò)展。這正是我們選擇Amazon SageMaker平臺的原因。憑借其豐富的從邊緣到云端和CI/CD工作流的能力,我們可以有效地將我們的機(jī)器學(xué)習(xí)模型帶入任何設(shè)備工作流,從而大大提高生產(chǎn)力。"

Basler AG是一家領(lǐng)先的高品質(zhì)數(shù)碼相機(jī)及配件制造商,其產(chǎn)品適用于工業(yè)、醫(yī)療、交通和其它各種領(lǐng)域。"Basler AG為各個行業(yè)提供智能計(jì)算機(jī)視覺解決方案,包括制造、醫(yī)療和零售應(yīng)用。我們很高興通過Amazon SageMaker Edge Manager實(shí)現(xiàn)的新功能,擴(kuò)展我們的軟件產(chǎn)品,"Basler軟件解決方案主管Mark Hebbel說。"為了確保我們機(jī)器學(xué)習(xí)解決方案的性能和可靠性,我們需要一個可擴(kuò)展的、邊云結(jié)合的MLOps工具,使我們能夠持續(xù)監(jiān)控、維護(hù)和改進(jìn)邊緣設(shè)備上的機(jī)器學(xué)習(xí)模型。Amazon SageMaker Edge Manager 允許我們在邊緣自動采樣數(shù)據(jù),將其安全地發(fā)送到云端,在部署后持續(xù)監(jiān)控每個設(shè)備上每個模型的質(zhì)量。這使我們能夠在全球范圍內(nèi)遠(yuǎn)程監(jiān)控、改進(jìn)和更新邊緣設(shè)備上的模型,同時也節(jié)省了我們和客戶的時間和成本。"

Mission Automate幫助他們?nèi)虻目蛻粼O(shè)計(jì)軟件解決方案。"我們不斷尋找新的解決方案為客戶提供最優(yōu)質(zhì)的軟件,但作為一個小型組織,我們沒有像其它組織一樣有細(xì)分專業(yè)領(lǐng)域的能力,"Mission Automate的首席執(zhí)行官Alex Panait說。"Amazon SageMaker JumpStart現(xiàn)在為我們提供了更快地開始使用機(jī)器學(xué)習(xí)的方法,包括我們可以在自己的工作流中使用的新技術(shù)、以增加我們的服務(wù)產(chǎn)品、并且降低成本。從流行的模型庫中選擇機(jī)器學(xué)習(xí)模型和算法,使我們能夠快速訓(xùn)練定制的機(jī)器學(xué)習(xí)模型,幫助我們的客戶更快地進(jìn)入市場。得益于Amazon SageMaker JumpStart,我們能夠在幾天內(nèi)推出機(jī)器學(xué)習(xí)解決方案,更快、更可靠地滿足機(jī)器學(xué)習(xí)預(yù)測需求。"

MyCase提供了一款功能強(qiáng)大的法律業(yè)務(wù)管理軟件,幫助律師事務(wù)所從任何地方高效運(yùn)行,提供卓越的客戶體驗(yàn),輕松跟蹤事務(wù)所的業(yè)績。"我們有幾個業(yè)務(wù)和產(chǎn)品元素可以通過機(jī)器學(xué)習(xí)來改進(jìn),"MyCase的軟件工程師Gus Nguyen說。"Amazon SageMaker JumpStart使我們能夠一鍵開啟端到端解決方案,獲取一系列notebooks,幫助我們更深入地了解客戶,并通過預(yù)測更好地滿足他們的需求。通過Amazon SageMaker JumpStart,讓我們可以有更高的起點(diǎn),使得我們可以把為自己的使用場景部署機(jī)器學(xué)習(xí)解決方案從三到四個月縮短到四到六周內(nèi)。"

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

AWS發(fā)布九項(xiàng)Amazon SageMaker新功能