AWS發(fā)布九項Amazon SageMaker新功能

Amazon SageMaker Data Wrangler 為開發(fā)人員做機器學習數(shù)據(jù)準備工作提供了快捷而簡便的工具。

Amazon SageMaker Feature Store提供一個用于更新、檢索和共享機器學習特征的專用數(shù)據(jù)存儲

Amazon SageMaker Pipelines為開發(fā)人員提供了首個專為機器學習而構建、方便易用的CI/CD(持續(xù)集成和持續(xù)交付)服務

Amazon SageMaker Clarify為開發(fā)人員提供了更多的訓練數(shù)據(jù)可見性,以便他們能有效控制機器學習模型的偏差、并對預測作出解釋

Deep profiling for Amazon SageMaker Debugger可監(jiān)控機器學習訓練任務,幫助開發(fā)人員更快地訓練模型

Distributed Training on Amazon SageMaker可以將大型模型的訓練速度最高提高2倍

Amazon SageMaker Edge Manager 監(jiān)控和管理部署在邊緣設備上的機器學習模型,以確保模型正確運行

Amazon SageMaker JumpStart提供了一個查看和檢索預訓練模型和預構建工作流的開發(fā)者門戶

近日,在亞馬遜云服務(AWS)舉辦的年度盛會——AWS re:Invent上,AWS宣布為其業(yè)界領先的機器學習服務Amazon SageMaker推出九項新的功能,使開發(fā)人員更容易自動化、規(guī)?;臉嫿ǘ说蕉说臋C器學習工作流。今天的發(fā)布匯集了多項強大的新功能,包括更易用的數(shù)據(jù)預處理、專用的特征存儲、自動化工作流、更多的訓練數(shù)據(jù)可見性以減少數(shù)據(jù)傾斜和更好的預測解釋、大型模型的分布式訓練速度可最多提升兩倍,以及監(jiān)控邊緣設備上的模型。要開始使用Amazon SageMaker,請訪問:https://aws.amazon.com/sagemaker。

機器學習日益成為主流,但它仍在快速發(fā)展。隨著機器學習受到廣泛關注,機器學習模型的創(chuàng)建似乎應該很簡單,但事實并非如此。為了創(chuàng)建一個模型,開發(fā)人員需要先準備數(shù)據(jù),而數(shù)據(jù)準備是重度依賴人工手動工作的。然后,他們將數(shù)據(jù)可視化以進行數(shù)據(jù)探索,選擇合適的算法和框架,訓練模型,調整和優(yōu)化模型訓練參數(shù),部署模型,并監(jiān)控其性能。這個過程需要不斷重復,才能確保模型在一段時間內的表現(xiàn)符合預期。在過去,只有最熟練的開發(fā)人員才能開展機器學習相關的工作。然而,Amazon SageMaker 已經(jīng)改變了這一現(xiàn)狀。Amazon SageMaker 是一項全托管的服務,它消除了機器學習過程中每個階段的挑戰(zhàn),使開發(fā)人員和數(shù)據(jù)科學家能夠從根本上更輕松、更快速地構建、訓練和部署機器學習模型。數(shù)以萬計的客戶利用Amazon SageMaker加速了他們的機器學習應用的開發(fā)和部署,包括3M、ADP、阿斯利康、Avis、拜耳、Bundesliga、Capital One、Cerner、Chick-fil-A、Convoy、達美樂比薩、富達投資、GE醫(yī)療、Georgia-Pacific、赫斯特、iFood、iHeartMedia、摩根大通、Intuit、聯(lián)想、Lyft、國家橄欖球聯(lián)盟、Nerdwallet、T-Mobile、湯森路透、Vanguard等等。

AWS在過去一年已經(jīng)交付了50多項Amazon SageMaker的新功能。在此基礎上,今天的發(fā)布使得開發(fā)人員和數(shù)據(jù)科學家更容易準備、構建、訓練、部署和管理機器學習模型。

AmazonSageMakerData Wrangler實現(xiàn)數(shù)據(jù)準備自動化。Amazon SageMaker Data Wrangler 為機器學習數(shù)據(jù)準備提供了快速、簡便的工具。機器學習的數(shù)據(jù)準備是一個復雜的過程。這種復雜在于:用于訓練機器學習模型的數(shù)據(jù)字段(也稱為特征)通常來自不同的來源,并且格式多樣。這意味著開發(fā)人員必須花費相當多的時間提取和規(guī)范這些數(shù)據(jù)。客戶也可能希望將特征組合成復合特征,以向機器學習模型提供更多有用的輸入。例如,客戶可能希望創(chuàng)建一個復合特征來描述一組經(jīng)常消費的客戶,結合以前購買的項目、消費金額和購買頻率等特征,為他們提供會員獎勵。將數(shù)據(jù)轉化為特征的工作稱為特征工程,在構建機器學習模型流程中要消耗開發(fā)人員大量的時間。Amazon SageMaker Data Wrangler 從根本上簡化了數(shù)據(jù)準備和特征工程的工作。通過Amazon SageMaker Data Wrangler,客戶可以從各種數(shù)據(jù)存儲中選擇他們想要的數(shù)據(jù),并一鍵導入。Amazon SageMaker Data Wrangler 包含超過 300 個內置的數(shù)據(jù)轉換器,可以幫助客戶在無需編寫任何代碼的情況下,對特征進行規(guī)范化、轉換和組合??蛻艨梢酝ㄟ^在SageMaker Studio(首個用于機器學習的端到端集成開發(fā)環(huán)境)中查看這些轉換,快速預覽和檢查這些轉換是否符合預期。特征設計出來之后,Amazon SageMaker Data Wrangler會把它們保存在 Amazon SageMaker Feature Store 中,以供重復使用。

AmazonSageMakerFeatureStore存儲和管理機器學習特征。Amazon SageMaker Feature Store 提供了一個新的存儲庫,可以輕松地存儲、更新、檢索和共享用于訓練和推理的機器學習特征。當前,客戶可以將他們的特征保存到Amazon Simple Storage Service(S3)。如果只是簡簡單單把一組特征用于一個模型,這種做法是可行的。但實際情況是,大多數(shù)特征并不是只用于一個模型,而是被多個開發(fā)人員和數(shù)據(jù)科學家重復用于多個模型中。當創(chuàng)建了新的特征時,開發(fā)人員也希望能夠重復使用這些特征。這樣就導致需要管理多個S3對象,并將變得越來越難以管理。開發(fā)人員和數(shù)據(jù)科學家試圖使用電子表格、筆記和電子郵件來解決這個問題。他們甚至要嘗試開發(fā)一個應用程序來跟蹤管理特征,但這個工作量很大,而且容易出錯。此外,開發(fā)人員和數(shù)據(jù)科學家不僅需要使用這些相同的特征和所有可用的數(shù)據(jù)來訓練多個模型,這個過程可能耗時長達幾個小時,而且還需要在推理時使用這些特征,這需要在幾毫秒內返回預測結果,并且往往只使用相關特征的一個子集。例如,開發(fā)人員可能希望創(chuàng)建一個預測播放列表中下一首最佳歌曲的模型。要做到這一點,開發(fā)人員要在數(shù)千首歌曲上訓練模型,然后在推理過程中向模型提供最后播放的三首歌曲,以預測下一首歌曲。訓練和推理是非常不同的使用場景。在訓練過程中,模型可以離線、批量地訪問特征,對于推理,模型需要實時的訪問特征子集。由于機器學習模型使用一樣的特征源,并且需要保持數(shù)據(jù)的一致性,然而這兩種不同的訪問模式,使得開發(fā)者不容易保持特征的一致性和更新的及時性。Amazon SageMaker Feature Store 解決了這一問題,它提供了一個專門構建的特征庫,供開發(fā)人員訪問和共享特征,使開發(fā)人員和數(shù)據(jù)科學家團隊容易協(xié)調特征的命名、組織、查找和共享。Amazon SageMaker Feature Store 集成在 Amazon SageMaker Studio 中,它可以為推理提供單毫秒級的低延遲訪問。Amazon SageMaker Feature Store 使得開發(fā)人員可以簡單方便地組織和更新用于訓練的大批量特征,以及用于推理的小批量特征子集。這樣,就為機器學習模型提供了一致的特征視圖,降低生成模型的難度,并提供高精度的預測。

AmazonSageMakerPipelines實現(xiàn)工作流管理和自動化。Amazon SageMaker Pipelines是第一個專門為機器學習構建的、易于使用的CI/CD(持續(xù)集成和持續(xù)交付)服務??蛻粼谔卣鞴こ讨锌梢园l(fā)現(xiàn),機器學習包含的多個步驟都可以受益于編排和自動化。這與傳統(tǒng)的編程并無二致。在傳統(tǒng)編程中,客戶有CI/CD等工具幫助他們更快地開發(fā)和部署應用程序。然而,目前的機器學習中很少使用CI/CD工具,因為要么沒有這樣的工具,要么難以設置、配置和管理。借助 Amazon SageMaker Pipelines,開發(fā)人員可以定義端到端機器學習工作流的每一步。這些工作流包括數(shù)據(jù)加載步驟、用Amazon SageMaker Data Wrangler 做轉換、在 Amazon SageMaker Feature Store保存特征、訓練配置及算法設置、調試步驟,以及優(yōu)化步驟。通過 Amazon SageMaker Pipelines,開發(fā)人員可以輕松地從 Amazon SageMaker Studio 使用相同的設置重復運行端到端工作流,,每次都能獲得完全相同的模型,或者,他們可以定期使用新數(shù)據(jù)重新運行工作流,更新模型。每次運行工作流時,Amazon SageMaker Pipelines 都會記錄 Amazon SageMaker Experiments(Amazon SageMaker 的一項功能,用于組織和跟蹤機器學習實驗和模型版本)中的每個步驟。這有助于開發(fā)人員可視化并進行機器學習模型的迭代、訓練參數(shù)和結果比較。借助 Amazon SageMaker Pipelines,工作流可以在團隊之間共享和重復使用,既可以重新創(chuàng)建模型,也可以作為一個通過新的特征、算法或優(yōu)化改進模型的起點。

使用AmazonSageMakerClarify進行檢測和模型釋。Amazon SageMaker Clarify 在整個機器學習工作流中提供偏差檢測,使開發(fā)人員能夠在其模型中實現(xiàn)更大的公平性和更高的透明度。一旦開發(fā)人員為訓練和推理準備了數(shù)據(jù),就需要盡量確保數(shù)據(jù)沒有統(tǒng)計偏差,并且模型預測是透明的,以便可以解釋模型特征是如何預測的。如今,開發(fā)人員有時會嘗試使用開源工具檢測數(shù)據(jù)中的統(tǒng)計偏差,但這些工具需要大量的人工編程的工作,而且經(jīng)常容易出錯。借助 Amazon SageMaker Clarify,開發(fā)人員現(xiàn)在可以更輕松地檢測整個機器學習工作流中的統(tǒng)計偏差,并為其機器學習模型所做的預測提供解釋。Amazon SageMaker Clarify已集成到Amazon SageMaker Data Wrangler,它運行了一系列基于特征數(shù)據(jù)的算法,用以識別數(shù)據(jù)準備過程中的偏差,并且清晰描述可能的偏差來源及其嚴重程度。這樣,開發(fā)人員就可以采取措施來減小偏差。Amazon SageMaker Clarify還與Amazon SageMaker Experiments集成,使開發(fā)人員更容易地檢查訓練好的模型是否存在統(tǒng)計偏差。它還詳細說明了輸入到模型中的每個特征是如何影響預測的。最后,Amazon SageMaker Clarify 與 Amazon SageMaker Model Monitor(Amazon SageMaker 的一項功能,可持續(xù)監(jiān)控正式使用中的機器學習模型的質量)集成,一旦模型特征的重要性發(fā)生偏移,導致模型預測質量發(fā)生改變,它就會提醒開發(fā)人員。

Deep Profiling for AmazonSageMakerDebugger模型訓練剖析。Deep Profiling for Amazon SageMaker Debugger能夠自動監(jiān)控系統(tǒng)資源利用率,為訓練瓶頸提供告警,以方便開發(fā)者更快地訓練模型。當前,開發(fā)人員沒有一個標準的監(jiān)控系統(tǒng)利用率的方法(例如 GPU、CPU、網(wǎng)絡吞吐量和內存 I/O)以識別和排除訓練作業(yè)中的瓶頸。因此,開發(fā)人員無法以最快的速度、最高的成本效益來訓練模型。Amazon SageMaker Debugger 通過最新的 Deep Profiling功能解決了這一問題,該功能為開發(fā)人員提供了在 Amazon SageMaker Studio 中可視化剖析和監(jiān)控系統(tǒng)資源利用率的能力。這讓開發(fā)人員更容易尋根問底,減少訓練機器學習模型的時間和成本。借助這些新功能,Amazon SageMaker Debugger 擴大了監(jiān)控系統(tǒng)資源利用率的范圍,在 Amazon SageMaker Studio 中或通過 AWS CloudWatch 發(fā)送訓練期間的問題告警,將使用情況關聯(lián)到訓練作業(yè)中的不同階段,或者訓練期間的特定時間點(如訓練作業(yè)開始后 第28 分鐘)。Amazon SageMaker Debugger 還可以根據(jù)告警觸發(fā)行動(例如,當檢測到 GPU 使用情況不正常時,即停止訓練作業(yè))。Amazon SageMaker Debugger Deep Profiling 可以用于PyTorch、Apache MXNet 和 TensorFlow的訓練任務,自動收集必要的系統(tǒng)和訓練指標,無需在訓練腳本中更改任何代碼。這允許開發(fā)人員在Amazon SageMaker Studio中可視化其訓練期間的系統(tǒng)資源使用情況。

Distributed Training onAmazonSageMaker縮短訓練時間。Distributed Training on Amazon SageMaker使得訓練大型復雜深度學習模型的速度比當前的方法快兩倍。當前,高級的機器學習使用場景,例如智能助手的自然語言處理、自動駕駛車輛的對象檢測和分類,以及大規(guī)模內容審核的圖像分類,需要越來越大的數(shù)據(jù)集和更多的GPU (圖形處理單元 ) 內存進行訓練。然而,其中一些模型太大,無法容納在單個GPU提供的內存中??蛻艨梢試L試在多個GPU間拆分模型,但尋找拆分模型的最佳方式和調整訓練代碼往往需要數(shù)周的繁瑣實驗。為了克服這些挑戰(zhàn),Distributed Training on Amazon SageMaker提供了兩種分布式訓練功能,使開發(fā)人員能夠在不增加成本的情況下,將大型模型的訓練速度提高兩倍。Distributed Training與 Amazon SageMake的 數(shù)據(jù)并行引擎一起,通過在多個 GPU間自動分割數(shù)據(jù),將訓練作業(yè)從一個 GPU 擴展到數(shù)百個或數(shù)千個 GPU,將訓練時間縮短多達 40%。之所以能夠縮短訓練時間,是因為Amazon SageMaker的數(shù)據(jù)并行引擎使用了專門的算法來管理GPU,充分利用AWS基礎設施,實現(xiàn)最佳同步,具有近乎線性的擴展效率。Distributed Training 與Amazon SageMaker 模型并行引擎一起,可以自動剖析和識別分割模型的最佳方式,在多個 GPU 上高效分割具有數(shù)十億參數(shù)的大型復雜模型。它們通過使用圖分區(qū)算法來完成這樣工作,優(yōu)化了平衡計算,最大限度地減少GPU之間的通信,從而最少化代碼重構,減少GPU內存限制造成的錯誤。

使AmazonSageMakerEdge Manager管理邊緣設備模型。Amazon SageMaker Edge Manager 可以幫助開發(fā)人員優(yōu)化、保護、監(jiān)控和維護部署在邊緣設備集群上的機器學習模型。目前,客戶使用Amazon SageMaker Neo為邊緣設備優(yōu)化模型,這使得模型的運行速度可以提高到多達兩倍,且內存占用率不到十分之一,準確性也沒有損失。然而,在邊緣設備上部署后,客戶仍然需要管理和監(jiān)控模型,以確保它們仍然以高精度運行。Amazon SageMaker Edge Manager 可以優(yōu)化模型,使其在目標設備上運行得更快,并為邊緣設備管理模型,以便客戶可以在邊緣設備集群中準備、運行、監(jiān)控和更新機器學習模型??蛻艨梢允褂肁mazon SageMaker Edge Manager對其模型進行加密簽名,從邊緣設備上傳預測數(shù)據(jù)到 Amazon SageMaker以進行監(jiān)控和分析,并在 Amazon SageMaker 控制臺中查看報表,來跟蹤和可視化模型的運行狀況。Amazon SageMaker Edge Manager 擴展了以前只能在云端使用的功能,它可以從邊緣設備中采樣數(shù)據(jù),將其發(fā)送到 Amazon SageMaker Model Monitor進行分析,當模型的準確性隨著時間的推移而下降時,重新訓練模型以便開發(fā)人員不斷提高模型的質量。

通過AmazonSageMakerJumpStart開啟機器學習之旅。Amazon SageMaker JumpStart 為開發(fā)人員提供了一個易于使用、可搜索的界面,用于查找同類最佳解決方案、算法和notebook示例。當前,缺乏機器學習經(jīng)驗的客戶很難開始機器學習部署,而高級的開發(fā)人員發(fā)現(xiàn)很難將機器學習應用到所有應用場景。通過Amazon SageMaker JumpStart,客戶現(xiàn)在可以快速找到針對其機器學習場景的相關信息。新接觸機器學習的開發(fā)人員可以從多個完整的端到端機器學習解決方案中進行選擇(例如欺詐檢測、客戶流失預測或時序預測),并且可以直接部署到Amazon SageMaker Studio環(huán)境中。有經(jīng)驗的用戶則可以從一百多個機器學習模型中選擇,快速開始模型構建和訓練。

AWS負責亞馬遜機器學習的副總裁Swami Sivasubramanian表示:"成千上萬的開發(fā)人員和數(shù)據(jù)科學家已經(jīng)使用我們業(yè)界領先的機器學習服務Amazon SageMaker,消除了他們在構建、訓練和部署定制化機器學習模型時的障礙。擁有SageMaker這樣一個廣泛采用的服務,最大的好處就是受益于很多客戶的建議,為我們的下一套產(chǎn)品的交付提供了動力。今天,我們宣布為Amazon SageMaker提供一套工具,使開發(fā)人員更容易構建端到端機器學習流程,準備、構建、訓練、解釋、檢查、監(jiān)控、調試和運行定制化機器學習模型,提供更高的可視性、可解釋性和大規(guī)模的自動化。"

3M公司在全球70個國家運營,并在200個國家開展銷售業(yè)務,公司創(chuàng)造的技術和產(chǎn)品,正在推動著每一家公司的發(fā)展,改善每一個家庭的日常生活。"3M的成功源于我們具有企業(yè)家精神的研究人員和我們對科學的持續(xù)關注。我們推進產(chǎn)品科學化的一種方式是在AWS上使用機器學習技術。"3M企業(yè)系統(tǒng)研究實驗室技術總監(jiān)David Frazee說。"利用機器學習,3M正在改進砂紙這樣久經(jīng)考驗的產(chǎn)品,并推動其它一些領域包括醫(yī)療保健在內的創(chuàng)新。隨著我們計劃將機器學習擴展到3M的更多領域,我們的數(shù)據(jù)和模型快速增長,每年翻倍。我們對Amazon SageMaker的新功能充滿熱情,因為它們將幫助我們擴大規(guī)模。Amazon SageMaker Data Wrangler 使得為模型訓練來準備數(shù)據(jù)變得更容易,Amazon SageMaker Feature Store 使得我們不需要重復創(chuàng)建相同的模型特征。最后,Amazon SageMaker Pipelines 可以幫助我們將數(shù)據(jù)準備、模型構建和模型部署,變成自動化的端到端工作流,加速模型上生產(chǎn)的時間。我們的研究人員期待著在3M公司利用這些工具,提高科學創(chuàng)新速度。"

德勤正在幫助全球各地的組織轉型。德勤不斷演進其工作方式和看待市場挑戰(zhàn)的方式,不斷為客戶和社區(qū)提供可衡量、可持續(xù)的成果。德勤AI生態(tài)系統(tǒng)和平臺負責人Frank Farrall表示:"Amazon SageMaker Data Wrangler提供了豐富的數(shù)據(jù)轉換工具,滿足了我們數(shù)據(jù)準備的需求,縮短了新產(chǎn)品上市的時間。反過來,我們的客戶也受益于我們規(guī)?;渴鸬乃俣?使我們能夠在幾天內、而不是幾個月內,提供可衡量、可持續(xù)的結果,滿足客戶需求。"

英威達自2004年起成為Koch Industries的子公司,為市場提供尼龍6,6的專有成分,擁有STAINMASTER、CORDURA和ANTRON等的知名品牌。它是全球最大的化學中間體、聚合物和纖維的綜合生產(chǎn)商之一。"在英威達,我們以轉型為動力,努力開發(fā)出惠及全球客戶的產(chǎn)品和技術。"英威達首席數(shù)據(jù)科學家Caleb Wilkinson表示:"我們認為機器學習是改善客戶體驗的一種方式。但面對數(shù)億條記錄的數(shù)據(jù)集,我們需要一個解決方案來幫助我們準備數(shù)據(jù),大規(guī)模地開發(fā)、部署和管理機器學習模型。為了加快這些流程,我們與 AWS 團隊攜手開發(fā)了一些新特征。通過Amazon SageMaker Data Wrangler,我們現(xiàn)在可以交互式地選擇、清理、探索和有效地理解我們的數(shù)據(jù),使我們的數(shù)據(jù)科學團隊有能力創(chuàng)建特征工程管道,可以毫不費力地擴展到跨越數(shù)億條記錄的數(shù)據(jù)集。我們還可以使用 Amazon SageMaker Pipelines 輕松地大規(guī)模自動化和管理機器學習工作流,這樣我們可以輕松地將機器學習工作流的各個步驟連接在一起。結合Amazon SageMaker Data Wrangler和Amazon SageMaker Pipelines,我們可以更快地運行機器學習工作流。"

Snowflake Data Cloud打破了阻礙不同規(guī)模企業(yè)從數(shù)據(jù)中釋放真正價值的障礙。Snowflake產(chǎn)品高級副總裁Christian Kleinerman說:"我們的企業(yè)客戶面臨的最大挑戰(zhàn)之一是為機器學習項目準備數(shù)據(jù)。我們對Amazon SageMaker Data Wrangler感到很興奮,它使得企業(yè)為機器學習匯總和準備數(shù)據(jù)變得更加容易。隨著Snowflake作為數(shù)據(jù)源加入Amazon SageMaker Data Wrangler,我們共同的客戶很快就能利用Snowflake集成的平臺能力,以及Amazon SageMaker的交互式數(shù)據(jù)準備和機器學習能力??蛻魧⒛軌虮纫郧案斓貜脑紨?shù)據(jù)中獲得機器學習模型和見解。"

Databricks成立于2013年,由Apache Spark™、Delta Lake和MLflow的初創(chuàng)者創(chuàng)立。它將數(shù)據(jù)工程、數(shù)據(jù)科學和數(shù)據(jù)分析匯集在一個開放、統(tǒng)一的平臺上,使數(shù)據(jù)團隊能夠更快地進行協(xié)作和創(chuàng)新。"在Databricks,我們致力于將數(shù)據(jù)工程和科學,與數(shù)據(jù)分析結合在一起,以便數(shù)據(jù)團隊能夠更快地協(xié)作和創(chuàng)新,"Databricks產(chǎn)品高級副總裁Adam Conway說。"我們期待著在2021年繼續(xù)與AWS合作,特別是我們的客戶可以無縫的體驗到Amazon SageMaker Data Wrangler。通過這種合作關系,我們的客戶可以利用Delta Lake與Amazon SageMaker來準備訓練數(shù)據(jù),以創(chuàng)建最準確的機器學習模型。"

MongoDB Atlas是MongoDB的完全托管服務,MongoDB是一種流行的數(shù)據(jù)庫,旨在幫助團隊快速建立、擴展和迭代。"我們MongoDB的使命是,讓數(shù)據(jù)令人驚嘆地易于操作,釋放每個人的天賦。MongoDB Atlas運行著超過150萬個數(shù)據(jù)庫集群,為客戶的關鍵應用提供動力;我們希望根據(jù)這些應用產(chǎn)生的數(shù)據(jù),輕松構建、訓練和部署機器學習模型。"MongoDB首席技術官Mark Porter說。"我們很高興,我們的客戶現(xiàn)在可以使用Amazon SageMaker Data Wrangler,為機器學習采集和準備數(shù)據(jù)的環(huán)節(jié)提供一種更快的、可視化的方式。在即將到來的2021年,我們的客戶很快能夠在Amazon SageMaker Data Wrangler中查詢、分析Amazon S3和MongoDB Atlas中的數(shù)據(jù),使他們能夠更快地從數(shù)據(jù)中獲得更多價值。"

Intuit是一家使命驅動的全球財務平臺公司,創(chuàng)造了引以為豪的產(chǎn)品TurboTax、QuickBooks和Mint。"我們于2017年選擇在AWS上構建Intuit新的機器學習平臺,將Amazon SageMaker在模型開發(fā)、訓練和托管方面的強大功能,與Intuit自身在編排和特征工程方面的能力相結合。"Intuit數(shù)據(jù)平臺工程副總裁Mammad Zadeh表示。"因此,我們大幅縮短了模型開發(fā)的生命周期,能夠以非常快的速度,將AI功能推進到我們的TurboTax、QuickBooks和Mint產(chǎn)品中。這在過去需要整整六個月的時間,而現(xiàn)在只需要不到一周的時間,在Amazon SageMaker Feature Store發(fā)布之前,我們與AWS進行了密切的協(xié)作,我們?yōu)槿泄芴卣鲙斓那熬案械脚d奮,這樣我們就不再需要在整個組織中維護多個特征庫。我們的數(shù)據(jù)科學家將能夠從一個中央特征庫中使用現(xiàn)有的特征,并且推動各團隊和模型之間特征的標準化和重用。"

Climate Corporation是拜耳的子公司,也是利用數(shù)字工具提高農民生產(chǎn)力、為全球農民帶來數(shù)字創(chuàng)新的行業(yè)領導者。Climate致力于幫助農民以前所未有的方式了解他們的田地,從農業(yè)數(shù)據(jù)中獲得有影響力的建議。"在Climate,我們相信通過為世界上的農民提供準確的信息,做出數(shù)據(jù)驅動的決策,可以最大化他們在每一畝土地上的回報,"Climate數(shù)據(jù)和分析副總裁Daniel McCaffrey說。"為了實現(xiàn)這一目標,我們投資了諸如機器學習工具之類的技術,以使用稱為特征的可測量實體(例如種植者的田間產(chǎn)量)來構建模型。有了Amazon SageMaker Feature Store,我們可以通過集中的特征庫加速機器學習模型的開發(fā),多個團隊都可以輕松訪問和重復使用這些特征。Amazon SageMaker Feature Store 可讓我們通過在線特征庫實時訪問特征,或定期訪問離線特征庫,以滿足不同的使用場景。通過Amazon SageMaker Feature Store,我們可以更快地開發(fā)機器學習模型。"

DeNA是日本領先的移動和在線服務提供商,提供游戲、電子商務和娛樂內容發(fā)行。"在DeNA,我們的使命是利用人工智能和機器學習為客戶帶來影響和愉悅。提供基于價值的服務是我們的首要目標,我們希望確保我們的業(yè)務和服務為實現(xiàn)這一目標做好準備。"DeNA人工智能系統(tǒng)總經(jīng)理山田健信說。"我們的關鍵舉措之一是增強我們在人工智能和機器學習方面的能力。Amazon SageMaker提供廣泛的功能來訓練和部署精確的模型,幫助我們在眾多業(yè)務部署機器學習。為我們的工程團隊提供方便易用的數(shù)據(jù)準備并是我們關注的領域。有了Amazon SageMaker Data Wrangler,我們可以在不需要額外編寫代碼的情況下,利用豐富的轉換工具套件一站式解決問題。隨著我們在數(shù)據(jù)準備方面變得更加高效,我們也希望確保我們不同業(yè)務團隊在為應用程序構建特征時避免重復勞動。我們希望在整個組織中探索和復用特征,Amazon SageMaker Feature Store 幫助我們以簡單有效的方式,為不同的應用程序復用特征。Amazon SageMaker Feature Store 還幫助我們維護標準的特征定義,在我們訓練模型并將其部署到實際應用時,保持特征的一致性。借助Amazon SageMaker的這些新特性,我們可以更快地訓練和部署機器學習模型,讓我們繼續(xù)不斷創(chuàng)新,以最佳服務為客戶帶來愉悅。"

iFood是一家在線食品配送網(wǎng)站,是拉丁美洲最大的食品配送公司之一,為消費者提供優(yōu)質服務。"在iFood,我們力求使用機器學習等技術,為客戶提供使其滿意的服務。"iFood首席數(shù)據(jù)科學家Sandor Caetano說。"我們一直在使用Amazon SageMaker來進行機器學習任務,在整個業(yè)務中構建高質量的應用程序。我們進一步擴展機器學習工作的重要內容,就是構建一個完整而無縫的工作流,并在其中開發(fā)、訓練和部署模型。Amazon SageMaker Pipelines 可幫助我們快速構建多個可擴展的自動化機器學習工作流,使我們能夠輕松有效地部署和管理模型,使我們的開發(fā)周期更加高效。我們將進一步強化我們在人工智能和機器學習技術的領先地位,通過使用Amazon SageMaker所有的新功能,提供卓越的客戶服務和效率。"

DFL Deutsche Fußball Liga是德國頂級足球聯(lián)賽德甲和德乙的組織者和營銷者,于2020年1月指定AWS為其官方技術供應商,通過由AWS提供技術支持的Bundesliga Match Facts (德甲比賽事實),為全球球迷和電視轉播商帶來先進的體育分析。"Amazon SageMaker Clarify與德甲比賽事實數(shù)字平臺的其它部分無縫集成,我們長期戰(zhàn)略的關鍵部分是在Amazon SageMaker上實現(xiàn)機器學習工作流標準化。"DFL集團數(shù)字創(chuàng)新執(zhí)行副總裁Andreas Heyden表示。"通過使用AWS的機器學習等創(chuàng)新技術,我們提供了更深入的見解,讓球迷更好地理解球場上瞬間,德甲比賽事實使觀眾能夠更深入地了解每場比賽中球員的關鍵決定。"

CS DISCO是一家SaaS供應商,提供自動化解決方案簡化各種法律任務。"在CS DISCO,我們已經(jīng)通過我們用于電子發(fā)現(xiàn)的DISCO AI平臺,徹底改變了審查法律證據(jù)的方式,"CS DISCO首席數(shù)據(jù)科學家Alan Lockett說。"我們一直在努力加快我們高級深度學習模型的訓練速度。我們與AWS的Amazon SageMaker團隊協(xié)作,利用分布式訓練等技術加速我們的AI應用場景。"

Turbine是一家以模擬技術為驅動的藥物研發(fā)公司,為患者提供靶向癌癥療法。"我們基于專有的網(wǎng)絡架構使用機器學習來訓練我們的生物信息學人類細胞模型,稱為Simulated Cell™。通過準確預測分子水平上的各種干預措施,Simulated Cell™幫助我們發(fā)現(xiàn)新的癌癥藥物,為現(xiàn)有療法尋找組合方案,"Turbine的CTO Kristóf Szalay說。"我們對細胞模擬的訓練是不斷迭代的,但在一臺機器上,每次訓練都需要幾天時間,阻礙了我們快速迭代新想法的需求。我們對Amazon SageMaker上的分布式訓練感到非常興奮,它能將我們的訓練時間減少90%,并幫助我們專注于主要任務,即為細胞模型訓練編寫最優(yōu)的代碼。Amazon SageMaker最終使我們能夠更高效地完成我們的主要任務:為患者識別和開發(fā)新型癌癥藥物。"

Latent Space是一家致力于構建全球首個完全AI渲染的3D游戲引擎的創(chuàng)業(yè)公司。"在Latent Space,我們正在打造一個基于神經(jīng)渲染的游戲引擎,任何人都可以快速的進行創(chuàng)作。在高級語言建模的推動下,我們正在努力結合對文本和圖像的語義理解,以確定生成的內容。"Latent Space的聯(lián)合創(chuàng)始人兼首席科學官Sara Jane說。"我們目前的重點是利用信息檢索,加強大規(guī)模的模型訓練,為此我們有復雜的機器學習流程。這種設置為分布式訓練帶來了挑戰(zhàn),因為有多個數(shù)據(jù)源,以及多個模型同時進行訓練。因此,我們正在利用Amazon SageMaker的分布式訓練功能,高效地擴展大型生成模型的訓練。"

聯(lián)想是全球最大的個人電腦制造商。聯(lián)想設計和制造的設備包括記事本電腦、平板電腦、智能手機和各種智能物聯(lián)網(wǎng)設備。"在聯(lián)想,我們不僅僅是一家硬件供應商,還致力于成為客戶值得信賴的合作伙伴,改變客戶使用設備的體驗,實現(xiàn)客戶的業(yè)務目標。聯(lián)想Device Intelligence就是我們使用Amazon SageMaker來增強機器學習能力的一個很好的例證。"聯(lián)想個人電腦和智能設備部門云與軟件副總裁Igor Bergman說。"通過聯(lián)想Device Intelligence,IT管理員可以主動診斷個人電腦問題,提前預測潛在的系統(tǒng)故障,減少宕機時間,提高員工的工作效率。結合Amazon SageMaker Neo,我們已經(jīng)實質性的提高了設備預測模型的效果,從而促使我們在未來幾周內進一步采用Amazon SageMaker Edge Manager。Amazon SageMaker Edge Manager 將有助于消除模型部署后進行優(yōu)化、監(jiān)控和持續(xù)改進所需的人工工作?;诖?預計我們的模型將比其它同類機器學習平臺運行得更快,消耗的內存更少。隨著我們將人工智能擴展到聯(lián)想整個服務組合中的新應用,我們將繼續(xù)采用高性能的機器學習管道,在云端和數(shù)百萬邊緣設備上靈活擴展。這正是我們選擇Amazon SageMaker平臺的原因。憑借其豐富的從邊緣到云端和CI/CD工作流的能力,我們可以有效地將我們的機器學習模型帶入任何設備工作流,從而大大提高生產(chǎn)力。"

Basler AG是一家領先的高品質數(shù)碼相機及配件制造商,其產(chǎn)品適用于工業(yè)、醫(yī)療、交通和其它各種領域。"Basler AG為各個行業(yè)提供智能計算機視覺解決方案,包括制造、醫(yī)療和零售應用。我們很高興通過Amazon SageMaker Edge Manager實現(xiàn)的新功能,擴展我們的軟件產(chǎn)品,"Basler軟件解決方案主管Mark Hebbel說。"為了確保我們機器學習解決方案的性能和可靠性,我們需要一個可擴展的、邊云結合的MLOps工具,使我們能夠持續(xù)監(jiān)控、維護和改進邊緣設備上的機器學習模型。Amazon SageMaker Edge Manager 允許我們在邊緣自動采樣數(shù)據(jù),將其安全地發(fā)送到云端,在部署后持續(xù)監(jiān)控每個設備上每個模型的質量。這使我們能夠在全球范圍內遠程監(jiān)控、改進和更新邊緣設備上的模型,同時也節(jié)省了我們和客戶的時間和成本。"

Mission Automate幫助他們全球的客戶設計軟件解決方案。"我們不斷尋找新的解決方案為客戶提供最優(yōu)質的軟件,但作為一個小型組織,我們沒有像其它組織一樣有細分專業(yè)領域的能力,"Mission Automate的首席執(zhí)行官Alex Panait說。"Amazon SageMaker JumpStart現(xiàn)在為我們提供了更快地開始使用機器學習的方法,包括我們可以在自己的工作流中使用的新技術、以增加我們的服務產(chǎn)品、并且降低成本。從流行的模型庫中選擇機器學習模型和算法,使我們能夠快速訓練定制的機器學習模型,幫助我們的客戶更快地進入市場。得益于Amazon SageMaker JumpStart,我們能夠在幾天內推出機器學習解決方案,更快、更可靠地滿足機器學習預測需求。"

MyCase提供了一款功能強大的法律業(yè)務管理軟件,幫助律師事務所從任何地方高效運行,提供卓越的客戶體驗,輕松跟蹤事務所的業(yè)績。"我們有幾個業(yè)務和產(chǎn)品元素可以通過機器學習來改進,"MyCase的軟件工程師Gus Nguyen說。"Amazon SageMaker JumpStart使我們能夠一鍵開啟端到端解決方案,獲取一系列notebooks,幫助我們更深入地了解客戶,并通過預測更好地滿足他們的需求。通過Amazon SageMaker JumpStart,讓我們可以有更高的起點,使得我們可以把為自己的使用場景部署機器學習解決方案從三到四個月縮短到四到六周內。"

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )