隨著技術(shù)和生態(tài)的不斷演進(jìn)、應(yīng)用場(chǎng)景的不斷探索,機(jī)器學(xué)習(xí)已然不再僅僅停留在實(shí)驗(yàn)室當(dāng)中。無(wú)論是日新月異的互聯(lián)網(wǎng)應(yīng)用,還是求新求變的企業(yè)轉(zhuǎn)型,機(jī)器學(xué)習(xí)都得到了廣泛的應(yīng)用,逐步成為驅(qū)動(dòng)業(yè)務(wù)的關(guān)鍵技術(shù)。
機(jī)器學(xué)習(xí)在近 30 多年已發(fā)展為一門多領(lǐng)域交叉學(xué)科,也已廣泛應(yīng)用于數(shù)據(jù)挖掘、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、生物特征識(shí)別、搜索引擎、醫(yī)學(xué)診斷、檢測(cè)信用卡欺詐、證券市場(chǎng)分析、DNA 序列測(cè)序、語(yǔ)音和手寫識(shí)別、戰(zhàn)略游戲和機(jī)器人等領(lǐng)域。
為了幫助大家更便捷的解決這些實(shí)際問(wèn)題,讓數(shù)據(jù)科學(xué)家、算法工程師、業(yè)務(wù)開(kāi)發(fā)者都能輕松駕馭機(jī)器學(xué)習(xí),AWS 推出了各式各樣的機(jī)器學(xué)習(xí)工具,包括:ML 服務(wù)類、API 類、AI 服務(wù)工具類等。
今天,我們就對(duì) AWS 的部分優(yōu)秀機(jī)器學(xué)習(xí)工具做一個(gè)整理,分享給各位行業(yè)從業(yè)者。
一. ML 服務(wù)類機(jī)器學(xué)習(xí)工具
1. Amazon SageMaker
Amazon SageMaker 是一項(xiàng)完全托管的服務(wù),可為每位開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家提供快速構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí) (ML) 模型的能力。
開(kāi)發(fā)者可以在一個(gè)集成的可視界面中編寫代碼、跟蹤實(shí)驗(yàn)、可視化數(shù)據(jù)以及進(jìn)行調(diào)試和監(jiān)控。從完整的平臺(tái) IDE,到具體代碼與 API,SageMaker 都有一種 Pythonic 精神,簡(jiǎn)潔易用,同時(shí)提供高級(jí)的接口。消除了機(jī)器學(xué)習(xí)過(guò)程中的每個(gè)步驟的繁重工作,讓開(kāi)發(fā)者能夠更輕松地開(kāi)發(fā)高質(zhì)量模型,提高開(kāi)發(fā)人員的工作效率。
2020 年 4 月底,SageMaker 在 AWS 中國(guó)的北京區(qū)域和寧夏區(qū)域上正式開(kāi)放。就在前不久,在國(guó)內(nèi)開(kāi)始正式開(kāi)放。這標(biāo)志著 AWS 人工智能、機(jī)器學(xué)習(xí)平臺(tái)服務(wù)的關(guān)鍵技術(shù)已全面進(jìn)入中國(guó)。
工具亮點(diǎn):
這是第一個(gè)用于機(jī)器學(xué)習(xí)的完全集成式開(kāi)發(fā)環(huán)境 (IDE) 單一集成的可視界面操作,大幅提高開(kāi)發(fā)效率 可自動(dòng)構(gòu)建、訓(xùn)練和調(diào)試完全可視和可控的模型 使用 Amazon SageMaker Ground Truth 將數(shù)據(jù)標(biāo)記成本降低多達(dá) 70% 使用 Amazon Elastic Inference 可將機(jī)器學(xué)習(xí)推理成本降低多達(dá) 75% API 類
二. API 類機(jī)器學(xué)習(xí)工具
1. 文本轉(zhuǎn)語(yǔ)音:Amazon Polly
Amazon Polly 是一項(xiàng)云服務(wù),可以將文本轉(zhuǎn)化為逼真的語(yǔ)音。支持多種語(yǔ)言,并包含各種逼真的聲音,因此你可以構(gòu)建在多個(gè)位置工作的支持語(yǔ)音的應(yīng)用程序,并為你的客戶使用理想的語(yǔ)音。
此外,Amazon Polly 還包含許多神經(jīng)文本到語(yǔ)音轉(zhuǎn)換 (NTTS) 語(yǔ)音,通過(guò)新的機(jī)器學(xué)習(xí)方法為語(yǔ)音質(zhì)量帶來(lái)突破性的改進(jìn),從而為客戶提供盡可能最自然的文本到語(yǔ)音的似人類的語(yǔ)音。神經(jīng) TTS 技術(shù)還支持播音員風(fēng)格,專為新聞播報(bào)使用案例量身定制。
Amazon Polly 的常用案例包括移動(dòng)應(yīng)用程序(如新聞閱讀器、游戲、電子學(xué)習(xí)平臺(tái))、視障人士輔助功能應(yīng)用程序以及快速增長(zhǎng)的物聯(lián)網(wǎng) (IoT) 細(xì)分市場(chǎng)。Alexa 語(yǔ)音助手的品牌定制語(yǔ)音服務(wù),就是通過(guò) Amazon Polly 語(yǔ)音合成平臺(tái)提供的。
工具亮點(diǎn):
高質(zhì)量:新的神經(jīng) TTS 和一流的標(biāo)準(zhǔn) TTS 技術(shù),可合成發(fā)音精度極高的超自然語(yǔ)音; 支持多種語(yǔ)言和語(yǔ)音:支持?jǐn)?shù)十種語(yǔ)音語(yǔ)言,并為大多數(shù)語(yǔ)言提供男性和女性語(yǔ)音選項(xiàng)。 經(jīng)濟(jì)實(shí)惠:Amazon Polly 采用按需付費(fèi)定價(jià)模式,每字符轉(zhuǎn)換成本低廉,并且支持無(wú)限次重放,使企業(yè)能夠以經(jīng)濟(jì)高效的方式為應(yīng)用程序添加語(yǔ)音功能。
2.語(yǔ)音轉(zhuǎn)文本:Amazon Transcribe
Amazon Transcribe 是一項(xiàng)自動(dòng)語(yǔ)音識(shí)別 (ASR) 服務(wù),讓開(kāi)發(fā)人員能夠輕松地為其應(yīng)用程序添加語(yǔ)音轉(zhuǎn)文本功能。通過(guò)使用 Amazon Transcribe API,可以分析 Amazon S3 中存儲(chǔ)的音頻文件,并讓該服務(wù)返回一個(gè)轉(zhuǎn)錄的語(yǔ)音文本文件。開(kāi)發(fā)人員還可以將實(shí)時(shí)音頻流發(fā)送到 Amazon Transcribe,并實(shí)時(shí)接收轉(zhuǎn)錄流。
Amazon Transcribe 可用于很多常見(jiàn)應(yīng)用程序,包括客戶服務(wù)通話轉(zhuǎn)錄,以及基于音頻和視頻內(nèi)容生成字幕。該服務(wù)可以轉(zhuǎn)錄以常見(jiàn)格式(例如 WAV 和 MP3)存儲(chǔ)的音頻文件,并為每個(gè)詞附加時(shí)間戳,以便開(kāi)發(fā)者可以通過(guò)搜索文本輕松找到原始源中的音頻。
工具亮點(diǎn):
便于閱讀的轉(zhuǎn)錄:Amazon Transcribe 采用深度學(xué)習(xí)功能自動(dòng)添加標(biāo)點(diǎn)符號(hào)和格式,從而使輸出內(nèi)容更容易理解,無(wú)需進(jìn)一步編輯即可直接使用。 生成時(shí)間戳:Amazon Transcribe 會(huì)為每個(gè)詞返回時(shí)間戳,以便可以通過(guò)搜索文本輕松找到原始錄音中的音頻。 自定義詞匯表:Amazon Transcribe 支持?jǐn)U展和自定義語(yǔ)音識(shí)別詞匯表。使用者可以將新詞添加到基本詞匯表中,并生成使用案例特定的高度準(zhǔn)確的轉(zhuǎn)錄,例如產(chǎn)品名稱、域特定術(shù)語(yǔ)或個(gè)人姓名。 識(shí)別多個(gè)講話者:Amazon Transcribe 能夠識(shí)別出講話者的變化,并相應(yīng)地確定轉(zhuǎn)錄文本的歸屬。這樣可以顯著減少轉(zhuǎn)錄具有多個(gè)講話者的音頻(例如電話、會(huì)議和電視節(jié)目)所需的工作量。
3.從文檔中提取文本和數(shù)據(jù):Amazon Textract
Amazon Textract 是一項(xiàng)從掃描的文檔中自動(dòng)提取文本和數(shù)據(jù)的服務(wù)。Amazon Textract 的功能不只是簡(jiǎn)單的光學(xué)字符識(shí)別 (OCR),它還可以識(shí)別表單中字段的內(nèi)容和表格中存儲(chǔ)的信息。
借助 Textract,開(kāi)發(fā)人員可以快速自動(dòng)執(zhí)行文檔工作流,數(shù)小時(shí)可處理數(shù)百萬(wàn)個(gè)文檔頁(yè)面。此外,開(kāi)發(fā)人員還可以創(chuàng)建智能搜索索引,構(gòu)建自動(dòng)批準(zhǔn)工作流,并通過(guò)標(biāo)記可能需要校訂的數(shù)據(jù),更好地保持對(duì)文檔存檔規(guī)則的符合性。
結(jié)合 Amazon Augmented AI (Amazon A2I) 后,開(kāi)發(fā)人員可以通過(guò)內(nèi)置人工審核來(lái)管理需要人工判斷的細(xì)微或敏感工作流,從而取得高確信度的預(yù)測(cè)或?qū)︻A(yù)測(cè)進(jìn)行持續(xù)審計(jì)。
工具亮點(diǎn):
快速準(zhǔn)確地提取數(shù)據(jù):Amazon Textract 可以自動(dòng)檢測(cè)文檔的布局和頁(yè)面上的關(guān)鍵元素,了解任何嵌入式表單或表格中的數(shù)據(jù)關(guān)系,并提取附帶完整上下文的所有內(nèi)容。 無(wú)需維護(hù)代碼或模板:借助 Amazon Textract 預(yù)先經(jīng)過(guò)訓(xùn)練的機(jī)器學(xué)習(xí)模型,無(wú)需為數(shù)據(jù)提取編寫代碼,不需要為可能收到的每個(gè)文檔或表單維護(hù)代碼,也不必?fù)?dān)心頁(yè)面布局隨著時(shí)間的推移而發(fā)生變化。 更低的文檔處理成本:Amazon Textract 以非常低的成本提供 OCR 和結(jié)構(gòu)化數(shù)據(jù)提取(表單和表格),你只需按照實(shí)際使用量付費(fèi),無(wú)需預(yù)先承諾或長(zhǎng)期合同。
三. AI 服務(wù)類機(jī)器學(xué)習(xí)工具
1. 代碼審查工具 —— Amazon CodeGuru
Amazon CodeGuru 是一種機(jī)器學(xué)習(xí)服務(wù),可自動(dòng)執(zhí)行代碼審查,并提供應(yīng)用程序性能建議。它可以幫助開(kāi)發(fā)人員找到影響應(yīng)用程序性能的代碼行,并版主進(jìn)行問(wèn)題排查,然后提供修復(fù)或改進(jìn)代碼的具體建議。
CodeGuru 由機(jī)器學(xué)習(xí)、最佳實(shí)踐以及經(jīng)在開(kāi)源項(xiàng)目和 Amazon 內(nèi)部分析數(shù)百萬(wàn)項(xiàng)代碼審查和數(shù)千個(gè)應(yīng)用程序后總結(jié)出來(lái)的經(jīng)驗(yàn)教訓(xùn)提供支持。
2. 快速構(gòu)建深度學(xué)習(xí)應(yīng)用程序 —— AWS Deep Learning AMI
AWS Deep Learning AMI (DLAMI) 是在云中進(jìn)行深度學(xué)習(xí)的一站式商店,可以為機(jī)器學(xué)習(xí)從業(yè)人員和研究人員提供基礎(chǔ)設(shè)施和各種工具,從而加快在云中進(jìn)行任意規(guī)模的深度學(xué)習(xí)的速度。
通過(guò) DLAMI,開(kāi)發(fā)人員可以快速啟動(dòng)預(yù)先安裝了常見(jiàn)深度學(xué)習(xí)框架和界面(如 TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras)的 Amazon EC2 實(shí)例來(lái)訓(xùn)練復(fù)雜的自定義 AI 模型、試驗(yàn)新算法或?qū)W習(xí)新技能和技巧。
無(wú)論需要 Amazon EC2 GPU 還是 CPU 實(shí)例,都無(wú)需為 Deep Learning AMI 支付額外費(fèi)用。只需為存儲(chǔ)和運(yùn)行應(yīng)用程序所需的 AWS 資源付費(fèi)。
AWS Deep Learning AMI 可在專為推理設(shè)計(jì)的基于 Intel 的 Amazon EC2 C5 實(shí)例上運(yùn)行。AMI 預(yù)安裝了 NVIDIA CUDA 和 cuDNN 驅(qū)動(dòng)程序,可以有效縮短完成計(jì)算所需的時(shí)間。
為了簡(jiǎn)化軟件包的管理和部署,AWS Deep Learning AMI 安裝了 Anaconda2 和 Anaconda3 數(shù)據(jù)科學(xué)平臺(tái),可以進(jìn)行大規(guī)模數(shù)據(jù)處理、預(yù)測(cè)分析和科學(xué)計(jì)算。
工欲善其事必先利其器,想要進(jìn)行機(jī)器學(xué)習(xí)方面的工作研究,配合上優(yōu)秀的工具一定可以事半功倍。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )