12月4日,在AWS re:Invent全球大會(huì)上,AWS發(fā)布五項(xiàng)新的人工智能 (AI) 服務(wù),旨在將機(jī)器學(xué)習(xí)交到更多應(yīng)用程序開發(fā)者和終端用戶手中,而他們無需機(jī)器學(xué)習(xí)經(jīng)驗(yàn),也能輕松使用AI。
這五項(xiàng)AI新服務(wù)分別是:
1、Amazon Kendra重塑企業(yè)搜索,它利用自然語言處理及其它機(jī)器學(xué)習(xí)技術(shù),將企業(yè)內(nèi)部的多個(gè)數(shù)據(jù)孤島統(tǒng)一起來,始終如一地為常見查詢提供高質(zhì)量的結(jié)果,而不是以隨機(jī)的鏈接列表響應(yīng)關(guān)鍵字查詢;
2、Amazon CodeGuru可幫助軟件開發(fā)者自動(dòng)執(zhí)行代碼審核,確定應(yīng)用中開銷最大的代碼行;
3、Amazon Fraud Detector基于為Amazon.com開發(fā)的相同技術(shù),幫助企業(yè)實(shí)時(shí)識(shí)別線上身份欺詐和支付欺詐;
4、Amazon Transcribe Medical為醫(yī)療保健提供商提供高精度的、實(shí)時(shí)語音到文本轉(zhuǎn)錄,以便他們可以專注于患者護(hù)理;
5、Amazon Augmented Artificial Intelligence (A2I) 幫助機(jī)器學(xué)習(xí)開發(fā)者通過人工確認(rèn)驗(yàn)證機(jī)器學(xué)習(xí)預(yù)測(cè)。
具體而言
Amazon Kendra
盡管多年來多種嘗試,但內(nèi)部搜索對(duì)于當(dāng)今的企業(yè)來說仍是一個(gè)棘手的問題,大多數(shù)員工仍然經(jīng)常難以找到他們需要的信息。機(jī)構(gòu)擁有大量非結(jié)構(gòu)化文本數(shù)據(jù),如果能夠發(fā)現(xiàn)、存儲(chǔ)多種格式并跨不同的數(shù)據(jù)源(例如Sharepoint、Intranet、Amazon S3和本地文件存儲(chǔ)系統(tǒng)),則這些數(shù)據(jù)非常有用。即使通用的、基于 Web 的搜索工具隨處可見,機(jī)構(gòu)仍然發(fā)現(xiàn)內(nèi)部搜索很困難,因?yàn)闆]有可用工具能夠很好地跨越現(xiàn)有數(shù)據(jù)孤島編制索引,無法提供自然語言查詢,并且無法提供準(zhǔn)確的結(jié)果。當(dāng)員工有疑問時(shí),他們需要使用可能出現(xiàn)在不同上下文、多個(gè)文檔中的關(guān)鍵字,這些搜索通常會(huì)生成一長串隨機(jī)鏈接,員工必須篩選這些鏈接才能找到他們查找的信息(如果他們找得到的話)。
Amazon Kendra讓員工可以使用真實(shí)問題(而不僅僅是關(guān)鍵字)在多個(gè)數(shù)據(jù)孤島中搜索,在后臺(tái)部署AI技術(shù)來提供他們尋求的精確答案(而不是隨機(jī)的鏈接列表),重塑企業(yè)搜索。員工可以使用自然語言運(yùn)行搜索(關(guān)鍵字仍然有效,但大多數(shù)用戶更喜歡自然語言搜索)。例如,員工可以提出一個(gè)特定問題,如“IT服務(wù)臺(tái)什么時(shí)候開?”Amazon Kendra會(huì)給他們一個(gè)具體答案,如“IT 服務(wù)臺(tái)在上午9:30打開”,同時(shí)給出指向IT門戶和其它相關(guān)網(wǎng)站的鏈接??蛻艨梢栽趹?yīng)用程序、門戶和 wiki 中使用Amazon Kendra。只需在AWS管理控制臺(tái)中單擊幾下,客戶即可將Amazon Kendra指向其各種文檔存儲(chǔ)庫,服務(wù)會(huì)聚合PB級(jí)的數(shù)據(jù)以構(gòu)建集中索引。Amazon Kendra會(huì)掃描文檔的權(quán)限,確保搜索結(jié)果符合現(xiàn)有的文檔訪問策略,搜索結(jié)果僅包含用戶有權(quán)訪問的文檔。此外,Amazon Kendra還根據(jù)客戶的特定情況,積極地重新訓(xùn)練機(jī)器學(xué)習(xí)模型,使用點(diǎn)擊率數(shù)據(jù)、用戶位置和反饋提高準(zhǔn)確性,隨著時(shí)間的推移提供越來越好的答案。
Amazon CodeGuru
跟亞馬遜一樣,AWS客戶也編寫了大量代碼。軟件開發(fā)是一個(gè)廣為人知的過程。開發(fā)者編寫代碼、查看代碼、編譯代碼和部署應(yīng)用程序、衡量應(yīng)用程序的性能并使用該數(shù)據(jù)改進(jìn)代碼,循環(huán)往復(fù)。然而,如果代碼一開始就不正確,那么所有這些過程都沒什么用,所以團(tuán)隊(duì)都會(huì)在新代碼添加到現(xiàn)有應(yīng)用程序代碼庫之前執(zhí)行代碼檢查,檢查邏輯、語法和樣式。即使對(duì)于像亞馬遜這樣的大型機(jī)構(gòu),考慮其每天要編寫的代碼量,也很難有那么多有經(jīng)驗(yàn)的開發(fā)者、他們有足夠的富余時(shí)間來審核代碼。而且即使是有經(jīng)驗(yàn)的審閱者遇到面向客戶的應(yīng)用程序時(shí)也會(huì)漏掉問題,從而導(dǎo)致出錯(cuò)和性能問題。
Amazon CodeGuru是一種新的機(jī)器學(xué)習(xí)服務(wù),可自動(dòng)執(zhí)行代碼審核,找到應(yīng)用程序開銷最大的代碼行。Amazon CodeGuru有兩個(gè)組件: 代碼審核和應(yīng)用程序分析。對(duì)于代碼審核,開發(fā)者像往常一樣提交其代碼(目前支持GitHub和CodeCommit,未來會(huì)支持更多的存儲(chǔ)庫),將Amazon CodeGuru添加為代碼審閱者之一,無需對(duì)正常過程或要安裝的軟件進(jìn)行其他更改。Amazon CodeGuru收到拉取請(qǐng)求,會(huì)自動(dòng)開始使用經(jīng)過預(yù)先訓(xùn)練的模型來評(píng)估代碼。這些模型已經(jīng)在亞馬遜和GitHub前10000的項(xiàng)目中經(jīng)受過數(shù)十年的代碼審核訓(xùn)練。Amazon CodeGuru將檢查代碼更改的質(zhì)量,如果發(fā)現(xiàn)問題,它將向拉取請(qǐng)求添加易于閱讀的注釋,標(biāo)識(shí)出代碼行、特定問題和修正建議,包括示例代碼和指向相關(guān)文檔的鏈接。
Amazon CodeGuru還包含一個(gè)機(jī)器學(xué)習(xí)驅(qū)動(dòng)的應(yīng)用程序探查器,可幫助客戶找到開銷最大的代碼行。要使用它,客戶只要在其應(yīng)用程序中安裝一個(gè)小小的代理程序,然后Amazon CodeGuru就可以觀察應(yīng)用程序運(yùn)行時(shí),每五分鐘分析一次應(yīng)用程序代碼。代碼配置文件包括有關(guān)延遲和CPU利用率的詳細(xì)信息,直接鏈接到特定的代碼行。Amazon CodeGuru可幫助操作者在應(yīng)用程序中找到開銷最大的代碼行,生成火焰圖,幫助直觀地標(biāo)識(shí)出造成性能瓶頸的其它代碼行。多年來,亞馬遜內(nèi)部團(tuán)隊(duì)使用Amazon CodeGuru對(duì)80000多個(gè)應(yīng)用程序進(jìn)行了代碼分析。2017 到2018年,Amazon CodeGuru內(nèi)部版本的廣泛使用,幫助亞馬遜消費(fèi)者業(yè)務(wù)的Amazon Prime Day團(tuán)隊(duì)提高了其應(yīng)用效率,CPU利用率提高325%,減少了管理Prime Day所需的實(shí)例數(shù)量,整體成本降低了39%。
Amazon Fraud Detector
Amazon Fraud Detector提供完全托管的服務(wù),基于亞馬遜消費(fèi)者業(yè)務(wù)使用的相同技術(shù),實(shí)時(shí)檢測(cè)潛在的線上身份欺詐和支付欺詐,無需機(jī)器學(xué)習(xí)經(jīng)驗(yàn)。Amazon Fraud Detector使用欺詐和合法交易的歷史數(shù)據(jù)來構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型,提供實(shí)時(shí)、低延遲的欺詐風(fēng)險(xiǎn)預(yù)測(cè)。首先,客戶將交易數(shù)據(jù)上傳到Amazon S3,定制模型訓(xùn)練??蛻糁恍杼峁┡c交易關(guān)聯(lián)的電子郵件地址和IP地址,可以選擇添加其它數(shù)據(jù)(例如帳單地址或電話號(hào)碼)。根據(jù)客戶想要預(yù)測(cè)的欺詐類型(新帳戶或線上支付欺詐),Amazon Fraud Detector將預(yù)處理數(shù)據(jù)、選擇一個(gè)算法、訓(xùn)練一個(gè)模型————使用亞馬遜數(shù)十年來大規(guī)模運(yùn)行欺詐檢測(cè)風(fēng)險(xiǎn)分析的經(jīng)驗(yàn)。Amazon Fraud Detector還使用基于機(jī)器學(xué)習(xí)的、根據(jù)亞馬遜數(shù)據(jù)訓(xùn)練過的數(shù)據(jù)檢測(cè)器。這些數(shù)據(jù)檢測(cè)器可幫助識(shí)別與發(fā)生在Amazon上的欺詐活動(dòng)(例如異常的電子郵件命名規(guī)律)相似的模式,即使客戶向Amazon Fraud Detector提供的欺詐示例數(shù)量很少,也可以幫助提高模型訓(xùn)練的準(zhǔn)確性。
Amazon Fraud Detector將模型訓(xùn)練、部署到完全托管的私有API端點(diǎn)??蛻艨梢詫⑿禄顒?dòng)(例如注冊(cè)或新購買)發(fā)送到API、接收包括風(fēng)險(xiǎn)評(píng)分的欺詐報(bào)告。根據(jù)此報(bào)告,應(yīng)用程序可以確定正確的行動(dòng)(例如接受購買,或?qū)⑵鋫鬟f給人工審核)。借助Amazon Fraud Detector,客戶可以更快、更輕松地、更準(zhǔn)確地檢測(cè)欺詐。
Amazon Transcribe Medical
如今,醫(yī)生們的一部分日常工作,是將詳細(xì)的數(shù)據(jù)輸入病歷(EHR)系統(tǒng)。然而,幫助他們準(zhǔn)確記錄和存檔病情的解決方案是欠佳的。在許多醫(yī)院,醫(yī)生必須將醫(yī)療筆記口述到記錄器中,然后將這些語音文件提交到第三方手動(dòng)抄錄,服務(wù)成本高昂,可能需要長達(dá)三個(gè)工作日,延誤了存檔流程。另一種選擇是利用現(xiàn)有的前端聽寫軟件,但受限于現(xiàn)有的工具,醫(yī)生們?nèi)匀幻刻煲谂R床記錄上花費(fèi)好幾小時(shí)。第三種選擇是醫(yī)療保健提供商雇用人工抄寫員,在醫(yī)生們看病時(shí)協(xié)助做記錄,但人工抄寫員可能會(huì)令患者感到不安,醫(yī)生們經(jīng)常提到他們的記錄有欠缺,醫(yī)療機(jī)構(gòu)也很難大規(guī)模地安排和協(xié)調(diào)抄寫員??傊?,現(xiàn)有的解決方案在提高臨床記錄效率和改善患者護(hù)理方面都有不足。
Amazon Transcribe Medical通過使用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)轉(zhuǎn)錄自然醫(yī)學(xué)語音來解決這些問題。建立在 Amazon Transcribe Medical語音到文本功能之上的病歷應(yīng)用,可以準(zhǔn)確、經(jīng)濟(jì)實(shí)惠地生成記錄。Amazon Transcribe Medical由多個(gè)機(jī)器學(xué)習(xí)模型組成,這些模型經(jīng)過數(shù)萬小時(shí)的醫(yī)學(xué)語音訓(xùn)練,可提供準(zhǔn)確的、機(jī)器學(xué)習(xí)驅(qū)動(dòng)的醫(yī)學(xué)轉(zhuǎn)錄。實(shí)時(shí)生成記錄,消除了多日的流轉(zhuǎn)時(shí)間。
Amazon Transcribe Medical可以幫助醫(yī)生們?cè)诟颊邷贤〞r(shí)自動(dòng)轉(zhuǎn)錄對(duì)話,不用分心手動(dòng)筆記,醫(yī)療保健提供商能夠?qū)W⒂诨颊咦o(hù)理。醫(yī)生可以自然地說話,Amazon Transcribe Medical使用內(nèi)置的自動(dòng)標(biāo)點(diǎn)符號(hào),克服現(xiàn)有轉(zhuǎn)錄軟件的局限性。對(duì)于醫(yī)療保健提供商,基于Amazon Transcribe Medical的語音解決方案可擴(kuò)展到數(shù)千個(gè)潛在的醫(yī)療中心,消除了管理和協(xié)調(diào)臨時(shí)抄寫員的操作難題。Amazon Transcribe Medical符合HIPAA認(rèn)證,提供易于使用的 API,可與支持語音的應(yīng)用程序和帶有麥克風(fēng)的任何設(shè)備集成。Amazon Transcribe Medical的輸出文本也可以用于其他AWS服務(wù),例如自然語言處理服務(wù)Amazon Comprehend Medical,在最終進(jìn)入病歷系統(tǒng)前進(jìn)行下一步的數(shù)據(jù)分析。
Amazon Augmented Artificial Intelligence (A2I)
機(jī)器學(xué)習(xí)可以為各種應(yīng)用場(chǎng)景提供高度準(zhǔn)確的預(yù)測(cè),包括識(shí)別圖像中的對(duì)象、從掃描的文檔中提取文本、或者轉(zhuǎn)錄與理解口語。在每種情況下,機(jī)器學(xué)習(xí)模型都會(huì)提供預(yù)測(cè),提供置信度分?jǐn)?shù)以表示模型預(yù)測(cè)的確定性。置信度分?jǐn)?shù)越高,結(jié)果的可信度就越高。對(duì)于許多應(yīng)用場(chǎng)景,當(dāng)開發(fā)者收到高置信度結(jié)果時(shí),他們可以信任其結(jié)果可能是準(zhǔn)確的,可以自動(dòng)處理它們(例如,自動(dòng)調(diào)整社交網(wǎng)絡(luò)上用戶生成的內(nèi)容,或者給視頻加字幕)。但是,在置信度低于預(yù)期的情況下,預(yù)測(cè)結(jié)果模糊,可能需要人工審核才能解決這種模糊性。機(jī)器學(xué)習(xí)和人工審閱之間的這種相互作用,對(duì)于機(jī)器學(xué)習(xí)系統(tǒng)的成功至關(guān)重要,但人工審核的大規(guī)模構(gòu)建和運(yùn)營,很有挑戰(zhàn),成本高昂,通常涉及多個(gè)流程步驟,需要定制軟件管理人工審核任務(wù)和結(jié)果,需要招聘和管理大量審核人員。結(jié)果,開發(fā)者時(shí)常花費(fèi)大量的時(shí)間來管理人工審核過程,而不是構(gòu)建其預(yù)想的應(yīng)用程序,或者不得不放棄人工審核,導(dǎo)致許多預(yù)測(cè)的信心和效用都很低。
Amazon Augmented Artificial Intelligence (A2I) 是一項(xiàng)新服務(wù),使用它很容易構(gòu)建和管理機(jī)器學(xué)習(xí)應(yīng)用程序的人工審核。Amazon A2I為常見的機(jī)器學(xué)習(xí)任務(wù)——例如圖像中的對(duì)象檢測(cè)、語音轉(zhuǎn)錄和內(nèi)容審核——提供預(yù)構(gòu)建的人工審核工作流,方便對(duì)來自Amazon Rekognition和Amazon Textract的機(jī)器學(xué)習(xí)預(yù)測(cè)做人工審核。開發(fā)者為其特定應(yīng)用程序選擇置信閾值,所有置信度分?jǐn)?shù)低于閾值的預(yù)測(cè)都將自動(dòng)發(fā)送給人工審核人員進(jìn)行驗(yàn)證。開發(fā)者可以選擇Amazon Mechanical Turk的50萬全球人工、預(yù)授權(quán)人工的第三方機(jī)構(gòu)如Startek、iVision、CapeStart、Cogito和iMerit、或他們自己的審核人員執(zhí)行其審核。審核結(jié)果存儲(chǔ)在Amazon S3中,開發(fā)者在審核完成后會(huì)收到通知,以便他們根據(jù)審核人員的可信結(jié)果進(jìn)行下一步操作。Amazon A2I為所有開發(fā)者帶來了人工審核,消除了構(gòu)建和管理定制審核流程或招募大量審核人員方面的繁重工作。
截至目前,AWS提供超過175項(xiàng)全功能的服務(wù),涵蓋計(jì)算、存儲(chǔ)、數(shù)據(jù)庫、聯(lián)網(wǎng)、分析、機(jī)器人、機(jī)器學(xué)習(xí)與人工智能、物聯(lián)網(wǎng)、移動(dòng)、安全、混合云、虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)、媒體,以及應(yīng)用開發(fā)、部署與管理等方面,遍及22個(gè)地理區(qū)域的69個(gè)可用區(qū)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )