擠爆了,簡直要被大模型公司們給擠爆了。
來感受一下這個feel:
毫不夸張地說,國內(nèi)外叫得上來的大模型公司基本上都來了——
Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智譜AI、百川、MiniMax……
到底是什么樣的事情能讓它們紛紛聚集到了一起?
不賣關(guān)子,這正是“云計算一哥”亞馬遜云科技所舉辦的中國峰會,整場活動的關(guān)鍵詞就是大熱的生成式AI。
不過有一說一,自打AIGC大戰(zhàn)開局以來,全球科技巨頭如谷歌、微軟、OpenAI等一直呈現(xiàn)出你追我趕的態(tài)勢。
而亞馬遜云科技的“出鏡率”似乎并沒有它們那么高,但這場活動又為何會引來如此多的廠商和圍觀群眾?
其實在深入了解和體驗一番之后,我們不難發(fā)現(xiàn),亞馬遜云科技在AIGC這件事上已然是“全棧+全能”的狀態(tài)了。
已經(jīng)可以上崗的AIGC應(yīng)用
之所以說是全棧,是因為亞馬遜云科技的能力已經(jīng)覆蓋到了生成式AI最為關(guān)鍵的三大層面,即:
算力層:用于基礎(chǔ)模型訓(xùn)練和推理的基礎(chǔ)設(shè)施
模型層:使用基礎(chǔ)模型加速生成式AI應(yīng)用構(gòu)建
應(yīng)用層:開箱即用的生成式AI應(yīng)用
至于能力如何,我們直接來看下最為直觀的效果。
在生成式AI應(yīng)用方面,亞馬遜云科技面向企業(yè)和開發(fā)人員所推出的是生成式AI助手——Amazon Q。
它相當(dāng)于給企業(yè)配備了一個量身定制的AI專家,可以根據(jù)企業(yè)既有的人員、角色和權(quán)限對每個用戶交互進行個性化的定制。
例如用上Amazon Q Developer(開發(fā)者版),編程這件事就只需簡單的“點點點”和“提要求”。
以功能開發(fā)和代碼轉(zhuǎn)換為例,開發(fā)者只需要向Amazon Q描述想要的新功能即可,然后它就能自己進行規(guī)劃、執(zhí)行和迭代:
而且Amazon Q還會根據(jù)任務(wù)的內(nèi)容,動態(tài)地分配最合適的大模型,讓性能做到Pro Max。
再如Amazon Q Business(企業(yè)版),同樣也是只需要簡單的語言輸入,就能幫助員工簡化任務(wù)、加速決策。
例如員工可以根據(jù)公司已有但分散的數(shù)據(jù)信息,讓Amazon Q來做整理和分析的工作,從而給員工答疑解惑、增加工作效率:
諸如整合分析、撰寫報告和制作PPT文稿等工作也是不在話下:
除此之外,亞馬遜云科技為了讓提高效率這事更上一層樓,還推出了Amazon Q Apps,它是Amazon Q Business中的一項功能,可以讓員工能夠迅速且安全的基于企業(yè)信息創(chuàng)建、分享應(yīng)用程序。
而且Amazon Q Apps是無需任何編程經(jīng)驗、可以基于歷史對話、自動化的那種。
例如一個HR如果要創(chuàng)建一個新人的入職30天計劃,就只需要向Amazon Q Apps“喂”員工姓名和工號即可。
而整個過程,也只需要短短幾秒鐘的時間!
在數(shù)據(jù)分析處理方面,亞馬遜云科技則是將Amazon Q集成到了QuickSight中。
以往生成一個商業(yè)智能儀表盤可能需要數(shù)個小時的時間,但現(xiàn)在,幾分鐘就可以搞定了。
而且所有員工都可以根據(jù)這樣可視化的數(shù)據(jù)內(nèi)容,向Amazon Q提出自己的問題,讓復(fù)雜的數(shù)據(jù)分析任務(wù)變得簡單且高效。
總而言之,縱觀Amazon Q的效果和能力,亞馬遜云科技主打的就是用生成式AI的力量把繁瑣復(fù)雜的工作任務(wù)變得簡單,簡單,再簡單。
但Amazon Q之所以能在企業(yè)場景做到如此方方面面且絲滑,離不開背后大模型的能力。
不會有一個大模型一統(tǒng)天下
亞馬遜云科技的大模型能力對外輸出,主要依靠處于模型層的Amazon Bedrock。
它是亞馬遜云科技正式加入大模型浪潮競爭的標志,也是亞馬遜云科技和微軟OpenAI正面硬剛的關(guān)鍵。
基于Bedrock打造的生成式AI應(yīng)用,已經(jīng)多達數(shù)十種,讓人看得眼花繚亂。
簡單理解,Bedrock是一個集成了多種先進AI大模型的平臺,只需單個API,就可以提供包括Claude、Mistral、Llama、Stable Diffusion、自研Titan系列在內(nèi)30個模型的能力。通過提供預(yù)訓(xùn)練、微調(diào)、知識庫、RAG、模型評估等功能,能夠靈活定制大模型或應(yīng)用。
亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松在峰會上表示,亞馬遜云科技一直認為“不會有一個模型一統(tǒng)天下”,企業(yè)有從多個大模型中做選擇的權(quán)力。
因此,在Bedrock上被放置了數(shù)十個業(yè)界領(lǐng)先的大模型供企業(yè)選擇。包括和GPT-4并駕齊驅(qū)的Claude 3、主打開源的Llama系列和Mistral AI、以及圖像生成方面的Stable Diffusion。
同時還包括亞馬遜云科技自研的Titan系列,目前已陸續(xù)推出7個模型,能力范圍包括文本摘要檢索生成、圖像生成、RAG、思維鏈、問答、搜索、個性化、推薦等。
具體能力上,Bedrock重點關(guān)注4個方面:
豐富靈活的模型選擇
輕松定制模型
簡化AI應(yīng)用集成
保障隱私安全
最首要的,構(gòu)建生成式AI應(yīng)用關(guān)鍵的一步是找到合適的模型。
Bedrock提供了業(yè)內(nèi)最廣泛的模型選擇,并推出Model Evaluation功能,支持企業(yè)快速分析和比較不同模型。
一般需要企業(yè)先給出評估標準,比如對準確性、魯棒性的要求,并上傳自有數(shù)據(jù)集/提示詞庫,或者從Bedrock內(nèi)置的、公開可用的資源中選擇。一些主觀或需要細致判斷的的評判內(nèi)容,平臺會引入人工審核,根據(jù)特定應(yīng)用場景的指標進行評估。
完成設(shè)置后,Bedrock便可開始評估并生成報告,最短僅需幾個小時,企業(yè)就能找到適合自己的模型。
在選擇好模型后,企業(yè)可利用專有數(shù)據(jù),通過RAG、提示詞工程或微調(diào)來定制對應(yīng)大模型功能,以創(chuàng)建私有模型。
比如針對Command R、Llama 3、Titan Text Lite等模型,只需簡單幾步即可進行微調(diào)。如果選擇了Titan Text模型,還能對未標記的數(shù)據(jù)持續(xù)預(yù)訓(xùn)練,以更適應(yīng)對應(yīng)行業(yè)和領(lǐng)域。
Bedrock知識庫可自動執(zhí)行完整的RAG工作流程,包括攝取、檢索、提示詞增強和引用。
同時,Bedrock還推出了自定義模型導(dǎo)入(Custom Model Import)功能。企業(yè)現(xiàn)在能將自己定制模型導(dǎo)入到Bedrock中,以完全托管的API形式進行訪問。由此,自定義模型可以方便地被集成到現(xiàn)有應(yīng)用程序和工作流中,并同樣得到隱私安全保護。
目前Bedrock專有模型導(dǎo)入功能已推出預(yù)覽版并支持Flan-T5、Llama和Mistral三種開放模型架構(gòu)。
模型推理方面,Bedrock Batch支持有效執(zhí)行大量數(shù)據(jù)的模型推理任務(wù),可在大規(guī)模推理任務(wù)中避免限流問題,無需編寫代碼即可處理故障并重啟,適用于基礎(chǔ)模型及用戶自定義模型。
AI應(yīng)用層面,Bedrock Agents功能支持構(gòu)建基于企業(yè)系統(tǒng)和數(shù)據(jù)來執(zhí)行任務(wù)的Agent。使生成式AI應(yīng)用能夠使用自然語言來執(zhí)行多步驟的業(yè)務(wù)任務(wù)。
包括利用LLM使用自然語言進行交互和相應(yīng);任務(wù)拆分和編排;通過動態(tài)調(diào)用API完成任務(wù)執(zhí)行;追蹤基礎(chǔ)大模型思維鏈流程并優(yōu)化底層Agent的提示工程。
比如使用Bedrock構(gòu)建一個AI造型師,效果大概會是醬嬸兒的。
最后在安全隱私保障方面。Bedrock的Guardrails功能在基礎(chǔ)模型的原生能力之上提供了安全保護,可阻擋85%有害內(nèi)容。
企業(yè)只需通過自然語言來定義不予顯示的內(nèi)容,就能快速創(chuàng)建一個Guardrail。同時還可設(shè)置閾值以過濾帶有仇恨羞辱、暴力、攻擊性等內(nèi)容,并移除任何個人信息和敏感信息。
這一功能可用于Bedrock上的所有大模型,并且能與微調(diào)、Agent功能結(jié)合使用。
總結(jié)來看,Bedrock以企業(yè)定制大模型為出發(fā)點,提供模型選擇、定制、應(yīng)用開發(fā)、安全保障等一系列功能,使各行各業(yè)能更加簡單方便用上大模型。
在正式推出1年之后,Bedrock為亞馬遜云科技帶來的增長和影響已經(jīng)在具體數(shù)據(jù)直觀體現(xiàn):
亞馬遜2024年第一季度財報顯示,亞馬遜云科技收入連續(xù)兩季度加速增長,運營利潤率創(chuàng)下歷史新高,達到37.6%。
為啥能增長如此迅速?亞馬遜云科技的最強基本盤——算力基礎(chǔ)設(shè)施,為其提供了最關(guān)鍵的保障。
還有“云計算一哥”的看家本領(lǐng)
基礎(chǔ)設(shè)施一直都是亞馬遜云科技的強項。
2023年第四季度數(shù)據(jù)顯示,亞馬遜云科技依舊是“云市場一哥”,擁有全球31%市場份額。
全球1000家獨角獸中,超過80%都使用亞馬遜云。目前亞馬遜云科技的年化收入已經(jīng)超過1000億美元,并且還在以17%的增長率增長。
在前大模型時代,亞馬遜云科技構(gòu)建了服務(wù)全球245個國家和地區(qū)的基礎(chǔ)設(shè)施建設(shè)、超過200大類的云服務(wù),過去十余年中已服務(wù)全球數(shù)百萬客戶。
其底層算力構(gòu)成主要由兩部分構(gòu)成,可以為企業(yè)提供高性能、高性價比、低功耗的算力選擇:
和英偉達密切合作
持續(xù)投入自研芯片
一方面,亞馬遜云科技和英偉達的合作已經(jīng)長達13年,二者保持長期的戰(zhàn)略合作關(guān)系,曾共同推出了世界上第一個GPU Cloud實例。
在披露的最新進展中,亞馬遜云科技將推出基于英偉達最新一代Blackwell架構(gòu)GPU的Amazon EC2(Amazon Elastic Compute Cloud),以加速構(gòu)建及運行數(shù)萬億參數(shù)大模型的性能。
同時將提供首款搭載英偉達Grace Hopper超級芯片的云AI超級計算機,以及首款采用英偉達GH200 NVL32的NVIDIA DGX Cloud。
另一方面,在算力瓶頸愈加明顯的環(huán)境下,亞馬遜在很早期便開始自研芯片。
2019年亞馬遜云科技推出了高性能機器學(xué)習(xí)推理芯片Inferentia,2020年底又推出了定制機器學(xué)習(xí)訓(xùn)練芯片Trainium。
目前最新一代用于AI訓(xùn)練的Trainium 2可支持千億、萬億級參數(shù)大模型訓(xùn)練。與上一代相比,其訓(xùn)練性能提高4倍,能效功耗比提高2倍,內(nèi)存增加3倍。
一個Amazon EC2可部署多達16個Trainium 2,相較于部署同類芯片的EC2,部署Trainium 2的可節(jié)省50%訓(xùn)練成本。
用于AI推理的Inferentia 2專門針對千億參數(shù)大模型進行優(yōu)化,與上一代相比,計算性能提高3倍,內(nèi)存擴大4倍,吞吐量提高了4倍,延遲降低至1/10,并可支持大模型分布推理。
Inferentia 2是Amazon EC2中首個推理優(yōu)化實例,可通過加速器之間的超高速鏈接支持橫向擴展分布式推理。
搭配SageMaker Hyperpod和SageMaker Jumpstart, 可進一步加速基礎(chǔ)模型推理與訓(xùn)練。
前者可簡化大模型基礎(chǔ)訓(xùn)練的過程,后者則提供了一個機器學(xué)習(xí)中心,通過提供一系列基礎(chǔ)模型,讓用戶無需自己從頭構(gòu)建和訓(xùn)練模型,進行快速訓(xùn)練和部署。
現(xiàn)在亞馬遜云科技還在不斷拓展中國區(qū)域SageMaker Jumpstart中的基礎(chǔ)模型種類,引入領(lǐng)先的中文基礎(chǔ)模型。亞馬遜云科技在中國峰會2024上宣布,由百川智能提供的基礎(chǔ)模型Baichuan2-7B即將登陸中國區(qū)域SageMaker JumpStart,由零一萬物提供的基礎(chǔ)模型Yi-1.5 6B/9B/34B正式登陸中國區(qū)域SageMaker JumpStart,在為中國企業(yè)提供豐富模型選擇的同時滿足了企業(yè)對安全合規(guī)、快速擴展、免運維的需求。
作為首批登陸中國區(qū)域SageMaker JumpStart的中文基礎(chǔ)模型,Baichuan2和Yi-1.5與亞馬遜云科技托管服務(wù)深度集成,助力中國企業(yè)應(yīng)用一流的生成式AI技術(shù)實現(xiàn)本土創(chuàng)新與業(yè)務(wù)轉(zhuǎn)型。
如上多個方面,共同構(gòu)成了亞馬遜云科技的底層算力建設(shè),更為其生成式AI全棧架構(gòu)提供扎實底座。
在生成式AI大潮下,亞馬遜云科技提出,未來真正能創(chuàng)造最大價值的將是生成式 AI 的行業(yè)應(yīng)用。如金山辦公、沐瞳科技、涂鴉智能、禮來科技等擁抱大模型的廠商都選擇與亞馬遜云科技合作。
其中,禮來制藥是一家全球跨國藥企。去年開始,他們重點布局打造以生成式AI為核心的AI基礎(chǔ)能力?;趤嗰R遜云科技提供的生成式AI云服務(wù),他們快速打造了員工聊天問答機器人、醫(yī)學(xué)文獻引用驗證、競品及市場推廣分析、基于醫(yī)學(xué)內(nèi)容的FAQ生成。
實際上,這也是亞馬遜云科技一直以來強調(diào)的路線與理念。
他們提出,企業(yè)應(yīng)用是行業(yè)應(yīng)用未被泛化的一個個實例。
而亞馬遜云科技當(dāng)下要做的,就是成為企業(yè)構(gòu)建和應(yīng)用生成式AI的首選,以推動各個行業(yè)真正意義上擁抱生成式AI大潮。
從宏大遠景到具體行動,亞馬遜云科技的生成式AI戰(zhàn)略已然全盤托出。
那么當(dāng)下,也就到了重新審視亞馬遜云科技的時刻。
AIGC時代,如何評價亞馬遜云科技?
首先,不論是大模型時代的當(dāng)下還是此前的傳統(tǒng)AI時代,一切的一切都繞不開算力這個核心關(guān)鍵點。
而亞馬遜云科技早早發(fā)力于云計算領(lǐng)域,已然在全球范圍內(nèi)處于公認的“云計算一哥”的位置。
加之與英偉達的密切合作,亞馬遜云科技無疑是在Scaling Law為主旋律的當(dāng)下妥妥的算力大玩家。
其次,在模型層面上的戰(zhàn)略,亞馬遜云科技走的是一條“集大成者”的路線——當(dāng)下每個大模型都各自擅長的能力,將它們集成到一起,方便客戶選用。
也正如儲瑞松在這次Keynote中所述:
大模型已不再是企業(yè)生成式AI創(chuàng)新的唯一要素;企業(yè)在確定生成式AI場景之后,需要根據(jù)自身的要求選擇合適的大模型。
不同的模型在應(yīng)用過程中所擅長的領(lǐng)域是不同的,要最大發(fā)揮生成式AI的能力,需要將它們結(jié)合起來產(chǎn)生復(fù)合效應(yīng),從而提高系統(tǒng)整體的智力水平。
正是基于這樣的一個思路,在更上層的應(yīng)用方面,諸如Amazon Q這樣的應(yīng)用才能做到“多、快、好、省”地上崗諸多領(lǐng)域。
而這也是符合當(dāng)下“應(yīng)用為王”的大趨勢。
總而言之,有算力、有模型、有應(yīng)用、有市場,亞馬遜云科技絕對是AIGC時代不容小覷的巨頭之一。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。