16家頭部大模型公司上海神秘碰頭,現(xiàn)場人擠人人人

擠爆了,簡直要被大模型公司們給擠爆了。

來感受一下這個feel:

毫不夸張地說,國內(nèi)外叫得上來的大模型公司基本上都來了——

Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智譜AI、百川、MiniMax……

到底是什么樣的事情能讓它們紛紛聚集到了一起?

不賣關子,這正是“云計算一哥”亞馬遜云科技所舉辦的中國峰會,整場活動的關鍵詞就是大熱的生成式AI。

不過有一說一,自打AIGC大戰(zhàn)開局以來,全球科技巨頭如谷歌、微軟、OpenAI等一直呈現(xiàn)出你追我趕的態(tài)勢。

而亞馬遜云科技的“出鏡率”似乎并沒有它們那么高,但這場活動又為何會引來如此多的廠商和圍觀群眾?

其實在深入了解和體驗一番之后,我們不難發(fā)現(xiàn),亞馬遜云科技在AIGC這件事上已然是“全棧+全能”的狀態(tài)了。

已經(jīng)可以上崗的AIGC應用

之所以說是全棧,是因為亞馬遜云科技的能力已經(jīng)覆蓋到了生成式AI最為關鍵的三大層面,即:

算力層:用于基礎模型訓練和推理的基礎設施

模型層:使用基礎模型加速生成式AI應用構(gòu)建

應用層:開箱即用的生成式AI應用

至于能力如何,我們直接來看下最為直觀的效果。

在生成式AI應用方面,亞馬遜云科技面向企業(yè)和開發(fā)人員所推出的是生成式AI助手——Amazon Q。

它相當于給企業(yè)配備了一個量身定制的AI專家,可以根據(jù)企業(yè)既有的人員、角色和權限對每個用戶交互進行個性化的定制。

例如用上Amazon Q Developer(開發(fā)者版),編程這件事就只需簡單的“點點點”和“提要求”。

以功能開發(fā)和代碼轉(zhuǎn)換為例,開發(fā)者只需要向Amazon Q描述想要的新功能即可,然后它就能自己進行規(guī)劃、執(zhí)行和迭代:

而且Amazon Q還會根據(jù)任務的內(nèi)容,動態(tài)地分配最合適的大模型,讓性能做到Pro Max。

再如Amazon Q Business(企業(yè)版),同樣也是只需要簡單的語言輸入,就能幫助員工簡化任務、加速決策。

例如員工可以根據(jù)公司已有但分散的數(shù)據(jù)信息,讓Amazon Q來做整理和分析的工作,從而給員工答疑解惑、增加工作效率:

諸如整合分析、撰寫報告和制作PPT文稿等工作也是不在話下:

除此之外,亞馬遜云科技為了讓提高效率這事更上一層樓,還推出了Amazon Q Apps,它是Amazon Q Business中的一項功能,可以讓員工能夠迅速且安全的基于企業(yè)信息創(chuàng)建、分享應用程序。

而且Amazon Q Apps是無需任何編程經(jīng)驗、可以基于歷史對話、自動化的那種。

例如一個HR如果要創(chuàng)建一個新人的入職30天計劃,就只需要向Amazon Q Apps“喂”員工姓名和工號即可。

而整個過程,也只需要短短幾秒鐘的時間!

數(shù)據(jù)分析處理方面,亞馬遜云科技則是將Amazon Q集成到了QuickSight中。

以往生成一個商業(yè)智能儀表盤可能需要數(shù)個小時的時間,但現(xiàn)在,幾分鐘就可以搞定了。

而且所有員工都可以根據(jù)這樣可視化的數(shù)據(jù)內(nèi)容,向Amazon Q提出自己的問題,讓復雜的數(shù)據(jù)分析任務變得簡單且高效。

總而言之,縱觀Amazon Q的效果和能力,亞馬遜云科技主打的就是用生成式AI的力量把繁瑣復雜的工作任務變得簡單,簡單,再簡單。

但Amazon Q之所以能在企業(yè)場景做到如此方方面面且絲滑,離不開背后大模型的能力。

不會有一個大模型一統(tǒng)天下

亞馬遜云科技的大模型能力對外輸出,主要依靠處于模型層的Amazon Bedrock

它是亞馬遜云科技正式加入大模型浪潮競爭的標志,也是亞馬遜云科技和微軟OpenAI正面硬剛的關鍵。

基于Bedrock打造的生成式AI應用,已經(jīng)多達數(shù)十種,讓人看得眼花繚亂。

簡單理解,Bedrock是一個集成了多種先進AI大模型的平臺,只需單個API,就可以提供包括Claude、Mistral、Llama、Stable Diffusion、自研Titan系列在內(nèi)30個模型的能力。通過提供預訓練、微調(diào)、知識庫、RAG、模型評估等功能,能夠靈活定制大模型或應用。

亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松在峰會上表示,亞馬遜云科技一直認為“不會有一個模型一統(tǒng)天下”,企業(yè)有從多個大模型中做選擇的權力。

因此,在Bedrock上被放置了數(shù)十個業(yè)界領先的大模型供企業(yè)選擇。包括和GPT-4并駕齊驅(qū)的Claude 3、主打開源的Llama系列Mistral AI、以及圖像生成方面的Stable Diffusion。

同時還包括亞馬遜云科技自研的Titan系列,目前已陸續(xù)推出7個模型,能力范圍包括文本摘要檢索生成、圖像生成、RAG、思維鏈、問答、搜索、個性化、推薦等。

具體能力上,Bedrock重點關注4個方面:

豐富靈活的模型選擇

輕松定制模型

簡化AI應用集成

保障隱私安全

最首要的,構(gòu)建生成式AI應用關鍵的一步是找到合適的模型。

Bedrock提供了業(yè)內(nèi)最廣泛的模型選擇,并推出Model Evaluation功能,支持企業(yè)快速分析和比較不同模型。

一般需要企業(yè)先給出評估標準,比如對準確性、魯棒性的要求,并上傳自有數(shù)據(jù)集/提示詞庫,或者從Bedrock內(nèi)置的、公開可用的資源中選擇。一些主觀或需要細致判斷的的評判內(nèi)容,平臺會引入人工審核,根據(jù)特定應用場景的指標進行評估。

完成設置后,Bedrock便可開始評估并生成報告,最短僅需幾個小時,企業(yè)就能找到適合自己的模型。

在選擇好模型后,企業(yè)可利用專有數(shù)據(jù),通過RAG、提示詞工程或微調(diào)來定制對應大模型功能,以創(chuàng)建私有模型。

比如針對Command R、Llama 3、Titan Text Lite等模型,只需簡單幾步即可進行微調(diào)。如果選擇了Titan Text模型,還能對未標記的數(shù)據(jù)持續(xù)預訓練,以更適應對應行業(yè)和領域。

Bedrock知識庫可自動執(zhí)行完整的RAG工作流程,包括攝取、檢索、提示詞增強和引用。

同時,Bedrock還推出了自定義模型導入(Custom Model Import)功能。企業(yè)現(xiàn)在能將自己定制模型導入到Bedrock中,以完全托管的API形式進行訪問。由此,自定義模型可以方便地被集成到現(xiàn)有應用程序和工作流中,并同樣得到隱私安全保護。

目前Bedrock專有模型導入功能已推出預覽版并支持Flan-T5、Llama和Mistral三種開放模型架構(gòu)。

模型推理方面,Bedrock Batch支持有效執(zhí)行大量數(shù)據(jù)的模型推理任務,可在大規(guī)模推理任務中避免限流問題,無需編寫代碼即可處理故障并重啟,適用于基礎模型及用戶自定義模型。

AI應用層面,Bedrock Agents功能支持構(gòu)建基于企業(yè)系統(tǒng)和數(shù)據(jù)來執(zhí)行任務的Agent。使生成式AI應用能夠使用自然語言來執(zhí)行多步驟的業(yè)務任務。

包括利用LLM使用自然語言進行交互和相應;任務拆分和編排;通過動態(tài)調(diào)用API完成任務執(zhí)行;追蹤基礎大模型思維鏈流程并優(yōu)化底層Agent的提示工程。

比如使用Bedrock構(gòu)建一個AI造型師,效果大概會是醬嬸兒的。

最后在安全隱私保障方面。Bedrock的Guardrails功能在基礎模型的原生能力之上提供了安全保護,可阻擋85%有害內(nèi)容。

企業(yè)只需通過自然語言來定義不予顯示的內(nèi)容,就能快速創(chuàng)建一個Guardrail。同時還可設置閾值以過濾帶有仇恨羞辱、暴力、攻擊性等內(nèi)容,并移除任何個人信息和敏感信息。

這一功能可用于Bedrock上的所有大模型,并且能與微調(diào)、Agent功能結(jié)合使用。

總結(jié)來看,Bedrock以企業(yè)定制大模型為出發(fā)點,提供模型選擇、定制、應用開發(fā)、安全保障等一系列功能,使各行各業(yè)能更加簡單方便用上大模型。

在正式推出1年之后,Bedrock為亞馬遜云科技帶來的增長和影響已經(jīng)在具體數(shù)據(jù)直觀體現(xiàn):

亞馬遜2024年第一季度財報顯示,亞馬遜云科技收入連續(xù)兩季度加速增長,運營利潤率創(chuàng)下歷史新高,達到37.6%。

為啥能增長如此迅速?亞馬遜云科技的最強基本盤——算力基礎設施,為其提供了最關鍵的保障。

還有“云計算一哥”的看家本領

基礎設施一直都是亞馬遜云科技的強項。

2023年第四季度數(shù)據(jù)顯示,亞馬遜云科技依舊是“云市場一哥”,擁有全球31%市場份額。

全球1000家獨角獸中,超過80%都使用亞馬遜云。目前亞馬遜云科技的年化收入已經(jīng)超過1000億美元,并且還在以17%的增長率增長。

在前大模型時代,亞馬遜云科技構(gòu)建了服務全球245個國家和地區(qū)的基礎設施建設、超過200大類的云服務,過去十余年中已服務全球數(shù)百萬客戶。

其底層算力構(gòu)成主要由兩部分構(gòu)成,可以為企業(yè)提供高性能、高性價比、低功耗的算力選擇:

和英偉達密切合作

持續(xù)投入自研芯片

一方面,亞馬遜云科技和英偉達的合作已經(jīng)長達13年,二者保持長期的戰(zhàn)略合作關系,曾共同推出了世界上第一個GPU Cloud實例。

在披露的最新進展中,亞馬遜云科技將推出基于英偉達最新一代Blackwell架構(gòu)GPU的Amazon EC2(Amazon Elastic Compute Cloud),以加速構(gòu)建及運行數(shù)萬億參數(shù)大模型的性能。

同時將提供首款搭載英偉達Grace Hopper超級芯片的云AI超級計算機,以及首款采用英偉達GH200 NVL32的NVIDIA DGX Cloud。

另一方面,在算力瓶頸愈加明顯的環(huán)境下,亞馬遜在很早期便開始自研芯片。

2019年亞馬遜云科技推出了高性能機器學習推理芯片Inferentia,2020年底又推出了定制機器學習訓練芯片Trainium。

目前最新一代用于AI訓練的Trainium 2可支持千億、萬億級參數(shù)大模型訓練。與上一代相比,其訓練性能提高4倍,能效功耗比提高2倍,內(nèi)存增加3倍。

一個Amazon EC2可部署多達16個Trainium 2,相較于部署同類芯片的EC2,部署Trainium 2的可節(jié)省50%訓練成本。

用于AI推理的Inferentia 2專門針對千億參數(shù)大模型進行優(yōu)化,與上一代相比,計算性能提高3倍,內(nèi)存擴大4倍,吞吐量提高了4倍,延遲降低至1/10,并可支持大模型分布推理。

Inferentia 2是Amazon EC2中首個推理優(yōu)化實例,可通過加速器之間的超高速鏈接支持橫向擴展分布式推理。

搭配SageMaker HyperpodSageMaker Jumpstart, 可進一步加速基礎模型推理與訓練。

前者可簡化大模型基礎訓練的過程,后者則提供了一個機器學習中心,通過提供一系列基礎模型,讓用戶無需自己從頭構(gòu)建和訓練模型,進行快速訓練和部署。

現(xiàn)在亞馬遜云科技還在不斷拓展中國區(qū)域SageMaker Jumpstart中的基礎模型種類,引入領先的中文基礎模型。亞馬遜云科技在中國峰會2024上宣布,由百川智能提供的基礎模型Baichuan2-7B即將登陸中國區(qū)域SageMaker JumpStart,由零一萬物提供的基礎模型Yi-1.5 6B/9B/34B正式登陸中國區(qū)域SageMaker JumpStart,在為中國企業(yè)提供豐富模型選擇的同時滿足了企業(yè)對安全合規(guī)、快速擴展、免運維的需求。

作為首批登陸中國區(qū)域SageMaker JumpStart的中文基礎模型,Baichuan2和Yi-1.5與亞馬遜云科技托管服務深度集成,助力中國企業(yè)應用一流的生成式AI技術實現(xiàn)本土創(chuàng)新與業(yè)務轉(zhuǎn)型。

如上多個方面,共同構(gòu)成了亞馬遜云科技的底層算力建設,更為其生成式AI全棧架構(gòu)提供扎實底座。

在生成式AI大潮下,亞馬遜云科技提出,未來真正能創(chuàng)造最大價值的將是生成式 AI 的行業(yè)應用。如金山辦公、沐瞳科技、涂鴉智能、禮來科技等擁抱大模型的廠商都選擇與亞馬遜云科技合作。

其中,禮來制藥是一家全球跨國藥企。去年開始,他們重點布局打造以生成式AI為核心的AI基礎能力。基于亞馬遜云科技提供的生成式AI云服務,他們快速打造了員工聊天問答機器人、醫(yī)學文獻引用驗證、競品及市場推廣分析、基于醫(yī)學內(nèi)容的FAQ生成。

實際上,這也是亞馬遜云科技一直以來強調(diào)的路線與理念。

他們提出,企業(yè)應用是行業(yè)應用未被泛化的一個個實例。

而亞馬遜云科技當下要做的,就是成為企業(yè)構(gòu)建和應用生成式AI的首選,以推動各個行業(yè)真正意義上擁抱生成式AI大潮。

從宏大遠景到具體行動,亞馬遜云科技的生成式AI戰(zhàn)略已然全盤托出。

那么當下,也就到了重新審視亞馬遜云科技的時刻。

AIGC時代,如何評價亞馬遜云科技?

首先,不論是大模型時代的當下還是此前的傳統(tǒng)AI時代,一切的一切都繞不開算力這個核心關鍵點。

而亞馬遜云科技早早發(fā)力于云計算領域,已然在全球范圍內(nèi)處于公認的“云計算一哥”的位置。

加之與英偉達的密切合作,亞馬遜云科技無疑是在Scaling Law為主旋律的當下妥妥的算力大玩家。

其次,在模型層面上的戰(zhàn)略,亞馬遜云科技走的是一條“集大成者”的路線——當下每個大模型都各自擅長的能力,將它們集成到一起,方便客戶選用。

也正如儲瑞松在這次Keynote中所述:

大模型已不再是企業(yè)生成式AI創(chuàng)新的唯一要素;企業(yè)在確定生成式AI場景之后,需要根據(jù)自身的要求選擇合適的大模型。

不同的模型在應用過程中所擅長的領域是不同的,要最大發(fā)揮生成式AI的能力,需要將它們結(jié)合起來產(chǎn)生復合效應,從而提高系統(tǒng)整體的智力水平。

正是基于這樣的一個思路,在更上層的應用方面,諸如Amazon Q這樣的應用才能做到“多、快、好、省”地上崗諸多領域。

而這也是符合當下“應用為王”的大趨勢。

總而言之,有算力、有模型、有應用、有市場,亞馬遜云科技絕對是AIGC時代不容小覷的巨頭之一。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2024-05-30
16家頭部大模型公司上海神秘碰頭,現(xiàn)場人擠人人人
16家頭部大模型公司上海神秘碰頭,現(xiàn)場人擠人人人

長按掃碼 閱讀全文