2月7日消息,新年伊始,AI領域又迎來了一位耀眼的新星——DeepSeek。這位初出茅廬卻勢不可擋的選手,以驚人的速度席卷全球,超越ChatGPT成為全球增速最快的AI應用,也吸引了越來越多的企業(yè)使用DeepSeek系列模型。
事實上,類似的劇情在過去一年中已屢見不鮮,從GPT4到Claude 3.5再到o1……雖然這次的主角是DeepSeek,但AI領域還處于“模型爭霸”時代的本質(zhì)依然沒變。
每當一個更強模型出現(xiàn)時,對普通用戶而言,要使用最新AI很簡單,下載對應的APP(比如這次是DeepSeek APP)直接用起來就行了。但是,對依賴大模型構(gòu)建的企業(yè)級AI應用來說,要想每次都能快速、無縫使用上最新大模型的能力,就沒這么簡單了,需要解決一系列部署和使用模型中的工程化問題。
站在企業(yè)視角,“模型爭霸”時代可謂是“鐵打的應用,流水的模型”。那么,自身鐵打的應用,該如何每次都能無縫搭乘上流水般涌現(xiàn)的新模型的東風,無疑是企業(yè)最關心的事。
“不會有一個模型一統(tǒng)天下”,亞馬遜CEO Andy Jassy在2024 re:Invent上分享了亞馬遜自身部署人工智能的關鍵洞察時就強調(diào)過。
在此洞察下,亞馬遜云科技對幫助客戶構(gòu)建企業(yè)級AI應用早已有了一套成熟的思維方式和工具箱。比如,在第一時間,亞馬遜云科技就已為企業(yè)提供了4種方式來部署DeepSeek-R1系列模型。
這里一起看看亞馬遜云科技構(gòu)建企業(yè)級AI應用的思維和工具。
認識到模型多樣性的重要
如同Andy Jassy在此前的演講中所述:“就像數(shù)據(jù)庫領域,探討了10年,大家會使用各種各樣的關系型數(shù)據(jù)庫或者非關系型數(shù)據(jù)庫。在分析領域也是如此,曾經(jīng)大家覺得TensorFlow會成為唯一的AI框架,而一直強調(diào)會有很多不同框架出現(xiàn),最終PyTorch成為了最受歡迎的那個?!逼髽I(yè)在基于大模型構(gòu)建應用時,不同的應用場景需要的技術指標也各不相同,延遲、成本、微調(diào)能力、知識庫協(xié)調(diào)能力、多模態(tài)支持能力等等,都會因場景需求的不同而被取舍。
2024年12月亞馬遜CEO Andy Jassy在2024 re:Invent上演講
就以DeepSeek為例,其于2024年12月推出DeepSeek-V3模型后,于2025年1月20日相繼發(fā)布了參數(shù)規(guī)模達6710億的DeepSeek-R1、DeepSeek-R1-Zero以及參數(shù)范圍覆蓋15億至700億的DeepSeek-R1-Distill系列模型。2025年1月27日,DeepSeek又新增了基于視覺的Janus-Pro-7B模型。這些模型均已開源,公開資料顯示,DeepSeek系列模型通過強化學習等創(chuàng)新訓練方法,在推理能力方面具有顯著優(yōu)勢,并且成本效益比同類模型高出90%-95%。
但是,以快速響應場景為例,DeepSeek R1的深層思考模式顯然不太合適,其生成首個token的用時超過30秒,而Amazon Nova模型則只需要數(shù)百毫秒即可生成響應。另外,目前的DeepSeek-V3模型只是文生文模型,不支持圖形等多模態(tài)信息的輸入。
可見,強如DeepSeek模型也不是萬能的。
正是從最初就洞察到“不會有一個模型一統(tǒng)天下”,亞馬遜云科技在精進自身大模型的同時,一直致力于為企業(yè)用戶提供豐富的模型“選擇”。
目前,Amazon Bedrock已上架AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI、poolside等廠商的最新大模型,近期還上線了Luma AI Ray 2 模型。
同時,亞馬遜云科技還推出了Amazon Bedrock Marketplace功能,為客戶提供100多個熱門、新興及專業(yè)模型,這其中就包括DeepSeek-R1。
如Andy Jassy所言,亞馬遜云科技提供的豐富且有深度的模型,讓客戶能夠根據(jù)自身獨特需求,精確選擇最合適的解決方案。關注客戶需求與技術發(fā)展,亞馬遜云科技持續(xù)擴展模型選擇,既要有潛力的新興模型,也要有行業(yè)內(nèi)的經(jīng)典模型。
打造企業(yè)級AI工具全家桶
需要注意的是,基于場景選擇合適的模型只是企業(yè)構(gòu)建應用旅程的第一步。隨著構(gòu)建的深入,解決工程化問題的能力成為能否成功構(gòu)建的關鍵。
模型成本、性能、能否針對私有數(shù)據(jù)進行定制優(yōu)化,夠不夠安全,不同尺寸的模型和日益增長的各種智能體的復雜調(diào)度等等,這些企業(yè)部署和使用模型中的工程化問題都需要得到完美解決。
以DeepSeek為例,其公開的模型有V3和R1等不同的型號,R1也有不同的尺寸規(guī)模,如DeepSeek-R1-Distill系列模型參數(shù)范圍是15億至700億,而R1和R1-Zero的參數(shù)規(guī)模則達到6710億。要完整部署R1實現(xiàn)完美推理和響應,還需要配套的便捷工具。
Amazon Bedrock聚焦企業(yè)應用AI的實際需求,在提供豐富模型選擇的同時,增添了一系列工具和功能。如低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。以模型蒸餾功能為例,它能夠?qū)⑻囟ㄖR從功能強大的大模型轉(zhuǎn)移到更小、更高效的模型,運行速度最快可提高500%,成本降低75%。
Amazon Bedrock支持基于企業(yè)自有數(shù)據(jù)的定制優(yōu)化。如模型微調(diào)功能,支持GraphRAG等圖數(shù)據(jù),以及夠快速且經(jīng)濟高效地從文檔、圖像、音頻以及視頻中提取信息,并將其轉(zhuǎn)換為結(jié)構(gòu)化格式的Amazon Bedrock Data Automation功能等。
Amazon Bedrock負責任AI的安全和審查,通過不斷豐富Guardrails功能,以簡化企業(yè)實施負責任AI的投入,例入為其加入自動推理檢查功能,從而能夠輕松識別事實性錯誤,以提升生成回答的準確性。
Amazon Bedrock不但提供智能體功能,還針對智能體的快速發(fā)展,進一步推出了多智能體協(xié)作功能,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來執(zhí)行復雜的工作流程。憑借多智能體協(xié)作功能,客戶可以通過為項目的特定步驟創(chuàng)建和分配專用智能體,從而獲得更準確的結(jié)果,并通過編排多個并行工作的智能體來加速任務。
目前,亞馬遜云科技現(xiàn)已推出針對DeepSeek-R1模型四種不同的部署方式,企業(yè)可以在熟悉的亞馬遜云科技環(huán)境中輕松部署該系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通過Amazon Bedrock自定義導入功能或Amazon EC2 Trn1實例中部署DeepSeek-R1-Distill系列模型。
圖注:在Amazon Bedrock Marketplace中調(diào)用DeepSeek-R1模型
圖注:在Amazon SageMaker Jumpstart中部署DeepSeek-R1模型
總結(jié)來看,亞馬遜云科技圍繞云和AI領域展開的全棧式創(chuàng)新,為企業(yè)運用全球領先模型提供三大支持:
首先是云端本身的優(yōu)勢,與本地部署相比,云端部署更靈活更易擴展,同時也能與云端豐富且成熟的分析、數(shù)據(jù)等基礎服務進行無縫集成;
其次是多樣化的模型選擇優(yōu)勢,不同的場景能夠靈活選擇不同成本、性能、響應速度的模型,從而實現(xiàn)最優(yōu)的性價比組合;
最后是模型從原型走向企業(yè)化生產(chǎn)環(huán)境時必須要考慮的一系列重要功能,堪稱企業(yè)級AI全家桶,包括優(yōu)化成本、根據(jù)自有數(shù)據(jù)定制提升準確性、至關重要的安全性以及針對未來復雜的多智能體構(gòu)建和管理等。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建強調(diào):“亞馬遜云科技是全球云計算的開創(chuàng)者和引領者,更是企業(yè)構(gòu)建和應用生成式AI的首選。我們不僅在云的核心服務層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化。我相信,只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當今客戶的發(fā)展需求,加速前沿技術的價值釋放,助力各行各業(yè)重塑未來?!保ü啵?/p>
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )