科技云報到原創(chuàng)。
2024年的大模型產(chǎn)業(yè),注定將是會被反復提起的一頁。
這一年,被按下加速鍵的市場剛剛過半,就已經(jīng)顯示出冰火兩重天的格局。算法的單模態(tài)擴展到多模態(tài),趨勢如燎原之火,讓全球陷入對世界模型暢想的狂歡中;一級市場逐漸走向冷靜,投資人開始頻頻向企業(yè)要收入,百模齊發(fā)迅速被簡化為幾家獨角獸之間的資本與技術持久戰(zhàn)。
云服務巨頭則以一種標準制定者,以及頂級大模型團隊背后力量的角色出現(xiàn),成為市場中隱形的力量。在他們的主導下,過去IaaS、PaaS、SaaS的角色分工,在AI時代被芯片層、框架層、模型層和應用層取代,又迅速進化為基礎設施、工具和應用的新“三層架構”。
技術的發(fā)展,基礎設施的成熟,讓千行百業(yè)都產(chǎn)生了所有生意都值得在大模型時代重做一遍的信仰。
但如何低成本、高質量的重新做一遍,是所有企業(yè),必須回答的關鍵問題。
從“業(yè)務靠近技術”到“技術靠近業(yè)務”
如今,“AI轉型”正逐步取代“云轉型”,成為IT行業(yè)的新趨勢,AI也已成為硅谷最具想象力的概念。
2025年,是大模型落地的關鍵年。一方面,大模型Scaling Law的曲線趨緩,基礎模型廠商開始收斂,基礎模型動輒一次數(shù)億美元的投入,以及不斷推高的人才密度等高門檻,意味著只有少數(shù)企業(yè)能夠留在牌桌。
另一方面,大模型落地的緊迫感前所未有,大家都期待大模型產(chǎn)生實實在在的價值,且超出以往的技術能力范疇,全行業(yè)都在默契又統(tǒng)一地走向落地。
在ChatGPT爆發(fā)的初期,似乎是由新技術創(chuàng)造了新的市場,但是,并非所有的企業(yè)都需要一個ChatGPT,而所有企業(yè)都需要生成式AI。革命性技術發(fā)展的早期看起來是從無到有,在成熟期則是從“業(yè)務靠近技術”走向“技術靠近業(yè)務”,大模型越往后發(fā)展越需要對行業(yè)的理解、對產(chǎn)業(yè)的專耕。
對于企業(yè)來說,要直接將大模型運用好難度較大,畢竟大模型的復雜性、對技術能力和資源等方面的要求較高;而如果拋開行業(yè)化這一環(huán)節(jié),直接去基于大模型開發(fā)具體應用,距離又太過遙遠,缺乏有效的銜接過渡。
其中的關鍵就是技術和行業(yè)結合,在當下的生成式AI產(chǎn)業(yè)敘事邏輯中,比以往任何時候都需要“行業(yè)化”。行業(yè)化起著降低大模型技術落地門檻的重要作用,它能夠聚焦提煉出各個行業(yè)普遍存在的共性難題,進而為大模型更好地適配不同行業(yè)提供基礎。
相比于新技術落地的其他環(huán)節(jié),行業(yè)化是一個容易被忽略的部分,卻又往往需要最專業(yè)的廠商投入大量的資源做具體的事,大多數(shù)企業(yè)享受了行業(yè)化帶來的便利,卻對大模型落地這一層級的變化感受不明顯。
事實上,以ChatGPT為代表的生成式AI技術興起的近兩年,業(yè)內普遍關心AI應用的爆發(fā)時間。但從任何高科技行業(yè)發(fā)展的歷史來看,但凡應用要爆發(fā),就離不開“降本”這一要素。
模型價格決定了應用使用成本,因為用戶使用應用會調用大模型,需要消耗Token,而大模型訓練和推理的成本高,API的調用成本就會高,從而限制企業(yè)用戶、開發(fā)者的應用開發(fā)步伐。
這就迫使大模型廠商,一方面要不斷迭代大模型,在百模大戰(zhàn)中以能力勝出;另一方面要降本提效,通過模型機構優(yōu)化、分布式推理和混合調度等手段進行優(yōu)化、大幅壓縮成本,來不斷降低API調用價格,推動應用興起。
隨著AI技術的普及和深入應用,云廠商也面臨著越來越多的挑戰(zhàn)。一方面,企業(yè)需要更加定制化、差異化的AI解決方案來滿足其獨特的業(yè)務需求;另一方面,AI技術的復雜性和不確定性也使企業(yè)在應用過程中面臨諸多風險。
與五六年前相比,當前AI行業(yè)正在發(fā)生根本性轉變,其中最明顯的趨勢是,生成式AI的廣泛應用使業(yè)務部門成為技術創(chuàng)新的重要推動力,企業(yè)希望通過AI技術來解決實際問題、提升業(yè)務效率。
而這也驅使云廠商在業(yè)務開展方面出現(xiàn)了一系列新的變革。在AIGC時代,如何積極響應用戶需求,通過提供開箱即用的數(shù)據(jù)分析能力幫助企業(yè)快速接入AI技術,成為這個時代云廠商需要思考的難題。
在模型開發(fā)方面,云廠商需要思考如何提升模型落地的工廠化能力,降低硬件成本、提高硬件性能,為企業(yè)提供更加穩(wěn)定、高效的AI運行環(huán)境。
其中,把握并識別企業(yè)需求是一大難點。企業(yè)往往只會提出諸如需要更快、更便宜的GPU這類直觀需求,但不會透露更深層次的具體需求,如何運用創(chuàng)新辦法來解決相應需求是一大痛點。
為千行百業(yè)開啟數(shù)字化新篇章
當前,云服務商的競爭已經(jīng)從技術維度延展到企業(yè)的實際業(yè)務需求方面,這也成為亞馬遜云科技在AI上的布局重點之一。
在re:Invent 2024全球大會期間,亞馬遜云科技不僅展示了其在生成式AI領域的深厚積累,更通過一系列新發(fā)布,展示了從模型到應用的全面布局。
作為亞馬遜云科技推出的新一代基礎模型,Amazon Nova旨在為用戶提供多模態(tài)、高性能且成本效益顯著的生成式AI解決方案。該系列包括Micro、Lite、Pro、Premier等多個版本,分別適用于不同場景下的需求。Micro作為文本到文本的模型,以極低成本提供低延遲響應;Lite則為成本極低的多模態(tài)模型,可快速處理多種輸入;Pro在準確性、速度和成本間取得平衡,滿足多種復雜需求;而Premier則將是功能最為強大的多模態(tài)模型,可處理復雜推理任務并指導定制模型蒸餾。
除了基礎模型外,亞馬遜云科技還推出了新一代圖像生成模型Amazon Nova Canvas和視頻生成模型Amazon Nova Reel。Canvas能夠幫助客戶生成高質量圖像,并具備圖像編輯功能,最高可生成2K分辨率的圖像;Reel則以先進的視頻生成質量和低延遲著稱,提供了性能和成本效益之間的平衡,讓視頻制作更加普惠化。
為更好地支持生成式AI應用的構建與擴展,亞馬遜云科技推出了Amazon Bedrock平臺。該平臺提供了從模型選擇、推理優(yōu)化到多智能體協(xié)作等一系列工具和服務,旨在幫助用戶輕松地將生成式AI能力整合到生產(chǎn)環(huán)境中。
在模型選擇方面,Amazon Bedrock Marketplace匯聚了來自領先供應商的100多個新興和專業(yè)基礎模型,用戶可以通過統(tǒng)一界面發(fā)現(xiàn)、測試并部署所需模型。在推理優(yōu)化方面,Amazon Bedrock推出了延遲優(yōu)化選項和模型蒸餾功能,前者基于Amazon EC2 Trn2實例實現(xiàn)更好的推理性能,后者則通過蒸餾技術提升模型運行速度和降低成本。
此外,Amazon Bedrock還支持GraphRAG和自動推理檢查功能,分別用于提升數(shù)據(jù)關聯(lián)性和預防模型幻覺引起的事實性錯誤。
除了技術和工具的創(chuàng)新外,亞馬遜云科技還通過Amazon Q系列產(chǎn)品加速了生成式AI在業(yè)務場景中的應用。Amazon Q Developer和Amazon Q Business分別為開發(fā)人員和企業(yè)用戶提供了強大的生成式AI助手功能。
從行業(yè)戰(zhàn)略角度看,亞馬遜云科技的首要目標是利用領先的云計算、生成式AI和機器學習技術,賦能各行業(yè)客戶構建業(yè)內創(chuàng)新解決方案。
亞馬遜云科技正在通過多種方式將這一目標變?yōu)楝F(xiàn)實。比如,目前亞馬遜云科技已推出超過40種針對特定行業(yè)的專屬服務,以及450多個行業(yè)專屬解決方案。通過這些定制化服務與解決方案,亞馬遜云科技助力各種規(guī)模的企業(yè)加速應用云計算并降低成本,賦能行業(yè)專屬的工作負載。這些解決方案正以前所未有的速度推動組織創(chuàng)新,助力客戶實現(xiàn)突破性里程碑,并為其所在行業(yè)帶來創(chuàng)新性成果。
同時,亞馬遜云科技助力企業(yè)加速開啟上云之旅,其重點領域涵蓋關鍵系統(tǒng)的遷移和現(xiàn)代化、將本地數(shù)據(jù)工作負載遷移上云,以及滿足各行業(yè)的業(yè)務需求。通過聚焦這些核心領域,亞馬遜云科技幫助各行業(yè)客戶降低成本(基礎設施成本最多可減少66%)、提升運營效率(開發(fā)人員生產(chǎn)力最多可提高30%)、加速創(chuàng)新步伐,同時應對復雜挑戰(zhàn)并提高可持續(xù)性。
生成式AI是亞馬遜云科技的另一項重要戰(zhàn)略之一。對此,亞馬遜云科技與各行業(yè)企業(yè)攜手合作,通過提供企業(yè)級安全與隱私保護、多種領先基礎模型的選擇、堅持數(shù)據(jù)優(yōu)先的方法,以及高性能、低成本的基礎設施,助力生成式AI創(chuàng)新應用加速落地,充分釋放生成式AI的變革潛力。
比如在醫(yī)療領域,亞馬遜云科技提供為醫(yī)療行業(yè)設計的專屬服務、企業(yè)級安全保障以及符合HIPAA標準的工具組件,包括可用于自動生成臨床文檔的Amazon HealthScribe、增強臨床問題解決能力的Amazon Q、可自動將醫(yī)療語音轉換為文本的Amazon Transcribe Medical,以及準確、快速地從非結構化醫(yī)學文本中提取信息的Amazon Comprehend Medical,從而為客戶轉型提供全面的技術支持。
在制造業(yè)和工業(yè)領域,亞馬遜云科技獲評2024年Gartner?全球工業(yè)物聯(lián)網(wǎng)平臺魔力象限領導者。亞馬遜云科技的工業(yè)物聯(lián)網(wǎng)服務套件包括Amazon IoT SiteWise和Amazon Lookout for Equipment,能夠助力制造企業(yè)徹底革新其運維流程。Coca-Cola ??ecek(CCI)以Coca-Cola品牌生產(chǎn)、分銷、銷售起泡飲料和不充氣飲料,該公司通過使用Amazon IoT SiteWise,顯著提升了其“原位清洗(Clean in Place, CIP)”流程的可持續(xù)性,實現(xiàn)了每年能源消耗降低20%、水資源節(jié)約9%,以及流程時間縮短34天的顯著成效。
亞馬遜云科技全球客戶技術支持與服務副總裁Uwem Ukpong表示:“在幫助客戶構建生成式AI解決方案的過程中,我們發(fā)現(xiàn)企業(yè)選擇的生成式AI應用場景也在逐漸迭代升級,從原先簡單的生成式AI嘗試例如對話式聊天機器人,過渡到內容、圖像、視頻等多媒體內容生成,以及數(shù)據(jù)洞察與決策等。亞馬遜云科技將從客戶需求出發(fā),滿足客戶不同應用場景的痛點與訴求,助力客戶構建數(shù)字化解決方案?!?/p>
在生成式AI的淺水區(qū),重點是找到新技術應用于業(yè)務的廣度覆蓋;在生成式AI的深水區(qū),重點是彌合新技術和業(yè)務的認知鴻溝,也就格外需要云平臺企業(yè),做中間一層的行業(yè)化,彌補大模型落地的版圖。
從底層的芯片、云服務,到中間層的模型,再到最上層的應用,整個大模型產(chǎn)業(yè)鏈的各個環(huán)節(jié)之間,如同互相嵌合連接的精密傳動儀器,任何一個環(huán)節(jié)的進步與迭代,都會掀起整個市場的漣漪不斷傳導擴散。
其中,云服務等基礎設施范式的存在,如同整個板塊的地基。上層的算法應用越想改變世界,最底層的地基就要越穩(wěn)固。
盡管基礎大模型的能力提升已將AI應用開發(fā)從“最后1公里”推進到“最后100米”,但開發(fā)AI應用仍然面臨諸多挑戰(zhàn),這正是云計算平臺從技術走向服務的重要意義所在。云計算的進步,也是整個大模型產(chǎn)業(yè)鏈不斷向前飛奔過程中,被極大低估的一環(huán)。在未來生成式AI持續(xù)發(fā)展的進程中,云計算將進一步與之深度融合,助力其釋放出更大潛能,為千行百業(yè)開啟更具想象力的數(shù)字化篇章。
【關于科技云報到】企業(yè)級IT領域Top10新媒體。聚焦云計算、人工智能、大模型、網(wǎng)絡安全、大數(shù)據(jù)、區(qū)塊鏈等企業(yè)級科技領域。原創(chuàng)文章和視頻獲工信部權威認可,是世界人工智能大會、數(shù)博會、國家網(wǎng)安周、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 這里不止“羊毛月”,少年也在以電商助農
- 同仁堂醫(yī)養(yǎng)IPO: “三位一體”診療服務體系高效協(xié)同 “中醫(yī)+”健康服務未來可期
- 國產(chǎn)手機大勝,蘋果銷量大跌,難怪急哄哄降價千元
- 走出群山,長賽道“攀登者”vivo
- 三線結構光與升降LDS激光雷達 石頭自清潔掃拖機器人G30導航避障新里程
- 石頭科技閃耀CES2025 首創(chuàng)仿生機械手掃拖機器人
- TCL華星亮相CES2025,印刷OLED等創(chuàng)新顯示技術全球吸睛
- 科技云報到:從大模型到云端,“AI+云計算”還能講出什么新故事?
- 承載AI的云南花卉,正在盛開
- 打造個人辦公新范式,科大訊飛召開辦公智能體產(chǎn)品升級發(fā)布會
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。