近日,備受關(guān)注的 NVIDIA GTC 已拉開序幕。來自世界各地的頂尖 AI 開發(fā)者齊聚美國加州圣何塞會議中心,共同探索行業(yè)未來,全球領(lǐng)先的向量數(shù)據(jù)庫公司 Zilliz 也不例外。作為去年被 NVIDIA CEO 黃仁勛提及的向量數(shù)據(jù)庫廠商,Zilliz 今年主要以主題演講的形式參與其中。Zilliz 創(chuàng)始人兼 CEO 星爵、Zilliz 合伙人及研發(fā) VP 欒小凡、Zilliz AI 和機器學(xué)習(xí)負(fù)責(zé)人 Frank Liu 均將在 GTC 不同的環(huán)節(jié)進行分享。不止如此,Zilliz 還先后兩次與 NVIDIA 合作,尤其是即將發(fā)布的 Milvus 2.4,充分詮釋了如何用 GPU 為向量數(shù)據(jù)庫加速,更好地為 AI 時代的開發(fā)者服務(wù)。
黃仁勛今年 Keynote 的主題是“見證 AI 的變革時刻”,在演講中再次介紹了向量數(shù)據(jù)庫在 LLM、生物制藥、自動駕駛和機器人等領(lǐng)域的廣泛應(yīng)用場景。而 Zilliz 作為向量數(shù)據(jù)庫的領(lǐng)軍者,也將在此次 AI 盛會中再次向世人展示向量數(shù)據(jù)庫在去年一年的打磨中已經(jīng)取得的成果,并做好準(zhǔn)備來迎接 AI 的變革時刻。
Zilliz 深度參與 AI 盛會,享受與全球開發(fā)者的思想碰撞
在今年的 GTC 大會上,Zilliz 將通過線上主題演講與現(xiàn)場分享結(jié)合的方式與全球的開發(fā)者進行深入交流。
3 月 18 日
分享人:Zilliz 合伙人及研發(fā) VP 欒小凡
會議號:SE62800
分享主題:創(chuàng)業(yè)企業(yè)在生成式 AI 方向的實踐與分享
在 3 月 18 日(北京時間)舉行的 GTC 創(chuàng)業(yè)企業(yè)特別會議特輯中,有三場針對中國創(chuàng)業(yè)企業(yè)的特別演講,欒小凡在其中一場主題為“創(chuàng)業(yè)企業(yè)在生成式 AI 方向的實踐與分享“。欒小凡詳細(xì)介紹了 GPU 加持的向量數(shù)據(jù)庫 Milvus 如何賦能大規(guī)模 RAG 模型應(yīng)用。
3 月 20 日
分享人:Zilliz 創(chuàng)始人兼 CEO 星爵
會議號:S62599
分享主題:Perform High-Efficiency Search, Improve Data Freshness, and Increase Recall With GPU-Accelerated Vector Search and RAG Workflows
(執(zhí)行高效搜索,提高數(shù)據(jù)實時性,并通過 GPU 加速的向量搜索和 RAG 工作流程提高召回率)
在即將到來的 3 月 20 日(北京時間),Zilliz 創(chuàng)始人兼 CEO 星爵將在 GTC 大會上進行分享。本次分享主要幫助開發(fā)者了解 RAPIDS RAFT 庫的集成,如何顯著提升 Milvus 在構(gòu)建索引和執(zhí)行搜索查詢方面的性能。屆時將討論集成的核心架構(gòu),并提供實際應(yīng)用中的性能測試結(jié)果。
3 月 21 日
分享人:Zilliz AI 和機器學(xué)習(xí)負(fù)責(zé)人 Frank Liu
分享主題:A GPU-Accelerated Vector Database(一個使用 GPU 加速的向量數(shù)據(jù)庫 )
3 月 21 日(北京時間),F(xiàn)rank Liu 將在 GTC 進行線下分享。Frank 首先會分享為什么在 Milvus 中新增支持 GPU,然后通過 demo 展示使用 NVIDIA GPU 查詢和索引的速度大幅提升。
與 NVIDIA 兩度合作,為 AI 變革做足準(zhǔn)備
2023 年以來,Zilliz 旗下的開源向量數(shù)據(jù)庫 Milvus 先后兩次與 NVIDIA 進行深度合作,以實際行動支持 AI 時代開發(fā)者對向量數(shù)據(jù)庫的性能需求。
首先是 Milvus 2.3 正式支持 NVIDIA GPU。作為為數(shù)不多的支持 GPU 的向量數(shù)據(jù)庫產(chǎn)品,Milvus 2.3 在吞吐量和低延遲方面都帶來了顯著的變化,尤其是與此前的 CPU 版本相比,不僅吞吐量提高了 10 倍,還能將延遲控制在極低的水準(zhǔn)。
同時,Milvus 2.3 還帶來了如 Query 架構(gòu)升級、更強的負(fù)載均衡調(diào)度能力、新的消息隊列、Arm 版本鏡像、可觀測性、運維工具升級 MMap 等能力。其中,與傳統(tǒng)的內(nèi)存索引相比,MMap 可以實現(xiàn)超過 10 倍的內(nèi)存節(jié)省,對 RAG 應(yīng)用尤其有益。
本周,Milvus 將升級至 2.4 版本,全面支持 NVIDIA 最新的 RAFT 算法庫,包括暴搜 bruteforce、圖索引 CAGRA 以及 IVF 以適用于不同應(yīng)用場景。在 GPU 的加持下,不僅索引的構(gòu)建時間大幅縮短,向量檢索尤其是批量搜索場景下,QPS 有數(shù)十至上百倍的提升。
此外,Milvus 2.4 還基于場景引入了其他新功能,例如:支持多向量列和混合排序搜索,能更好的支持多模態(tài)場景;稀疏向量的支持可以幫助擴充向量搜索的范圍,其在關(guān)鍵詞理解和可解釋性方面都頗具前景。而針對典型 RAG 場景,引入分類聚合的 Group By 支持,幫助 chunk 之上的文檔級別召回;同時支持 Inverted Index 和模糊匹配,提升了關(guān)鍵詞的檢索能力。
升級基于 Milvus 的全托管向量數(shù)據(jù)庫云服務(wù)產(chǎn)品 Zilliz Cloud,并持續(xù)建設(shè) AI 生態(tài)
最新升級的 Zilliz Cloud 可以大幅提升向量搜索性能(性能較 Milvus 最高提升 10 倍以上),實現(xiàn)企業(yè)級數(shù)據(jù)安全和無縫數(shù)據(jù)集成。新版本發(fā)布后,用戶無需自定義代碼,便可快速順暢地完成非結(jié)構(gòu)化數(shù)據(jù)處理和索引。尤其是對于 Cardinal 搜索引擎的支持,使得用戶對于處理大型數(shù)據(jù)集及快速響應(yīng)的高要求有了保障,在提升體驗的同時,也可以提升 AI 應(yīng)用的競爭力。
而 Zilliz Cloud Pipelines 的上線,也可以有效提升開發(fā)者的工作效率,它可以將文檔、文本片段和圖像等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成可搜索的向量并存儲在 Collection 中,幫助開發(fā)者簡化工程開發(fā),助力其實現(xiàn)多種場景的 RAG 應(yīng)用,將復(fù)雜生產(chǎn)系統(tǒng)的搭建和維護簡化成 API 調(diào)用。
此外,2023 年以來,Zilliz Cloud 實現(xiàn)了 AWS、Azure、GCP、阿里云全球 4 大云 11 個節(jié)點的全覆蓋,成為全球首個提供海內(nèi)外多云服務(wù)的向量數(shù)據(jù)庫企業(yè)。
步履不停,與 AI 企業(yè)一同探索更多變革時刻
Zilliz 從未停止過對 AI 生態(tài)的建設(shè),也期待與其伙伴一起探索更多 AI 的變革時刻。
近期,Zilliz 面向 AI 初創(chuàng)企業(yè)推出了“Zilliz AI 初創(chuàng)計劃”,預(yù)計提供總計 1000 萬元的 Zilliz Cloud 抵扣金,幫助 AI 開發(fā)者構(gòu)建高效的非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng),助力打造高質(zhì)量 AI 服務(wù)與運用,加速產(chǎn)業(yè)落地。
Zilliz 將為全球的 AI 初創(chuàng)團隊提供資源、技術(shù)、市場推廣、銷售等全方位的支持,符合要求的團隊可獲得以下獨家資源與支持:零成本快速上云;領(lǐng)先全行業(yè)的向量數(shù)據(jù)庫技術(shù)、產(chǎn)品支持;提升品牌海內(nèi)外知名度,拓寬潛在客戶市場;攜手銷售專家探尋更多商機。
對該計劃感興趣的團隊可訪問 Zilliz 中文官網(wǎng)首頁填寫申請,Zilliz AI 初創(chuàng)計劃項目專員將在 1-3 個工作日內(nèi)和您聯(lián)系并確認(rèn)申請資料,完成資質(zhì)評估,制定后續(xù)執(zhí)行計劃。
未來,Zilliz 也將持續(xù)加大對 AI 生態(tài)系統(tǒng)建設(shè)的投入,不斷為更多的優(yōu)質(zhì)開源項目賦能、繁榮生態(tài)、惠及更廣泛的開發(fā)者和用戶群體,活動申請截止日期為 2024 年 6 月 30 日。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )