AGI 時(shí)代,真的可以用向量數(shù)據(jù)庫(kù)+大模型在 48 小時(shí)內(nèi)迅速搭建出一個(gè) AI 應(yīng)用嗎?
這場(chǎng)黑客松比賽給出了答案,它就是 AGI Playground Hackathon,一場(chǎng)聚集了國(guó)內(nèi)頂尖向量數(shù)據(jù)庫(kù)、大模型公司與創(chuàng)新開(kāi)發(fā)者的 AGI 盛宴。
與國(guó)內(nèi)其他比賽不同,AGI Playground Hackathon 詮釋了 CVP Stack 開(kāi)發(fā)范式的強(qiáng)大,除了大模型以外,首次全量使用向量數(shù)據(jù)庫(kù)進(jìn)行應(yīng)用開(kāi)發(fā),讓更多開(kāi)發(fā)者切實(shí)地感受到向量數(shù)據(jù)庫(kù)作為大模型記憶體在檢索和存儲(chǔ)等方面的能力。本次比賽給出了“生產(chǎn)力工具的新想象”、“泛娛樂(lè)體驗(yàn)的新可能”和“創(chuàng)新開(kāi)發(fā)” 三個(gè)賽題,最大程度地給予開(kāi)發(fā)者更多的創(chuàng)作空間。而現(xiàn)場(chǎng) 34 個(gè)各具特色的開(kāi)發(fā)成果展示,也為 AGI 從業(yè)者帶來(lái)了更多的思考和想象。
CVP Stack 的試煉場(chǎng),向量數(shù)據(jù)庫(kù)的應(yīng)用狂歡
對(duì)于 AGI 時(shí)代的開(kāi)發(fā)者而言,AGI Playground Hackathon 無(wú)疑是驗(yàn)證創(chuàng)意的絕佳戰(zhàn)場(chǎng),據(jù)了解,此次參賽的開(kāi)發(fā)者無(wú)一例外全部使用了 CVP Stack 的開(kāi)發(fā)范式,這也是國(guó)內(nèi)黑客松比賽中,首次在應(yīng)用開(kāi)發(fā)過(guò)程中大規(guī)模地應(yīng)用向量數(shù)據(jù)庫(kù)(Zilliz Cloud)。
何為 CVP Stack?具體來(lái)看,“C”代表大模型(ChatGPT)負(fù)責(zé)向量計(jì)算;“V”代表向量數(shù)據(jù)庫(kù)(Vector Database),負(fù)責(zé)向量存儲(chǔ);“P”代表 Prompt 工程,負(fù)責(zé)向量交互。
這里需要著重講一下向量數(shù)據(jù)庫(kù)。向量數(shù)據(jù)庫(kù)是一種為了高效存儲(chǔ)和索引 AI 模型產(chǎn)生的向量嵌入(embedding)數(shù)據(jù)而專(zhuān)門(mén)設(shè)計(jì)的數(shù)據(jù)庫(kù)。在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)中,數(shù)據(jù)通常以表格的形式存儲(chǔ),而在向量數(shù)據(jù)庫(kù)中,數(shù)據(jù)以向量的形式存儲(chǔ)。向量(embedding)是一組數(shù)值,可以表示一個(gè)點(diǎn)在多維空間中的位置??梢哉f(shuō),向量數(shù)據(jù)庫(kù)非常擅長(zhǎng)處理大量的高維 embedding 數(shù)據(jù)。
隨著大模型時(shí)代的到來(lái),向量數(shù)據(jù)庫(kù)進(jìn)入到更多開(kāi)發(fā)者的視野中。諸如 ChatGPT、Bard、Claude 和 LLaMA 這樣的大模型可以產(chǎn)生海量向量嵌入數(shù)據(jù)來(lái)表達(dá)復(fù)雜的語(yǔ)義關(guān)系,但模型本身的存儲(chǔ)空間有限,無(wú)法持久保存這些數(shù)據(jù)。而向量數(shù)據(jù)庫(kù)就像一塊外置的記憶塊,可以長(zhǎng)期存儲(chǔ)這些數(shù)據(jù),供模型隨時(shí)調(diào)用。而在 CVP Stack 的開(kāi)發(fā)范式中,不可或缺的恰恰是向量數(shù)據(jù)庫(kù)對(duì)于高維復(fù)雜數(shù)據(jù)的向量檢索能力及其長(zhǎng)期存儲(chǔ)能力。
那么,向量數(shù)據(jù)庫(kù)真正的效果的使用效果如何?在最后一天的 Demo Day 中,選手們普遍反映,本次開(kāi)發(fā)過(guò)程中所使用到的向量數(shù)據(jù)庫(kù) Zilliz Cloud,在自己開(kāi)發(fā)的應(yīng)用中承載了重要的功能,通過(guò)其高效的向量檢索與強(qiáng)大的存儲(chǔ)能力大大提升了項(xiàng)目的落地效率和效果:
“Pilotx” 團(tuán)隊(duì)表示:Zilliz Cloud 的性能是世界級(jí),用在 C 端性能略過(guò)剩;
來(lái)自【泛娛樂(lè)】賽道的“碼頭狗狗”用到的是 Zilliz Cloud 的向量檢索和存儲(chǔ)功能,不僅將 prompt 信息存儲(chǔ)在向量數(shù)據(jù)庫(kù)中,還會(huì)用其檢索與當(dāng)前事件相似度的信息;
來(lái)自【創(chuàng)新開(kāi)發(fā)】的“真 666”團(tuán)隊(duì)則通過(guò) Zilliz Cloud 分別搭建了公共向量數(shù)據(jù)庫(kù)及專(zhuān)屬向量數(shù)據(jù)庫(kù),滿足項(xiàng)目交互過(guò)程中對(duì)專(zhuān)業(yè)領(lǐng)域知識(shí)數(shù)據(jù)和用戶(hù)數(shù)據(jù)的需求;……
AGI 不止 48 小時(shí)
一場(chǎng) AGI 黑客松比賽的開(kāi)發(fā)時(shí)間只有 48 小時(shí),然而從開(kāi)發(fā)者的視角來(lái)看,48 小時(shí)只是創(chuàng)意的初步實(shí)踐,真正的考驗(yàn)才剛剛開(kāi)始;對(duì)于比賽的發(fā)起者(Zilliz、智譜 AI、Founder Park)而言,舉辦黑客松的初心以及比賽過(guò)程中帶來(lái)的沉淀更具價(jià)值,AGI 絕不止于 48 小時(shí)。
Zilliz 創(chuàng)始人兼 CEO 星爵表示,聯(lián)合發(fā)起 Hackathon 的原因有 3 點(diǎn):
其一,大模型正當(dāng)其時(shí),已經(jīng)從模型端創(chuàng)新走向應(yīng)用端創(chuàng)新?;乜唇衲晟习肽辏梢钥吹?,國(guó)內(nèi)有很多公司在大模型方面可謂百花齊放,做出了優(yōu)秀的模型,經(jīng)歷了從蓄勢(shì)待發(fā)到走近廣大開(kāi)發(fā)者的過(guò)程。
其二,目光投向海外,過(guò)去一年各類(lèi) Hackathon 活動(dòng)如火如荼,尤其是北美,在開(kāi)發(fā)者聚集的城市基本每個(gè)周末都會(huì)舉辦一場(chǎng)黑客松。這在一定程度上推動(dòng)了 AI 創(chuàng)新的百花齊放,國(guó)內(nèi)當(dāng)下需要這樣促進(jìn)開(kāi)發(fā)者交流與火花碰撞的機(jī)會(huì)。
其三,無(wú)論是大語(yǔ)言模型的應(yīng)用還是上個(gè)時(shí)代移動(dòng)應(yīng)用程序的興起,都清晰地指出,更長(zhǎng)期的創(chuàng)新一定來(lái)自應(yīng)用層。如何以 AI 創(chuàng)新、大模型的創(chuàng)新為各行業(yè)賦能,是當(dāng)下亟待解決的問(wèn)題。為此,在當(dāng)下大模型爆發(fā)、開(kāi)發(fā)者正當(dāng)時(shí)的階段,Zilliz 希望將大家組織到一起,進(jìn)行一場(chǎng)屬于這個(gè)時(shí)代的創(chuàng)新盛宴。
誠(chéng)如星爵所言,黑客松的選手向所有人展示了國(guó)內(nèi) AIGC 開(kāi)發(fā)者技術(shù)力與創(chuàng)新力,帶來(lái)了諸如知識(shí)庫(kù)、金融、健康、短視頻、寵物、兒童繪畫(huà)、殘障人士關(guān)愛(ài)等豐富的場(chǎng)景。
如“社交駭客”團(tuán)隊(duì)的項(xiàng)目,可以看作“AI 時(shí)代的 Facebook”,即利用 AI,全網(wǎng)尋找和你興趣最相符的好友,分析 Ta 的個(gè)人資料,甚至可以和 Ta 的賽博分身互動(dòng)。一方面,該項(xiàng)目展示了深度挖掘信息的強(qiáng)大技術(shù)能力;另一方面,也帶來(lái)了 AI 技術(shù)與倫理的碰撞。
又如,“AI 康復(fù)”團(tuán)隊(duì)的 AI 口語(yǔ)康復(fù)項(xiàng)目。該項(xiàng)目旨在用 AI 幫助恢復(fù)聽(tīng)力的成人聽(tīng)障群體學(xué)說(shuō)話,主要解決成人聽(tīng)障人群上課時(shí)間有限、價(jià)格昂貴以及課后練習(xí)無(wú)反饋的問(wèn)題。由 AI 針對(duì)學(xué)員的自身情況設(shè)計(jì)專(zhuān)屬的訓(xùn)練課程,提供資料查詢(xún)、瞬時(shí)反饋和長(zhǎng)期反饋。
對(duì)此,Zilliz 合伙人&產(chǎn)品負(fù)責(zé)人郭人通評(píng)價(jià)道,見(jiàn)過(guò)太多服務(wù)于多數(shù)人的 AI 項(xiàng)目,但“AI 康復(fù)”團(tuán)隊(duì)的項(xiàng)目卻是瞄準(zhǔn)小眾群體,并讓人眼前一亮。語(yǔ)音-文本跨模態(tài)的技術(shù)選型非常好地匹配了聽(tīng)障群體的口語(yǔ)練習(xí)剛需。這個(gè)項(xiàng)目同時(shí)給整個(gè)行業(yè)提出了幾點(diǎn)思考:在 AI 落地階段高度內(nèi)卷的大背景下,如何提高公益類(lèi) AI 項(xiàng)目的關(guān)注度;面向小眾群體的公益類(lèi) AI 項(xiàng)目的存活路徑探索。
值得一提的是,“AI 口語(yǔ)康復(fù)”項(xiàng)目同時(shí)獲得了本次黑客松“最具創(chuàng)意獎(jiǎng)”及【生產(chǎn)力工具】賽道冠軍,該項(xiàng)目采用 RAG(Retrieval-augmented generation 檢索增強(qiáng)生成)架構(gòu)將聽(tīng)障成人語(yǔ)音康復(fù)專(zhuān)業(yè)文檔 embedding 后存入 Zilliz Cloud 。在回答用戶(hù)提問(wèn)時(shí),通過(guò)向量檢索,大模型可以實(shí)現(xiàn)知識(shí)庫(kù)的準(zhǔn)確反饋和類(lèi)真人老師的真實(shí)糾音效果,避免大模型幻覺(jué)問(wèn)題。
過(guò)去半年 RAG 應(yīng)用數(shù)量呈現(xiàn)出持續(xù)井噴的狀態(tài)。Zilliz 預(yù)計(jì)未來(lái)至少一年的時(shí)間里 RAG 仍會(huì)保持迅猛增長(zhǎng)的態(tài)勢(shì)。未來(lái),其涵蓋的內(nèi)容會(huì)從文本跨越到圖片、視頻等多模態(tài),甚至用戶(hù)的 profile。最終解決“企業(yè)數(shù)據(jù)如何高效使用”的問(wèn)題。從這個(gè)角度看,RAG 在之前、現(xiàn)在以及未來(lái)都會(huì)是一個(gè)持續(xù)的增長(zhǎng)點(diǎn)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )