一個(gè)技術(shù)人“誤入歧途”,做了個(gè)向量數(shù)據(jù)庫(kù)新物種

向量數(shù)據(jù)庫(kù)公司 Zilliz 近日宣布完成一筆 6000 萬(wàn)美元的 B+ 輪融資,累計(jì)融資 1.13 億美元。這在長(zhǎng)于本土的開(kāi)源創(chuàng)企中,無(wú)疑是非常耀眼的一筆。

而時(shí)間回到 6 年前,當(dāng) Zilliz 的創(chuàng)始人星爵帶著 Oracle 出身的背景尋找投資人,說(shuō)出自己想要造一個(gè)新物種時(shí),卻不似當(dāng)下這番光景,更多時(shí)候面對(duì)的是投資人的不解:

“怎么誤入歧途呢?”

“你帶著 Oracle 的背景,隨隨便便做個(gè)數(shù)據(jù)庫(kù)公司,我肯定給你投錢(qián)啊。”

這些聲音會(huì)讓星爵開(kāi)始審視要做的事情本質(zhì)上對(duì)不對(duì)?自己和投資人的溝通方式需要如何改進(jìn)?但有一點(diǎn)非常明確——敢為天下先,要做就要做這個(gè)世界上還不存在的東西,即便在短期內(nèi)不被理解。

所幸,在 2017 年,星爵和他的團(tuán)隊(duì)成功拿到了一筆天使輪融資,開(kāi)始了對(duì)“新物種”的研究。回顧公司發(fā)展,星爵將 2017 年的天使輪融資作為第一個(gè)里程碑;2019 年將第一款真正意義上的產(chǎn)品 Milvus 開(kāi)源視作第二個(gè);第三個(gè)里程碑則發(fā)生在 2020 年下半年至 2021 年上半年,Zilliz 確立了接下來(lái)的“五年規(guī)劃”,即,把全球化作為核心發(fā)展目標(biāo)。

在過(guò)去的 6 年創(chuàng)業(yè)時(shí)間里,星爵關(guān)注的重點(diǎn)一直只有技術(shù)創(chuàng)新,從用戶(hù)需求中摸索新的方向,然后實(shí)現(xiàn)它,并做到極致。商業(yè)化、資本市場(chǎng)的認(rèn)可等要素尚未進(jìn)入星爵的重點(diǎn)關(guān)注地帶,但也因?yàn)閷?duì)技術(shù)的追求,讓 Zilliz 正成為下一個(gè)基礎(chǔ)軟件市場(chǎng)新星。

“不做”產(chǎn)品做技術(shù)

“在我們剛成立的那段時(shí)間里,我們覺(jué)得自己做的事產(chǎn)品,但現(xiàn)在回頭去看,我們當(dāng)時(shí)做的是技術(shù)。”

Zilliz 的成立,來(lái)自于星爵對(duì)新技術(shù)的興趣和自身事業(yè)轉(zhuǎn)型的規(guī)劃。

讀華中科技大學(xué)研究生時(shí),身在中國(guó)武漢的星爵跟隨老師參與“網(wǎng)格計(jì)算”技術(shù)相關(guān)的研究,這一技術(shù)后來(lái)被認(rèn)為是云計(jì)算的前身。機(jī)緣巧合之下,星爵所在的小組和由芝加哥大學(xué)教授主導(dǎo)的網(wǎng)格計(jì)算項(xiàng)目 Globus 取得聯(lián)系,星爵也加入到 Globus 項(xiàng)目中去,學(xué)習(xí)和研究代碼,并且和 Globus 合作,最終建立起中國(guó)教育科研網(wǎng)格——中國(guó)最大的網(wǎng)格計(jì)算項(xiàng)目之一。

這是星爵第一次通過(guò)開(kāi)源協(xié)作的模式,深度參與到開(kāi)源軟件的建設(shè),“如果不是開(kāi)源,我很難想象到,一端是在中國(guó)武漢,另一端在美國(guó)芝加哥大學(xué),相隔這么遠(yuǎn)的實(shí)驗(yàn)室科研人愿能夠連接起來(lái),這對(duì)我來(lái)說(shuō)非常陌生,同時(shí)也是打開(kāi)了去學(xué)習(xí)全球最新技術(shù)的大門(mén)。”

碩士畢業(yè)后,星爵到了美國(guó)數(shù)據(jù)庫(kù)專(zhuān)業(yè)數(shù)一數(shù)二的威斯康星大學(xué)麥迪遜分校就讀,2009 年博士畢業(yè)進(jìn)入硅谷 Oracle 工作,參與當(dāng)時(shí) Oracle 的云數(shù)據(jù)庫(kù)研發(fā)。2013 年,Oracle 12c 版本發(fā)布,主題是為云計(jì)算重新設(shè)計(jì)的數(shù)據(jù)庫(kù),星爵正是核心開(kāi)發(fā)人員之一。到了 2015 年,12c 已經(jīng)趨向于穩(wěn)定,星爵萌生了回國(guó)創(chuàng)業(yè)的想法。

一方面,此時(shí)的星爵在技術(shù)上有過(guò)數(shù)據(jù)處理和分布式項(xiàng)目經(jīng)歷,也見(jiàn)識(shí)到了一個(gè)大型數(shù)據(jù)庫(kù)軟件該怎么去做,希望能在不同維度拓寬自身能力。加之受到硅谷創(chuàng)業(yè)文化的影響,星爵想要通過(guò)技術(shù)創(chuàng)業(yè),完成從工程師到技術(shù)創(chuàng)業(yè)者的升華。

另一方面,在星爵看來(lái),當(dāng)時(shí)的數(shù)據(jù)分析走到了一個(gè)交叉路口,AI 模型、算法的研究如火如荼?;?AI 研究,對(duì)各種非結(jié)構(gòu)化數(shù)據(jù),包括圖片、視頻、自然語(yǔ)言等的研究也到了一個(gè)新的高度,并且取得了一些很好的結(jié)果。計(jì)算機(jī)視覺(jué)領(lǐng)域的圖片分類(lèi)水平也首次超過(guò)了人類(lèi)平均水平。在這種 AI 研究與非結(jié)構(gòu)化數(shù)據(jù)研究的發(fā)展之中,星爵的心中隱隱浮現(xiàn)一個(gè)念頭:在數(shù)據(jù)處理的基礎(chǔ)軟件領(lǐng)域,將會(huì)有新的技術(shù)出現(xiàn),新的機(jī)會(huì)正在誕生。

帶著對(duì)新技術(shù)的熱情,星爵開(kāi)始了創(chuàng)業(yè)之旅,“我們選擇了的 AI 應(yīng)用中的數(shù)據(jù)處理賽道,過(guò)去 5- 10 年間,中國(guó)的 AI 應(yīng)用,以及非結(jié)構(gòu)化數(shù)據(jù)處理是走在全球前列的,無(wú)論是數(shù)據(jù)的總量還是使用場(chǎng)景都領(lǐng)先于世界。”秉持著靠近需求源泉的原則,Zilliz 的故事從中國(guó)啟程。2017 年,Zilliz 拿到天使輪融資,正式出發(fā)。

成立之后,Ziliiz 最初的定位是將數(shù)據(jù)庫(kù)搬到 GPU 上,基于 GPU 硬件加速做新一代 OLAP 數(shù)據(jù)庫(kù)系統(tǒng),進(jìn)而希望將性能提高 100 倍。星爵認(rèn)為,AI 時(shí)代出現(xiàn)了一些 GPU、異構(gòu)計(jì)算等新技術(shù),那么便可以嘗試將分布式計(jì)算和異構(gòu)計(jì)算、數(shù)據(jù)處理等結(jié)合起來(lái)。Zilliz 先是做了一個(gè)通過(guò) GPU 高效并行算法加速各種數(shù)據(jù)處理的引擎,將這一想法落地。

“我們沒(méi)有想清楚把這個(gè)引擎用到什么地方去,只覺(jué)得這個(gè)東西性能很好,很創(chuàng)新,很酷!所以要先把它做出來(lái)。”

接下來(lái),便是拿著不斷地和用戶(hù)交流,接收反饋。最終,Zilliz 發(fā)現(xiàn)這套技術(shù)可以很好地用在幫用戶(hù)去加速 AI 應(yīng)用中向量數(shù)據(jù)的分析和處理,并且此類(lèi)用戶(hù)需求是廣泛存在和飛速增長(zhǎng)的。在這樣邊做技術(shù)邊摸索的過(guò)程中,Zilliz 逐漸將向量數(shù)據(jù)庫(kù)作為核心產(chǎn)品方向,并堅(jiān)持到了今天。

  開(kāi)源 + 從用戶(hù)需求出發(fā)

埋頭“很酷”的技術(shù) 2 年后,Zilliz 在 2019 年迎來(lái)了“技術(shù)產(chǎn)品化”的關(guān)鍵轉(zhuǎn)折點(diǎn)。

在做數(shù)據(jù)分析處理引擎期間,Zilliz 陸續(xù)接到了用戶(hù)反饋,看到了向量數(shù)據(jù)分析與處理的強(qiáng)勁需求。以此需求為依托,2018 年下半年開(kāi)始,Zilliz 啟動(dòng)了新項(xiàng)目的調(diào)研、開(kāi)發(fā)工作,并在 2019 年將成果一口氣開(kāi)源,這個(gè)成果便是向量數(shù)據(jù)庫(kù)——Milvus。

“對(duì)我們來(lái)說(shuō),是帶著自身積累的,對(duì)大規(guī)模數(shù)據(jù)的處理能力、分布式計(jì)算能力、異構(gòu)計(jì)算等能力,跨越了從技術(shù)到產(chǎn)品的鴻溝,找到了明確的產(chǎn)品方向,即向量數(shù)據(jù)庫(kù)。”但對(duì)于 Milvus 之后的發(fā)展,當(dāng)時(shí)的星爵心里也沒(méi)底:“我們看到了用戶(hù)需求,看到了市場(chǎng)機(jī)會(huì),但我們不知道自己提供的產(chǎn)品是不是真的能夠完美滿(mǎn)足市場(chǎng)需求。”

出于這個(gè)“痛點(diǎn)”,在加上團(tuán)隊(duì)開(kāi)放的工程師文化,Milvus 從發(fā)布之日起開(kāi)源,采用 Apache 許可證。“開(kāi)源開(kāi)放是我們公司長(zhǎng)期以來(lái)的基本原則,這是一群工程師很質(zhì)樸的想法,我們希望好的技術(shù)可以更快傳播出去,幫行業(yè)的人取得更好地成功,也通過(guò)開(kāi)源把技術(shù)開(kāi)放出去,獲得更廣泛地支持。”

對(duì)于這款開(kāi)源產(chǎn)品成功與否的考量,標(biāo)準(zhǔn)只有一條:“它能不能取得一個(gè)很好的早期用戶(hù)增長(zhǎng)。”這個(gè)結(jié)果直觀反映出產(chǎn)品是否真正解決了用戶(hù)的痛點(diǎn),是否真的為其他開(kāi)發(fā)者創(chuàng)造了價(jià)值。最終,在開(kāi)源的半年內(nèi),擁有了約 60 家企業(yè)級(jí)用戶(hù)。“我記得從有了第一個(gè)用戶(hù)之后,基本上每周都會(huì)有捷報(bào),最初是每周一個(gè)用戶(hù),然后第二周增加了三四個(gè),第三周又增加了七八個(gè)。”

事實(shí)上,Milvus 瞄準(zhǔn)的價(jià)值市場(chǎng),在過(guò)去基本是一篇空白。

在星爵看來(lái),數(shù)據(jù)庫(kù)行業(yè)在過(guò)去 20 年經(jīng)歷了一場(chǎng)巨大的“分化”,關(guān)系型數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)、文檔數(shù)據(jù)庫(kù)、時(shí)間序列數(shù)據(jù)庫(kù)……未來(lái),在 AI 時(shí)代,會(huì)有更多數(shù)據(jù)庫(kù)類(lèi)型出現(xiàn),“比如我們現(xiàn)在提到量子計(jì)算,那很有可能接下來(lái)會(huì)出現(xiàn)一個(gè)面向量子計(jì)算的數(shù)據(jù)庫(kù)。”整體上,這個(gè)行業(yè)在不斷的分工與分化,類(lèi)似汽車(chē)行業(yè),在過(guò)去 100 年間,發(fā)展出幾十上百個(gè)細(xì)分品類(lèi),在數(shù)據(jù)庫(kù)領(lǐng)域也是同樣,并且有兩點(diǎn)是不變的:

第一,人類(lèi)的需求是不斷增加的,第二,人類(lèi)社會(huì)的數(shù)字信息化程度在不斷提高,那么人們對(duì)數(shù)據(jù)分析和處理的需求必然也是在上升的,因此便會(huì)催生出更多數(shù)據(jù)的應(yīng)用場(chǎng)景,而在每個(gè)新興的應(yīng)用場(chǎng)景之下,都會(huì)出現(xiàn)一些更加具體、分工更加明確的數(shù)據(jù)庫(kù)產(chǎn)品。

那么,再看回 Milvus,它并不需要和其他種類(lèi)的數(shù)據(jù)庫(kù)做比較,而是專(zhuān)注于為 AI 應(yīng)用處理非結(jié)構(gòu)化數(shù)據(jù),比如為金融應(yīng)用做欺詐分析、做物聯(lián)網(wǎng)領(lǐng)域的移動(dòng) APP 等等,滿(mǎn)足新興的非結(jié)構(gòu)化數(shù)據(jù)處理需求即可。

不僅僅是 Milvus,對(duì)于所有項(xiàng)目,Zilliz 的判斷標(biāo)準(zhǔn)只有“需求”。

2021 年 9 月,Zilliz 發(fā)布 Millvus 的上游軟件 Towhee。

“我們推出新項(xiàng)目只考慮一個(gè)問(wèn)題,那就是解決用戶(hù)需求。”Zilliz 會(huì)從用戶(hù)需求中提煉出該做一個(gè)怎樣的產(chǎn)品給到用戶(hù)。具體到 Towhee,本質(zhì)是用戶(hù)在使用Millvus 的過(guò)程中,雖然能很好地解決數(shù)據(jù)分析問(wèn)題,但是對(duì)于一些中小型公司來(lái)說(shuō),從各種不同的非結(jié)構(gòu)化數(shù)據(jù)中提取向量數(shù)據(jù)本身需要投入很多資源。因此,為了解決這部分用戶(hù)需求,Zilliz 推出開(kāi)源的 embedding 框架,包含豐富的數(shù)據(jù)處理算法與神經(jīng)網(wǎng)絡(luò)模型,可以幫助用戶(hù)完成原始數(shù)據(jù)到向量的轉(zhuǎn)換。

在評(píng)估需求方面,Zilliz 的方法非常“樸實(shí)”,通常是在用戶(hù)群中主動(dòng)收集或接收需求,然后將用戶(hù)反饋?zhàn)鰠R總、歸類(lèi)、排序,篩選出高頻需求,歸納趨同的需求。然后將數(shù)據(jù)結(jié)果放到研發(fā)社區(qū)做進(jìn)一步討論,最終根據(jù)討論結(jié)果規(guī)劃產(chǎn)品的設(shè)計(jì)與迭代排期。

只在云上掙錢(qián)

對(duì)于做技術(shù)該怎么掙錢(qián)的問(wèn)題,星爵和他的團(tuán)隊(duì)很早就有一個(gè)標(biāo)準(zhǔn):在公有云上通過(guò)服務(wù)賺錢(qián)。

落實(shí)到具體在什么時(shí)候?qū)崿F(xiàn)商業(yè)價(jià)值的轉(zhuǎn)換,就變得非常“隨緣”。

2019 年 Milvus 產(chǎn)品開(kāi)源之后,很長(zhǎng)一段時(shí)間內(nèi),這只隊(duì)伍都沉浸在“如何打造一個(gè)全球技術(shù)領(lǐng)先的產(chǎn)品”的目標(biāo)之中?;乜串?dāng)時(shí)的想法,星爵是抱著“如果這個(gè)技術(shù)和產(chǎn)品能夠解決用戶(hù)的痛點(diǎn),同時(shí)技術(shù)上又是全球領(lǐng)先的,那么一定能為公司創(chuàng)造價(jià)值,所以前些年我們并沒(méi)有太去考慮商業(yè)模式,而是專(zhuān)注的把產(chǎn)品做好。”

對(duì)于 Milvus 團(tuán)隊(duì)來(lái)說(shuō),2020 年底,產(chǎn)品開(kāi)始邁入成熟階段,Milvus 已經(jīng)擁有 500 多家企業(yè)級(jí)用戶(hù),產(chǎn)品趨于穩(wěn)定。一方面,他們發(fā)現(xiàn)了新的用戶(hù)核心需求:用戶(hù)希望能在云上使用,在云上提供一個(gè)更加便捷的云服務(wù)。對(duì)用戶(hù)來(lái)說(shuō),云服務(wù)可以省去安裝部署的步驟,直接通過(guò) API 調(diào)用,那么開(kāi)發(fā)和維護(hù)成本也會(huì)降低。結(jié)合這兩方面的因素,Zilliz 啟動(dòng)了公有云產(chǎn)品的研發(fā)。

日前,Zilliz Cloud 的測(cè)試版本正式上線(xiàn)。Zilliz Cloud 定位于依托公有云的全托管數(shù)據(jù)庫(kù)即服務(wù),旨在為向量數(shù)據(jù)處理、?結(jié)構(gòu)化數(shù)據(jù)分析和企業(yè) AI 應(yīng)?開(kāi)發(fā)提供?站式解決案。

Zilliz Cloud本質(zhì)是 Database as a service,是將 Zilliz 向量數(shù)據(jù)庫(kù)的能力以云上全托管的方式提供給用戶(hù),免去用戶(hù)部署和運(yùn)維的工作。同時(shí),也幫用戶(hù)解決云上數(shù)據(jù)安全的問(wèn)題,包括數(shù)據(jù)合規(guī)、高可用、容災(zāi)等等,為各類(lèi)在開(kāi)發(fā) AI 應(yīng)用的企業(yè),在其開(kāi)發(fā)過(guò)程中,極大地簡(jiǎn)化非結(jié)構(gòu)化數(shù)據(jù)管理的過(guò)程。

在云產(chǎn)品之前,Milvus 開(kāi)源社區(qū)的用戶(hù)想向 Zilliz 購(gòu)買(mǎi)服務(wù)的,都會(huì)遭到拒絕,“很為很早之前我們就決定,云才是我們商業(yè)產(chǎn)品的形態(tài),除此之外,不會(huì)收用戶(hù)的錢(qián)。”

事實(shí)上,許多開(kāi)源的基礎(chǔ)軟件都和 Milvus 一樣,在走一條開(kāi)源+長(zhǎng)時(shí)間免費(fèi)的道路。在星爵看來(lái),基礎(chǔ)軟件的第一個(gè)特質(zhì)就是技術(shù)門(mén)檻高,那么在研發(fā)階段,就是一個(gè)慢工出細(xì)活的活動(dòng),需要長(zhǎng)期投入,不斷總結(jié)用戶(hù)需求,將其做成通用產(chǎn)品。另一大特質(zhì)則是一旦做出了個(gè)全球領(lǐng)先的技術(shù)和產(chǎn)品,就會(huì)出現(xiàn)“贏者通吃”的格局。而這也是 Zilliz 長(zhǎng)期堅(jiān)持以技術(shù)主導(dǎo),開(kāi)源開(kāi)放的重要原因之一。

談?wù)劗?dāng)下

當(dāng)下,Zilliz 正沿著一年多前定下的策略,走全球化的路子。具體到剛剛起步的云服務(wù)業(yè)務(wù),北美市場(chǎng)將是接下來(lái)一兩年關(guān)注的重點(diǎn)。

“如果我們看全球市場(chǎng)的估量,在基礎(chǔ)軟件領(lǐng)域,美國(guó)市場(chǎng)占全球市場(chǎng)的 30%-40% 左右,是全球第一大單一市場(chǎng)。”因此,將全球劃作為目標(biāo)的 Zilliz 將國(guó)際化的主戰(zhàn)場(chǎng)放到了北美。目前 Zilliz Cloud 已在 7 月支持 AWS,接下來(lái)將會(huì)進(jìn)一步擴(kuò)展能力,形成多云方案,包括支持谷歌 GCP,微軟的 Agile,實(shí)現(xiàn)北美三大公有云的跨云方案。

對(duì)于 Zilliz 來(lái)說(shuō),其與大型公有云廠(chǎng)商之間是競(jìng)合關(guān)系,一方面 Zilliz Cloud 依托于公有云平臺(tái),另一方面,在星爵看來(lái),同臺(tái)競(jìng)技也更能催生技術(shù)創(chuàng)新,“我們的信心是源于我們是一個(gè)創(chuàng)業(yè)公司,可以更快速地迭代產(chǎn)品,實(shí)現(xiàn)技術(shù)創(chuàng)新,所以在和公有云廠(chǎng)商同態(tài)競(jìng)技的時(shí)候,我們會(huì)堅(jiān)持開(kāi)源開(kāi)放,唯有產(chǎn)品和技術(shù)能保持核心競(jìng)爭(zhēng)力,才能最終與大象共舞。”

談及 Zilliz Cloud 未來(lái)的發(fā)展,星爵并沒(méi)有做過(guò)多預(yù)測(cè):“我不做預(yù)測(cè),我們公司也很少做預(yù)測(cè),預(yù)測(cè)容易打臉”。而商業(yè)化和營(yíng)收,也依舊不是當(dāng)下星爵關(guān)注的重點(diǎn)。面對(duì)在資本市場(chǎng)取得的成績(jī),星爵將其歸因?yàn)閳F(tuán)隊(duì)以技術(shù)為導(dǎo)向,敢為天下先地去創(chuàng)造了新技術(shù),并將其做到極致,“大家都知道稀缺性很重要,但往往在親身實(shí)踐的過(guò)程中,會(huì)發(fā)信追求稀缺性是一件很奢侈的事情,稀缺性是孤獨(dú)的,相當(dāng)不確定的,高風(fēng)險(xiǎn)的。”

同時(shí),在星爵看來(lái),將產(chǎn)品和技術(shù)做到極致之后再談商業(yè)化,也會(huì)更加容易實(shí)現(xiàn),“我們要先打造一個(gè)優(yōu)異的產(chǎn)品,這個(gè)產(chǎn)品如果不做到全球領(lǐng)先,我們認(rèn)為就不應(yīng)該推向市場(chǎng),更不應(yīng)該拿去賣(mài)。”

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )