2020年9月,伴隨著云原生數(shù)據(jù)平臺廠商Snowflake高調(diào)上市,“云原生”這個2013年就誕生的概念再度成為熱詞,被加入到眾多數(shù)據(jù)平臺廠商的廣告語中。
是創(chuàng)業(yè)公司對資本圈風(fēng)向的追隨,還是重新看到了容器化、微服務(wù)等云原生技術(shù)帶來的優(yōu)勢?亦或是因為時候到了——2020年,中國IT預(yù)算里超過50%的錢花在了云上,這不僅代表云計算已經(jīng)成為了中國的主流,同時“非原住民”的數(shù)據(jù)問題也顯得更加突出。
近日,在StartDT Day數(shù)據(jù)技術(shù)大會上,奇點云創(chuàng)始人、CEO張金銀(花名:行在)公開發(fā)布奇點云全新的數(shù)據(jù)技術(shù)戰(zhàn)略:跨平臺,云原生,自主可控。
十個字,三個詞,每一個詞都代表著技術(shù)上硬碰硬的升級。在這其中,“云原生”再次被聚焦在舞臺中央。
行在于StartDT Day數(shù)據(jù)技術(shù)大會
奇點云要做什么?為什么他們非要做“云原生”?
01 悄然生長的“云原生”
指針撥回8個月前,尋常的晚上,奇點云數(shù)據(jù)平臺部負(fù)責(zé)人地雷收到了一封日報。日報來自平臺部的運維工程師黑白,最后輕描淡寫地加了一句話:“DataSimba容器化編排已實現(xiàn)。”
DataSimba是奇點云的數(shù)據(jù)中臺產(chǎn)品,承擔(dān)了企業(yè)數(shù)據(jù)治理、開發(fā)、管理、服務(wù)等職責(zé),往下集成數(shù)據(jù),往上搭載應(yīng)用,也就是狹義上理解的“數(shù)據(jù)中臺”。
地雷十分吃驚,容器化編排并不是團隊安排給黑白的工作——當(dāng)時,容器化編排還未排入roadmap(產(chǎn)品路線圖)。它意味著兩件事:
一,2020年疫情持續(xù)和業(yè)務(wù)爆發(fā)式增長的雙重影響下,依舊有人在默默堅持,做長遠(yuǎn)的事。
二,在“云原生數(shù)據(jù)中臺”的目標(biāo)提出之前,DataSimba就已往實現(xiàn)云原生前進了一步。
這更堅定了地雷做云原生數(shù)據(jù)中臺的想法。
剛剛接手DataSimba時,為明確未來的發(fā)展路徑,地雷做了一個月的調(diào)研,發(fā)現(xiàn)“云原生”不只是新一波的buzzword而已:
“打個比方,‘數(shù)據(jù)運維’,它在市場的宣傳口徑里很少見到,因為這是苦活累活,沒有什么漂亮的東西。但我們和客戶的IT/運維同學(xué)是感同身受的——大數(shù)據(jù)集群規(guī)模大,進程多,非常需要微服務(wù)治理和其他智能運維技術(shù)。”地雷坦言,“云和大數(shù)據(jù)運維技術(shù)含量高,很多傳統(tǒng)的運維工程師會面臨比較大的學(xué)習(xí)成本。但是線上數(shù)據(jù)、計算和應(yīng)用規(guī)模還在以每年N倍的速度增長。如果不采用CI/CD(持續(xù)集成持續(xù)交付),而是堅持傳統(tǒng)的人肉運維,先別說這種運維工程師的薪酬很高,你可能都招不到這么多合適的人。”
而在存儲和計算成本層面,存儲海量數(shù)據(jù)、作業(yè)高吞吐高并發(fā)的數(shù)據(jù)中臺也對存算分離提出了更高的要求——如果把Hadoop、Spark等常規(guī)開源大數(shù)據(jù)引擎直接應(yīng)用于云主機,海量數(shù)據(jù)帶來的存儲成本和吞吐壓力,會很快“壓垮”客戶。因此,必須引入中間緩存實現(xiàn)計算存儲分離,將數(shù)據(jù)存儲到對象存儲上,同時兼容HDFS協(xié)議,能夠根據(jù)業(yè)務(wù)需求進行彈性擴容,從而大幅度降低成本,提高集群性能。
成本和效率問題,推動著數(shù)據(jù)中臺必須走向云原生。這也意味著,云原生不僅僅是一個“技術(shù)議題”。
2020年秋,經(jīng)過創(chuàng)始人、合伙人探討,行在于奇點云內(nèi)部正式提出“云原生數(shù)據(jù)中臺是數(shù)據(jù)中臺的未來”,DataSimba要成為云原生數(shù)據(jù)中臺,要讓客戶享受到云基礎(chǔ)設(shè)施的優(yōu)勢。
同期,地雷正式完成了DataSimba產(chǎn)品的排兵布陣:微服務(wù)對象體系、容器化、CI/CD、元數(shù)據(jù)管理、存算分離等云原生技術(shù)要素,由不同的產(chǎn)品經(jīng)理分別把守,構(gòu)筑起堅實的云原生技術(shù)結(jié)界。
此時,又有個新問題接踵而來:“云原生,是誰的‘云原生’?”
02 業(yè)務(wù)驅(qū)動的“跨平臺”
如果講大數(shù)據(jù)領(lǐng)域的云原生技術(shù),毋庸置疑,知名云廠商們比奇點云起步早得多,必然也成熟得多。
無論是存算分離,還是容器化、微服務(wù),這些技術(shù)要素在云廠商提供的云原生產(chǎn)品中都是必備的,而且不斷提供更精巧、更聰明的“語法糖”(Syntactic sugar),讓客戶覺得更好用。
“但那是云廠商的‘云原生’,不是客戶的云原生。”劉瑩說。
劉瑩(花名:公主)是奇點云聯(lián)合創(chuàng)始人、COO,畢業(yè)于復(fù)旦大學(xué)計算機系,曾任IBM全球副總裁總助、IBM大中華區(qū)行業(yè)銷售運營總經(jīng)理,原阿里云西南大區(qū)業(yè)務(wù)總經(jīng)理,阿里云大數(shù)據(jù)創(chuàng)新業(yè)務(wù)代言人。
作為一個有著18年to B行業(yè)經(jīng)驗的“老業(yè)務(wù)人”,她堅定認(rèn)為“客戶認(rèn)可”至上,杜絕閉門造車、“技術(shù)自嗨”。
打個比方,客戶在充分享受云原生妙處的同時,從一朵云遷移到另一朵云的成本越來越高,不能自由地選擇云廠商,而且不同云廠商之間還要分別派人、用不同的賬號管理,這樣的云原生還香嗎?
沒錯,在奇點云,最早嗅到云原生跨平臺必要性的或許是商務(wù)。
有一家全球領(lǐng)先的ODM公司,持續(xù)地為海內(nèi)外客戶提供有競爭力的硬件產(chǎn)品。奇點云在前期咨詢時估算了其未來的數(shù)據(jù)量,必須要上云。
那么問題來了:數(shù)據(jù)放哪里,上哪家云?
它的業(yè)態(tài)非常特殊,海內(nèi)外的這幾家品牌恰好都有他們自己的云服務(wù),如果把數(shù)據(jù)放在A云上,B品牌不同意;如果數(shù)據(jù)放在B云上,A品牌不同意;如果把不同品牌的數(shù)據(jù)分頭放,對于企業(yè)本身來說又大大增加了管理和分析成本,不利于未來數(shù)智化的發(fā)展。短期來看,企業(yè)只能找到一家目前還沒有這塊業(yè)務(wù)的云廠商C,把經(jīng)營、運營等數(shù)據(jù)放在C云上,先把數(shù)據(jù)中臺搭起來。
這同時也存在一個隱患,出于產(chǎn)品耦合性的考慮,企業(yè)越晚遷移,遷移成本就越大,而在組織層面,未來潛在成本的問題又沒有落到任何一個人的KPI上,大家都不知道誰來解、怎么解。
“常有人說云資源像電力資源。但不同的是,有些地方產(chǎn)電很便宜,可工廠的選址是固定的,它不可能想搬就搬去電力便宜的地方。”劉瑩說,“云資源則不一樣,企業(yè)是可以遷移去更劃算的地方的??蛻魬?yīng)該有自由選擇的權(quán)利。”
而另一邊,地雷又在進行他的“隱秘工程”。
2020年7月,地雷向高管匯報DataSimba的roadmap時,“夾帶私貨”提到了多workspace這個構(gòu)想。在會上,行在并無多言,而在會后給地雷發(fā)了個PPT,內(nèi)容是幾年前行在想做的DataSimba混合云方案。
兩個“老技術(shù)人”一碰,地雷就明白了:“行在聽懂了我的意思,哪怕這幾年技術(shù)變了,我們的想法和方向是一樣的。”
Talk is cheap, show me the code.
兩三個月后,地雷帶領(lǐng)團隊“偷偷”地把多workspace在DataSimba上實現(xiàn)了第一版,再次向高管匯報。同時,一條從真實客戶需求歸納出的結(jié)論,也自前線迅速傳遞至產(chǎn)品大后方:客戶迫切需要支持跨平臺的、中立第三方的云原生產(chǎn)品。
技術(shù)拓展商業(yè)邊界,商業(yè)驅(qū)動技術(shù)升級。明確了客戶需求,地雷在技術(shù)迭代上也更有底氣。
在5月20日StartDT Day數(shù)據(jù)技術(shù)大會上,地雷介紹:
“DataSimba R3.0目前已實現(xiàn)跨云多域數(shù)據(jù)治理,支持海內(nèi)外主流云廠商,包括AWS、阿里云、華為云、騰訊云、京東云等等,實現(xiàn)統(tǒng)一賬號、權(quán)限、審計的多workspace的兼容管理,并進一步提供數(shù)據(jù)安全和可信計算方案,從而提高基礎(chǔ)設(shè)施的可控性和安全性。”
DataSimba R3.0的跨云多域示意圖
這意味著依托DataSimba,企業(yè)可以實現(xiàn)分級多域部署和跨云跨平臺部署:
用戶、權(quán)限及配置統(tǒng)一在主域上修改,從域即可自動同步最新數(shù)據(jù);客戶可以自由在不同的地區(qū)采用不同的云廠商進行部署,避免商業(yè)因素、地域因素、單一云廠商因素等對其數(shù)據(jù)能力建設(shè)的影響。在保證單個域資源獨立的情況下,多個域之間使用統(tǒng)一的權(quán)限和賬號體系,運維和管理人員就無需在不同平臺間切換使用,工作效率也大大提升。
“這是因為我們選擇和客戶站在一起。”行在毫不避諱地表示,“奇點云是標(biāo)準(zhǔn)的乙方數(shù)據(jù)智能技術(shù)供應(yīng)商,服務(wù)于泛零售、金融、政府、制造、運營商等行業(yè),所以有動力做這兩件事:一,盡可能優(yōu)化架構(gòu),降低數(shù)據(jù)應(yīng)用在IaaS上的計算、存儲成本;二,實現(xiàn)跨云數(shù)據(jù)治理,因此客戶在云平臺的選擇上可以更加從容、更加獨立。也就是,哪兒好用用哪兒,哪兒便宜用哪兒。”
03 客戶可控的“自主可控”
相比跨平臺、云原生,自主可控這塊“硬骨頭”則難啃得多。
有一天,地雷接到行在來電:“奇點云要做自己的引擎,要自主可控。”
“我以前在阿里云ODPS就是干這個的,ODPS團隊是全阿里最貴的團隊,一百多個高級技術(shù)專家,做這一件事。奇點云一向最貼近客戶,很現(xiàn)實主義,我們適合做嗎?“地雷放下手中的事,跑到角落里和行在爭論了快一個小時。
而行在堅持:“這件事有意義,必須做。”
地雷心里非常矛盾。曾在AI四小龍之一擔(dān)任產(chǎn)品總監(jiān)的他,其實切身體會過自主可控的重要性:“那時候上實體名單,我們突然啥都不能用了,不能用蘋果電腦,也不能用Windows,甚至不能用我們常用的瀏覽器上網(wǎng)。”
但毫無疑問,自主可控的數(shù)據(jù)引擎有很高的技術(shù)門檻。時至今日,國內(nèi)實現(xiàn)自主可控數(shù)據(jù)引擎的公司用一只手?jǐn)?shù)都嫌多。
2020年7月,奇點云到一家金融機構(gòu)投標(biāo)。這家金融機構(gòu)提到:“我們已經(jīng)花錢買了CDH的版權(quán),但如果美國宣布不允許中國公司用CDH,那我們可能營業(yè)都成問題。這能不能解決?”
這個問題像一顆手榴彈,炸到了行在和地雷心里。彼時,華為EDA和國內(nèi)高校MATLAB相繼被美國禁用,幾乎每一家金融機構(gòu)都有著類似的擔(dān)憂。在這樣的國際政治經(jīng)濟環(huán)境下,自主可控(Independence),也就是在技術(shù)和業(yè)務(wù)上保證可持續(xù)供應(yīng),成為了奇點云的必選項。
最終,還是客戶讓他們下定決心:“不能讓中國企業(yè)發(fā)展在數(shù)據(jù)基礎(chǔ)設(shè)施上被‘卡脖子’。”
2021年5月,奇點云正式發(fā)布其自主可控引擎StartDT-EMR。它是自有可控的、支持各個類型大數(shù)據(jù)Job和Service的計算和存儲引擎,在技術(shù)和業(yè)務(wù)上保證客戶數(shù)據(jù)基礎(chǔ)設(shè)施的多樣化、可替換、可迭代和可掌握,并保證對關(guān)鍵點的持續(xù)創(chuàng)新。
“這未必意味著100%國產(chǎn)或100%推倒從頭發(fā)明輪子。相反,應(yīng)該盡可能融入開放生態(tài),符合工業(yè)標(biāo)準(zhǔn)。”地雷介紹。
行在則將奇點云的自主可控歸納為“開放的,可被客戶掌握的,可以被替換的,可以迭代的”。
它不受國際政治經(jīng)濟環(huán)境的影響,同時也不受廠商的控制。“它不是一個黑匣子。當(dāng)出現(xiàn)問題,客戶不用抱著一個黑匣子等待廠商上門來修,客戶可以自己看到問題所在,可以去迭代和更新。”
“自主可控,就是客戶可控。”行在再次強調(diào)。
————
從阿里巴巴到奇點云,行在做過國內(nèi)第一代DBA,搭過第一代數(shù)倉,創(chuàng)建過TCIF(淘寶消費者信息庫)第一次打通消費者數(shù)據(jù),也創(chuàng)建過阿里云數(shù)加平臺(現(xiàn)DataWorks),把大數(shù)據(jù)能力外化給社會。
走過近20年的大數(shù)據(jù)之路,“技術(shù)老兵”行在從沒放下他“普惠大數(shù)據(jù)”的野心。懷揣著數(shù)據(jù)技術(shù)的理想,旅途的終點始終指向客戶。
在5月20日的StartDT Day數(shù)據(jù)技術(shù)大會上,行在首次對外披露了一個數(shù)字:NRR235%。NRR(Net Revenue Retention)指凈收入留存率,“舉個例子,我們2019年的新客戶花了100塊購買奇點云的服務(wù),他在2020年還花了235塊,繼續(xù)購買奇點云的服務(wù)。這代表著客戶對我們充分的信任和認(rèn)可。”行在頗為驕傲地說,“作為參考,Snowflake在上市時NDR(收入為美元,即Net Dollar Retention),是158%。”
而在NRR235%之后,奇點云要做什么?
“跨平臺,云原生,自主可控。”
十個字的數(shù)據(jù)技術(shù)戰(zhàn)略后面,還跟著一句話:“和客戶站在一起。”
這個戰(zhàn)略的提出仰賴于五年來客戶的不斷鞭策,從客戶的需求中來,在DataSimba、數(shù)據(jù)智能產(chǎn)品套件、DataNuza等數(shù)據(jù)產(chǎn)品和服務(wù)中承接落地,又回到客戶的實踐中去。
奇點云產(chǎn)品矩陣
奇點云把“機器智慧超越人類智慧的瞬間”稱為奇點時刻:數(shù)據(jù)通過好的算法和應(yīng)用創(chuàng)造價值,同時應(yīng)用后又產(chǎn)生了更多有價值的數(shù)據(jù),再次讓算法和應(yīng)用成長升級,賦能業(yè)務(wù),形成一個越轉(zhuǎn)越快的閉環(huán),解放人類去思考創(chuàng)新。
很難說距離實現(xiàn)“奇點時刻”還有多久,好在奇點云還很年輕,腳踏實地之余,有足夠的時間讓他們仰望星空。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )