揭秘京東大數(shù)據(jù)

如今,我們已經(jīng)進入移動互聯(lián)網(wǎng)時代,大數(shù)據(jù)撲面而來。對于京東來說,大數(shù)據(jù)到底都能夠起到哪些作用?5月26日,老冀在貴陽大數(shù)據(jù)博覽會上見到了京東大數(shù)據(jù)部副總經(jīng)理邢志峰,也就是京東研發(fā)部門內(nèi)部俗稱的“邢捕頭”,向他請教了一下京東大數(shù)據(jù)的一些問題。

邢捕頭算是京東大數(shù)據(jù)的資深員工了,他在2009年就加入了京東,一直在京東數(shù)據(jù)部門。當(dāng)時《武林外傳》挺火的,同事們看他做事認(rèn)真,于是給他起了個電視劇里面角色的外號。

(圖:京東大數(shù)據(jù)部副總經(jīng)理邢志峰)

分分合合的大數(shù)據(jù)路線

京東大數(shù)據(jù)說來話長,實際上,它經(jīng)歷了一個分分合合的過程。

2009年7月的時候,邢捕頭的心情可沒有現(xiàn)在輕松。那個時候,快速增長的業(yè)務(wù)帶來了海量的數(shù)據(jù)需求,業(yè)務(wù)部門扔過來大量的數(shù)據(jù),幾乎天天到他那里來“討賬”。于是京東數(shù)據(jù)部在2009年底正式成立。

到了2010年下半年,數(shù)據(jù)部依照服務(wù)職能對象的不同拆分為兩個團隊,其中一個主要面向采銷、市場等部門,另一個數(shù)據(jù)團隊則為倉儲、物流等部門提供服務(wù)。

巧合的是,這兩支團隊也選擇了不同的技術(shù)路線。一個選擇了基于開源的MySQL自建數(shù)據(jù)倉庫,自主開發(fā)配套的數(shù)據(jù)調(diào)度生產(chǎn)、數(shù)據(jù)分析提取、數(shù)據(jù)知識管理、數(shù)據(jù)報表呈現(xiàn)及數(shù)據(jù)質(zhì)量監(jiān)控的產(chǎn)品體系,并建設(shè)相應(yīng)的數(shù)據(jù)集市與業(yè)務(wù)部門聯(lián)合推廣使用。

另一個數(shù)據(jù)團隊選擇了購買ORACLE RAC小型機/ORACLE BIEE商業(yè)智能平臺,數(shù)據(jù)處理效率也得到了明顯提高。

但是隨著京東業(yè)務(wù)的不斷擴張和高速增長,商業(yè)軟件的局限性就日益顯露出來了,主要表現(xiàn)在兩個方面:

一個是維護成本高,商業(yè)軟件此后的每一次升級都要請原廠的專家上門,這個服務(wù)費可是相當(dāng)?shù)母摺?/p>

另一個更重要的則是快速響應(yīng)能力。電商行業(yè)變化非???,幾乎每天業(yè)務(wù)部門都要做一些策略調(diào)整,比如增加某些品類,砍掉另一些品類,而商業(yè)軟件都是模塊化的,并沒有那么強的靈活性,響應(yīng)速度根本跟不上業(yè)務(wù)的發(fā)展。實際上,我們看到一些使用了商業(yè)軟件的電商在這個方面吃虧不小。

到了2012年年初,為了更好地應(yīng)對業(yè)務(wù)的快速增長,京東數(shù)據(jù)部又合在了一起,并且確定了基于Hadoop的分布式開源技術(shù)架構(gòu),原來的SQL Server和ORACLE數(shù)據(jù)倉庫均退出了歷史舞臺。在Hadoop的基礎(chǔ)上,京東開發(fā)出了JDW企業(yè)級數(shù)據(jù)倉庫,目前集群的總存儲量已經(jīng)達到了50PB以上,是名副其實的大數(shù)據(jù)。

更加真實有效的大數(shù)據(jù)

在貴陽大數(shù)據(jù)博覽會上,出任京東集團高級副總裁及京東研發(fā)體系負(fù)責(zé)人的張晨表示:“京東全品類、全價值鏈的電商數(shù)據(jù)在行業(yè)內(nèi)具有稀缺性,它使得京東大數(shù)據(jù)在數(shù)據(jù)、模型、技術(shù)、工具等多個層面高度的整合和統(tǒng)一,大大提升了大數(shù)據(jù)在整個集團內(nèi)融合和利用的效率,促進大數(shù)據(jù)的深度價值挖掘?!?/p>

簡單來講,京東大數(shù)據(jù)的優(yōu)勢得益于京東電商業(yè)務(wù)的全價值鏈數(shù)據(jù)。由于京東的主要業(yè)務(wù)是自營式電商,而且要求端到端的流程控制,使得京東的大數(shù)據(jù)覆蓋了電商的全部流程,從采購、庫房、銷售、配送到售后、客服,整個鏈條是完整的。

“數(shù)據(jù)不僅僅大才有價值,如果不完整或者只是局限于某個點的話,價值就小了。京東的數(shù)據(jù)很完整,量又很大,這個數(shù)據(jù)就很值錢?!毙喜额^認(rèn)為。

而且由于京東對商品交易過程實行嚴(yán)格的管控,在京東平臺上進行代購和刷單的行為都是不允許的,這也使得京東的用戶數(shù)據(jù)更加接近真實用戶的真實需求。

有了真實有效的大數(shù)據(jù),京東就可以做很多的事情,比如精準(zhǔn)營銷、用戶畫像、C2B定制,等等。

以老冀為例,比如老冀想在京東上買本《從零到一》,結(jié)果正好這本書脫銷,老冀于是點擊了一下“到貨提醒”。過了幾天,老冀收到一封郵件,告訴老冀這本書已經(jīng)到貨了,并且還推薦了《奇點臨近》、《創(chuàng)業(yè)者的思考》,老冀發(fā)現(xiàn)這兩本也是自己想要的書,于是照單全收。

不過,老冀感覺京東每次登陸的主頁面還是非常龐雜,似乎不如美國亞馬遜那么簡潔、個性化和有針對性。邢捕頭坦誠,目前京東在A/B 測試方面還不如亞馬遜成熟。所謂A/B 測試,就是先建立一個測試頁面,這個頁面在呈現(xiàn)邏輯和內(nèi)容上與原有頁面有所不同,然后將這兩個頁面以隨機的方式同時推送給所有瀏覽用戶,接下來分別統(tǒng)計兩個頁面的用戶轉(zhuǎn)化率,即可了解到兩種策略的優(yōu)劣。還有一個也是跟中國網(wǎng)民的購物習(xí)慣相關(guān):大部分美國網(wǎng)民購物非常直接,而中國網(wǎng)民則喜歡那種“逛”的感覺。

大數(shù)據(jù)還有個很大的作用,就是用戶畫像。前面老冀談到京東有個很獨特的優(yōu)勢,就是數(shù)據(jù)更加真實可靠。而且經(jīng)過了十多年的發(fā)展,京東的商品品類也已經(jīng)非常豐富,目前已經(jīng)有接近1億SKU。很多商品本身就會有用戶特征,比如女士的胸罩和內(nèi)衣,男士的刮胡刀,等等。京東根據(jù)這些購買行為給用戶打上標(biāo)簽,直至勾畫出一幅清晰的用戶畫像。

有了用戶畫像,京東就可以做很多事情了。舉個例子,根據(jù)用戶在下單前的瀏覽情況,京東就可以了解用戶的購物性格是沖動型、理性型還是猶豫型。對于沖動型用戶,京東直接推薦給Ta最暢銷的同類商品,而理性型用戶則推薦給Ta口碑最好的商品。

京東還將用戶畫像數(shù)據(jù)提供給網(wǎng)站智能機器人JIMI,使得JIMI能夠快速理解用戶意圖、從而對用戶進行個性化關(guān)懷,從而大幅度提升用戶的滿意度。

而隨著2014年京東收購了騰訊的實物電商部門,并將其數(shù)據(jù)整合進來,京東大數(shù)據(jù)的準(zhǔn)確性又得到了提升。此外,京東的大數(shù)據(jù)還能夠與騰訊的QQ/微信大數(shù)據(jù)結(jié)合起來,從而開展更有針對性的營銷活動。從過去一段時間雙方的聯(lián)合推廣來看,大數(shù)據(jù)功不可沒。

幫助業(yè)務(wù)部門決策

其實,大數(shù)據(jù)還能夠做更多的事情。對于邢捕頭所在的部門來說,最重要的還是幫助業(yè)務(wù)部門更好地決策。

比如目前市面上有那么多款手機,京東手機采銷部門到底應(yīng)該采購哪一款手機?就可以根據(jù)京東大數(shù)據(jù)參考決策。如今,京東更深入了一步,在2013年推出了JDPhone計劃,與手機廠商一起打造用戶喜歡的手機。

舉個例子:京東大數(shù)據(jù)顯示,近半年來在京東購買過兩次以上手機的用戶,其中34%都選擇了更大屏幕,但是5.5寸是他們接受的極限,因此建議手機廠商選擇4.8-5.5寸屏幕作為最優(yōu)尺寸。最近這幾年,正是基于大數(shù)據(jù)的威力,JDPhone計劃先后與中興、華為等手機制造企業(yè)合作,推出了目前市場上很多暢銷的機型

“我們的數(shù)據(jù)能夠幫助業(yè)務(wù)人員做決策和判斷,能夠利用很多統(tǒng)計方式展現(xiàn)報表,以更加形象、實時和統(tǒng)一的方式提供給他們,通過業(yè)務(wù)應(yīng)用服務(wù)于我們的消費者?!毙喜额^對于自己的工作感到非常自豪。

2011年11月,京東準(zhǔn)備對快遞包裹收費。那么,當(dāng)用戶的訂單金額到了多少才能夠不收費呢?為此,京東大數(shù)據(jù)部門模擬了一個場景,分別按照用戶訂單免運費下限為19元、29元到89元之后,對京東的整體毛利情況做了一個詳細的測算,然后找到了比較合理的價格區(qū)間,將報告提交給了公司高層,對于配送費的合理制定起到了很好的輔助決策作用。

如今,對于京東高達上億的SKU,單是補貨就是個大問題,如果只是依靠人工補貨根本就忙不過來。京東供應(yīng)鏈研發(fā)團隊自主開發(fā)了一套補貨系統(tǒng),項目上線之后,給圖書部門的采購補貨工作帶來了極大的便利。面對超過百萬而且不斷增長的SKU,圖書業(yè)務(wù)部門的采購人員并沒有顯著增加

此外,京東還將自己的大數(shù)據(jù)拿出來,與復(fù)旦大學(xué)聯(lián)合推出了復(fù)旦-京東信息消費指數(shù),包括消費者行為與信心指數(shù)、電子商務(wù)行業(yè)景氣度指數(shù)、電子商務(wù)便利度指數(shù)三大子指數(shù),共同構(gòu)成了一個完善的指標(biāo)體系,綜合反映了當(dāng)前信息經(jīng)濟消費情況,能夠為政府政策、行業(yè)發(fā)展、消費者行為模式等提供重要的參考價值。這也是目前我國首個用于評估電子商務(wù)、“互聯(lián)網(wǎng)+”等信息要素集聚程度以及績效表現(xiàn)的綜合性指數(shù)。

馬上就要到618京東大促了,6月18日和19日兩天,也是京東大數(shù)據(jù)部門最忙碌的兩天,他們要收集這次大促全方面的數(shù)據(jù),經(jīng)過數(shù)據(jù)挖掘并整理之后提供給京東高層,為下一步的決策做參考。

由此可見,京東已經(jīng)離不開大數(shù)據(jù),而大數(shù)據(jù)也已經(jīng)成為京東武器庫中最重要的武器之一。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-06-03
揭秘京東大數(shù)據(jù)
如今,我們已經(jīng)進入移動互聯(lián)網(wǎng)時代,大數(shù)據(jù)撲面而來。對于京東來說,大數(shù)據(jù)到底都能夠起到哪些作用?5月26日,老冀在貴陽大數(shù)據(jù)博覽會上見

長按掃碼 閱讀全文