數(shù)據(jù)是未來的原材料
電商交易量每年增加一倍,但對所積累數(shù)據(jù)的了解程度是否跟著增加一倍呢?如果電商現(xiàn)在不開始收集數(shù)據(jù)及應用起用,未來要用數(shù)據(jù)的時候,就會發(fā)現(xiàn)過去的數(shù)據(jù)已經(jīng)是一堆垃圾。 許多人已經(jīng)開始意識到,未來的電商是數(shù)據(jù)之戰(zhàn),在這種大數(shù)據(jù)的背景之下,電商收集數(shù)據(jù)的邊界在哪里?又該如何快速運用數(shù)據(jù)做出正確的商業(yè)決策?這是多數(shù)電商公司的困擾。
數(shù)據(jù)是越多越好嗎
后來在美國遇到Patil,他認為過去收集數(shù)據(jù)很難,而現(xiàn)在獲取數(shù)據(jù)資源變得更容易。但是如果收集數(shù)據(jù)的出發(fā)點,不是為了解決問題,那么收集再多的數(shù)據(jù)有什么意思呢?
可是許多公司還有一個疑問是,現(xiàn)在收集數(shù)據(jù)不難,成本也不高,為什么不先收集數(shù)據(jù)再說呢?等以后需要數(shù)據(jù)來解決問題時再拿出來用也可以。Patil的答案我也很認同,他勸大家千萬別這么想,用這樣的理念來設計數(shù)據(jù)應用肯定會失敗的。數(shù)據(jù)是沒有邊際的,我為此也痛苦了好一段日子。比如收集一個人的生日,可以精確到幾分幾秒,但這么精確的數(shù)據(jù)有什么應用,能產(chǎn)生什么價值呢?
事實上,數(shù)據(jù)是有生命周期的,比如從中國身份證號碼是可以推斷出性別的,但是過幾年如果這個規(guī)則變了,導致我們基于數(shù)據(jù)所做假設和決策依據(jù)也就失去了意義(Data Broken)。更何況保存數(shù)據(jù)及其收集時的背景(Context)也是一件不容易的事情。所以說,在收集數(shù)據(jù)的同時,我們必須知道未來可以用來做什么,今天都想不出來的話,日后就更不容易想出來了。
打一個比方,今天很多電商老板會問重復購買率是多少,于是我們收集數(shù)據(jù)來計算重復購買率,卻很少想到需要重復購買率來做什么決定。這就好比刻舟求劍這個故事,他告訴我們世事在變,我們不能只是機械的套用方法或指標。就像重復購買率有不同的定義,而做不同的決策需要不同定義的重復購買率。如果從一家投資公司的角度來看重復購買率,它想收購A公司,那么會從重復購買率來看整個A公司的健康程度或用戶質(zhì)量等。如果從A公司本身運營的角度來看重復購買率,那么它更關(guān)注的是日、周級別的重復購買率的變化趨勢,或者當月新增客戶有多少人在三個月后的重復購買,從而可以衡量每個月新增及存量客戶的忠誠度和質(zhì)量,找出改善的空間。知道了以上的背景之后才去選擇用什么數(shù)據(jù)不是更靠譜嗎?
數(shù)據(jù)應用因小而美
從2011年年底,我開始思考怎么從“用數(shù)據(jù)”轉(zhuǎn)變?yōu)?ldquo;養(yǎng)數(shù)據(jù)”(即數(shù)據(jù)運營轉(zhuǎn)變?yōu)檫\營數(shù)據(jù)),這一段時間我特別為收集什么樣的數(shù)據(jù)而煩惱(more data, more problem)。而且,我也曾經(jīng)想做一個特別大的適合多數(shù)人使用的數(shù)據(jù)應用出來(虛火上升),可是后來發(fā)現(xiàn)這在數(shù)據(jù)應用的起步階段幾乎是不可能的,一是找到可以解決大部分人需求的數(shù)據(jù)應用不容易,二是支付寶的數(shù)據(jù)非常豐富,需要考慮的因素很多,因素之間的聯(lián)系又很復雜。
所以,我總結(jié),當做數(shù)據(jù)應用的時候,數(shù)據(jù)就是等于原材料,當原材料一直處于變化的情況下,做出來的產(chǎn)品很容易出問題。體會數(shù)據(jù)和應用的關(guān)系之后,我最后決定從小角度切入,先做小應用出來(很好的瞄準器)。