在前不久的一次線下的交流活動中,我給現(xiàn)場學員出了幾道有關數(shù)據驅動和用戶畫像的題目,結果很有意思,我分享一下幾個典型的題目和答案統(tǒng)計如下:
問題1:想要用戶增長你會怎么做?
幾乎90%的學員都選擇了要了解現(xiàn)有用戶分層結構。
問題2: 實現(xiàn)千人千面產品最需要的企業(yè)能力?
從回答的結果來看:90%以上的學員選擇了數(shù)據采集,近80%的學員選擇了算法建模。
問題3: Profile形成的用戶畫像可以用在什么領域
從回答的情況來看,近95%的人選擇了精準營銷,近89%的人選擇了個性化服務。其他問題限于今天的篇幅,下次舉例給大家。
所以今天的關鍵詞就是用戶分層、精準營銷和個性化服務,似乎很多企業(yè)都在希望可以通過大數(shù)據和機器學習技術來實現(xiàn)技術驅動精細化運營,降本增效,但為什么效果都不好呢?
要成為可以實現(xiàn)數(shù)據驅動精細化運營的黑客,你的團隊需要做好這些事情:
企業(yè)的數(shù)據驅動運營的基礎:數(shù)據采集和整合
舉一個比較具有代表性的例子:
- 某在線旅游企業(yè)的主要業(yè)務是目的地度假、機票及門票線上銷售業(yè)務
- 該集團有大量線下營業(yè)的門店,店內也有銷售終端負責線下訂單管理。
- 該企業(yè)有“XYZ游”這個產品,主要以“XY游”APP+H5站提供服務,分“安卓”及“IOS”兩個版本,可從應用市場下載,使用友盟分析工具
- 該企業(yè)后臺收集了部分注冊信息和訂單數(shù)據,與友盟數(shù)據有差異。用戶為中、高端的自由行的客人,提供目的地度假服務,包含行前、行中、行后服務。
- 該集團管理層希望對對潛在用戶(關注未注冊)、實際用戶(已注冊)、休眠用戶做360度的全貌了解、分析;對每次在APP中或搜索引擎廣告、微博、微信等新媒體中做的活動,做實時的了解及評估,制定有效的業(yè)務增長方案。
- 更進一步,由于人工智能很火,該集團希望通過引入大數(shù)據和人工智能降低人工運營成本,并實現(xiàn)的數(shù)據驅動的自動化運營效果。
我相信這個集團是希望能夠像我們在集訓營中教授那樣可以通過對數(shù)據的利用,從人工規(guī)則過渡到通過輸入有效數(shù)據,來訓練系統(tǒng)建立決策模型,達到部分甚至全部自動化的階段。
所以好像下面這樣的解決方案可以滿足他們理想中的“數(shù)據和AI驅動運營”了吧?
這看上去似乎是一幅很美妙的前景,不是嗎?
如果你深入分析上面這家企業(yè),其實整個團隊連數(shù)據收集和整合處理的基礎工作都沒有做好,我列舉一下可能的情況:
- 該企業(yè)沒有一套完整的數(shù)據倉庫,把外部和內部的數(shù)據保存完整(Raw Data,非采樣數(shù)據)
- 該企業(yè)的用戶行為數(shù)據沒有設計規(guī)劃過數(shù)據采集策略,比如對“新增”,“活躍”,“崩潰”,“會話”,“事件”等數(shù)據基礎指標的定義不準確,數(shù)據上報的頻率,場景,類型沒有規(guī)劃。
- 各業(yè)務平臺:各個網站(官網&移動網站),不同版本的APP用了完全不同的技術供應商,數(shù)據完全缺乏可信度。
- 各個外部渠道的數(shù)據追蹤不準確,包含:廣告渠道(比如:SEM搜索廣告、百度品專、付費應用市場)、免費渠道(比如:organic搜索、免費應用市場)、直接流量、合作渠道等
- 后臺的訂單和注冊數(shù)據缺乏與行為數(shù)據關聯(lián)整合的手段
- 所有的運營及營銷效果數(shù)據靠人工跑數(shù)據,并經常出現(xiàn)字段意義混淆,或者干脆沒有相關數(shù)據
下圖是一個大型電商企業(yè)的數(shù)據埋點混亂的示例
試問,在這種情況下,不要說在各個網站和APP對每個用戶做到千人千面了,哪怕是最基本的數(shù)據分析和挖掘都可能無法實現(xiàn),還談什么人工智能驅動業(yè)務運營呢?
俗話說,工欲善其事,必先利其器。
拿餓了么的例子來說,一套智能化的千人千面產品背后必然有著堅實的平臺和工具體系,餓了么的搜索推薦體系包含橫向的基礎設施層、數(shù)據及特征層、算法及模型層以及縱向的策略支撐平臺和業(yè)務運營平臺。
基礎設施層可謂是最底層的設施,包括大數(shù)據處理平臺、機器學習平臺、實時計算平臺,用來提供最基礎的數(shù)據處理能力和機器學習能力。
數(shù)據和特征層包括為搜索推薦廣告等業(yè)務構建的私有數(shù)據倉庫和主題集市、實時生態(tài)數(shù)據體系、文本和標簽挖掘體系、用戶和商戶畫像體系以及特征處理中心等。
策略支撐平臺包括模型管理系統(tǒng)、AB測試引擎、實時效果監(jiān)控及Debug系統(tǒng)等,主要是為了提升整個算法流程的效率,快速進行迭代。以AB測試引擎為例,搜索推薦的各個服務均已接入,每天運行的千人千面的算法測試有幾十個以上。
業(yè)務運營平臺主要是供產品、運營人員查看和調整算法層面內容的平臺,包括流量調控系統(tǒng)、排名可解釋系統(tǒng)、詞庫和標簽管理系統(tǒng)等。
一個典型的數(shù)據驅動業(yè)務增長的例子(含AB測試)
下圖是一個旅游平臺酒店的用戶畫像案例。通過把用戶與業(yè)務屬性相關的數(shù)據進行線性回歸計算,然后把結果偏好映射到了二維表。二維表的數(shù)值越高,代表用戶的消費能力越高,最后可以基于這個映射過程做“同類人推薦”。
在大型的旅游平臺里,用戶經常會瀏覽酒店下方的評論,這些評論可以通過文本挖掘的方式形成標簽,例如“價格適中”、“安靜”、“床品好”等描述詞,然后再通過自然語言處理算法形成數(shù)據模型,并內置在系統(tǒng)中給每個點評打出用戶標簽,這樣的做法可以影響到新用戶的轉化率。
當一個新用戶在瀏覽過程中,系統(tǒng)可以根據這個用戶的標簽,篩選到類似的點評首先展現(xiàn)在頁面上,會對轉化率有一個很大的提升。
▍通過AB測試驗證相關性
在上面講講到的酒店案例中,在一開始上算法的過程中,其實是不能保證一定可以有效提升轉化率的,因此要做AB測試。
A/B測試是現(xiàn)代科學方法特別是西醫(yī)的基礎,可以用于企業(yè)的科學決策,保證業(yè)務的確定性持續(xù)性的增長。A/B測試已經逐漸替代傳統(tǒng)的“拍腦袋”決策方法,在互聯(lián)網行業(yè)有廣泛的應用。
實際上一些很有名的例子,一些很有名的增長公司都是這么做的,比如說 Aribnb,他們所有的頁面修改和流程上的調優(yōu),都會通過灰度發(fā)布到1%,或者5%的用戶,去看訪問時間,去看留存,去看下單,只有好的它才會上線,壞的它就會砍掉。
Google 每個月都會做幾百個測試,其實有一些給 Google 帶來了很多的營收增長,也有很多是很失敗的項目。Google 在幾百個里面,可能最后有10幾個成功了,這些產品經理他們可能很驕傲,自己的產品能夠給全世界所有的用戶用,還為公司帶來了2%營收的增長,僅僅通過 AB 測試的方式 Google 就可以達到華爾街的要求。
有一些東西真的只有測試過才知道,就是產品經理、運營人員、技術人員,沒有辦法理解的,比如說 Google 的廣告位,如果你左移一個像素你就會賺錢,左移兩個像素你就會虧錢,沒有任何人知道為什么,但是 AB 測試可以告訴你。所有的改動都需要提前經過測試之后才可以上線。
Facebook 更是這樣,他們的移動端尤其如此,會把所有的新功能都集成到代碼里面去,然后再把未來6個月要做的試驗都集成進去,不斷地去測。除了 Facebook 的產品得到提升之外,它還得到一個特別好的口碑叫沒有 bug,可以想象 Facebook 幾十億的下載,它沒有 bug 是多么的可怕。國內的百度搜索、大眾點評、知乎這些網站,他們也都會做自己的 AB 測試,當然他們做的也都很好。
上圖是谷歌的一個工作流程,在任何項目實現(xiàn)之前,都需要先做一個小流量的測試。AB測試是利用統(tǒng)計學原理,把一個產品上的用戶,按照流量的算法進行區(qū)分,排除相互干擾的因素進行測試。通常會進行三組,一組是原來的版本,第二組是測試的試驗組,第三組是一個對照組(與試驗組不同的方法,用于排除某一個特定的元素)。
在做AB測試的時候也需要根據用戶標簽做篩選,根據特定用戶群體做驗證。關于AB測試的70%的結果,很可能是讓你意識到你的實驗結果沒有統(tǒng)計性上的顯著相關性。也就是前面的相關性表格,如果相關性不顯著,可能這個方案就要放棄。我這里再強調一下相關性因果性的事情,大家可以看下面這個例子:
如果說一個外星人來到地球,發(fā)現(xiàn)下雨的時候經常出現(xiàn)雨傘,所以他判斷“因為有雨傘,所以下雨了”,這個是有問題的。雨傘和雨是相關性的典型例子,用因果來判斷會導致以為不帶傘就不會下雨的謬論。因果其實也是我們人類在探索產品改版,或者遇到未知問題時候的一種思維模式,我們希望通過A來驗證B是否產生,來判斷A導致B,而往往陷阱就在這個思維模式里面。
希望大家如果在實戰(zhàn)當中要用到 AB 測試,可以看微軟的科學家Ronny Kohavi 總結的八條經驗,非常非常黑客的經驗:
- 經驗一. 效果驚人,某些很微小的改動,就可能造成對你 KPI 巨大的影響。
- 經驗二. 大多數(shù)改動都不會大幅度提升 KPI,所以你需要耐心。
- 經驗三. Twyman 法則,凡是看上去很出人意料的圖表,通常都是因為數(shù)據統(tǒng)計錯了。
- 經驗四. 各個產品幾乎都不一樣,你復制他人的經驗,往往都沒有什么效果。
- 經驗五. 任何能加速用戶響應時間的改動,都會帶來 KPI 的正向提升。
- 經驗六. 點擊率是很容易提高的,但是流失率是很難改進的,千萬不要把精力放在優(yōu)化某個頁面點擊率上。(其實要提高點擊率非常簡單,你只要在這個頁面上加一個大美女就可以了,但是它并不能帶來你真正實際上的增長。)
- 經驗七. 盡量不要做很復雜的大量改動的實驗,而是要做很簡單的小的迭代。
- 經驗八. 幾千上萬的用戶才容易展開高效的 AB測試。
文:顧青?@共相Ebizcamp(e-bizcamp)
首席增長官CGO薦讀小紅書推廣:
更多精彩,關注:增長黑客(GrowthHK.cn)
增長黑客(Growth Hacker)是依靠技術和數(shù)據來達成各種營銷目標的新型團隊角色。從單線思維者時常忽略的角度和高度,梳理整合產品發(fā)展的因素,實現(xiàn)低成本甚至零成本帶來的有效增長…
本文經授權發(fā)布,不代表增長黑客立場,如若轉載,請注明出處:http://m.gptmaths.com/cgo/19026.html