從5W1H起入門風(fēng)控系統(tǒng)設(shè)計(jì)

一、什么是風(fēng)控

場(chǎng)景1:一位跟你從小玩到大,而且一直都有聯(lián)系、有故事的好朋友,突然說(shuō)家里有啥事,想問(wèn)你借一筆錢,一想到好朋友有困難,你可能會(huì)當(dāng)仁不讓的出手相助,甚至什么時(shí)候還都沒(méi)問(wèn),就把錢借出去了。

場(chǎng)景2:某天你突然接到一個(gè),來(lái)自十余年沒(méi)回過(guò)的老家的陌生號(hào)碼的電話,電話那頭,是一副你完全陌生的嗓音,搭配咄咄逼人的語(yǔ)氣,說(shuō)道:xxx啊,我是你小學(xué)同學(xué)某某某,我現(xiàn)在很缺錢,想要借五千塊錢。但是你想了一會(huì)兒,可能都記不起這個(gè)同學(xué)的模樣,甚至懷疑到底有沒(méi)有這個(gè)同學(xué)。此時(shí)你大概率會(huì)認(rèn)為是詐騙電話,臭罵騙子一通,然后把電話掛了。

在這些很常見(jiàn)的場(chǎng)景中,我們其實(shí)就完成了一次又一次完整的風(fēng)控過(guò)程:

  • 畫(huà)像分析與風(fēng)險(xiǎn)評(píng)估:通過(guò)對(duì)借款人的背景信息評(píng)估,好朋友的往事信手拈來(lái),家庭背景、償還能力、近況都很清晰,風(fēng)險(xiǎn)系數(shù)低;默認(rèn)的同學(xué),背景信息缺乏、近況完全未知、償還能力未知,風(fēng)險(xiǎn)系數(shù)極高。
  • 風(fēng)險(xiǎn)措施:風(fēng)險(xiǎn)系數(shù)低的朋友,放款快、額度高、還款周期寬松;風(fēng)險(xiǎn)系數(shù)高的同學(xué),要是再來(lái)電話,得問(wèn)清楚家庭關(guān)系、地址、原因、目前從事的工作類型、工作單位及地點(diǎn)等信息,就算有別的認(rèn)識(shí)的同學(xué)擔(dān)保,也要打個(gè)借條明確還款時(shí)間、逾期懲罰,如果哪點(diǎn)做不到或者內(nèi)容含糊不清,一概拒絕借錢。

風(fēng)險(xiǎn)控制的目的:就是在自我利益最大化的前提下,采用各種舉措,減少風(fēng)險(xiǎn)事件的發(fā)生,或者減少風(fēng)險(xiǎn)造成的損失。

二、風(fēng)控第一步:明確利益

風(fēng)控的前提是,保障自己的利益,如果不需要保障自己的利益,那也就沒(méi)必要風(fēng)控了,就像電影《西虹市首富》,王多魚(yú)的投資策略就是,投資的事情最好越離譜越好,無(wú)償?shù)臑榇蠹业膲?mèng)想買單,這種情況下,風(fēng)控就完全多余的。

但現(xiàn)實(shí)生活中,一個(gè)系統(tǒng)、一款產(chǎn)品,都需要考慮風(fēng)控這件事了,那必然是出于某個(gè)目的、某種利益驅(qū)動(dòng)的。免費(fèi)的APP希望屏蔽爬蟲(chóng),節(jié)省服務(wù)器流量;收費(fèi)的APP希望屏蔽羊毛黨,減少損失、增加利潤(rùn)……

明確風(fēng)控的目的,是設(shè)計(jì)風(fēng)控系統(tǒng)的第一要?jiǎng)?wù),現(xiàn)在我們有個(gè)系統(tǒng),用戶通過(guò)在指定地點(diǎn)簽到完成任務(wù),累計(jì)一定數(shù)量,就可以兌換獎(jiǎng)勵(lì),那我們風(fēng)控的目的,是不想獎(jiǎng)勵(lì)給那些作弊的人,把獎(jiǎng)勵(lì)真正給到那些真實(shí)完成任務(wù)的人,從而激勵(lì)大家更積極、認(rèn)真的參與任務(wù)。

  • 明確目的:減少獎(jiǎng)勵(lì)損失、讓獎(jiǎng)勵(lì)給到真正參與的人
  • 采取手段:找到作弊者,然后拒絕發(fā)放獎(jiǎng)勵(lì),對(duì)此作弊甚至直接拉黑處理
  • 前提條件:如何找到作弊者呢?盡可能的減少人工審核投入,希望根據(jù)收集的大數(shù)據(jù),建立數(shù)據(jù)模型,找出最可能有作弊嫌疑的用戶,再進(jìn)行人工復(fù)核。

再例如最常見(jiàn)的借貸APP,他們是對(duì)風(fēng)控系統(tǒng)依賴、專研最多的行業(yè)之一。

  • 明確目的:把錢結(jié)給能還得起、且愿意還錢的人,從而保障本金成本少流失、利息收益最大化。
  • 采取手段:鑒別貸款者的還款功能,對(duì)于還款能力低的人,授予額度低甚至不授予額度
  • 前提條件:如何鑒別貸款者還款能力呢?根據(jù)收集的大數(shù)據(jù)、人行征信及其他第三方系統(tǒng)數(shù)據(jù)等,找出該用戶的收入能力、消費(fèi)能力、信用記錄等,從而評(píng)估該用戶:是否還得起、是否愿意還。

只有明確了需要風(fēng)控系統(tǒng)介入的目的,才能更好的進(jìn)行風(fēng)控模型、風(fēng)控舉措的設(shè)計(jì),從而讓風(fēng)控系統(tǒng)的價(jià)值最大化。

三、風(fēng)控第二步:設(shè)計(jì)風(fēng)險(xiǎn)模型

風(fēng)險(xiǎn)模型用于評(píng)估風(fēng)控對(duì)象對(duì)于風(fēng)控目標(biāo)的風(fēng)險(xiǎn)程度,那要如何構(gòu)建風(fēng)險(xiǎn)模型呢?

首先我們要盡可能掌握風(fēng)控對(duì)象可能與風(fēng)控目標(biāo)有關(guān)聯(lián)的所有信息,然后評(píng)估這些信息的風(fēng)險(xiǎn)程度,不同的信息根據(jù)關(guān)聯(lián)程度不一樣,又會(huì)有不同的權(quán)重,最后加權(quán)計(jì)算就得出了風(fēng)控對(duì)象的風(fēng)險(xiǎn)系數(shù)。

結(jié)合實(shí)際例子理解:現(xiàn)在有一款產(chǎn)品,運(yùn)營(yíng)會(huì)創(chuàng)建一系列的指定地點(diǎn)打卡有獎(jiǎng)的任務(wù),用戶領(lǐng)取任務(wù)后,在對(duì)應(yīng)地點(diǎn)完成打卡,即可獲得一定的獎(jiǎng)勵(lì)。但是考慮到運(yùn)營(yíng)獲得的地點(diǎn)信息不一定是準(zhǔn)確的,所以簽到地點(diǎn)允許有一定的距離誤差。

1. 業(yè)務(wù)流程梳理

我們對(duì)用戶獲得獎(jiǎng)勵(lì)的行為路徑進(jìn)行梳理:

2. 數(shù)據(jù)整理

我們將每個(gè)階段會(huì)產(chǎn)出的數(shù)據(jù)進(jìn)行梳理:

  • 注冊(cè):注冊(cè)時(shí)間/時(shí)長(zhǎng)、手機(jī)號(hào)碼(引申出運(yùn)營(yíng)商、號(hào)碼段、歸屬地等信息)、注冊(cè)IP(引申出ip歸屬地)
  • 瀏覽:近3天、7天、14天、1個(gè)月、3個(gè)月、1年活躍程度,包括看了哪些頁(yè)面、訪問(wèn)頻率、一般什么時(shí)候看、訪問(wèn)地點(diǎn)(通過(guò)ip地址分析)、訪問(wèn)的設(shè)備信息(引申出設(shè)備型號(hào)、設(shè)備號(hào)、APP版本等)
  • 實(shí)名認(rèn)證:姓名、性別、年齡、身份證號(hào)、戶籍所在地
  • 銀行卡信息:卡號(hào)、卡戶行、開(kāi)戶地
  • 領(lǐng)取任務(wù):任務(wù)類型、創(chuàng)建時(shí)間、創(chuàng)建人、任務(wù)時(shí)間、任務(wù)地點(diǎn)、任務(wù)熱度(任務(wù)最大領(lǐng)取人數(shù)、任務(wù)已領(lǐng)取人數(shù)、任務(wù)PV/UV訪問(wèn)情況等)、任務(wù)獎(jiǎng)勵(lì)、領(lǐng)取時(shí)間、領(lǐng)取地點(diǎn)、領(lǐng)取設(shè)備等
  • 打卡:打卡時(shí)間、打卡地點(diǎn)、照片質(zhì)量、備注質(zhì)量、打卡設(shè)備(手機(jī)型號(hào)、設(shè)備號(hào)、APP版本、IP地址、ip歸屬地)
  • 獎(jiǎng)勵(lì):已領(lǐng)取獎(jiǎng)勵(lì)、已提現(xiàn)獎(jiǎng)勵(lì)、領(lǐng)取次數(shù)、平均獎(jiǎng)勵(lì)金額、平均提取周期等

如果對(duì)這些數(shù)據(jù),或其他業(yè)務(wù)流程中可以產(chǎn)出、依賴性強(qiáng)的數(shù)據(jù)沒(méi)埋點(diǎn)采集的話,還需要先完善埋點(diǎn),確保盡可能的把數(shù)據(jù)采集全面。

3. 數(shù)據(jù)歸類

我們按照大名鼎鼎的5W1H對(duì)整個(gè)業(yè)務(wù)流程可以產(chǎn)出的數(shù)據(jù)做個(gè)歸類。

5W+1H:是對(duì)選定的項(xiàng)目、工序或操作,都要從原因(何因Why)、對(duì)象(何事What)、地點(diǎn)(何地Where)、時(shí)間(何時(shí)When)、人員(何人Who)、方法(何法How)等六個(gè)方面提出問(wèn)題進(jìn)行思考。

從5W1H起入門風(fēng)控系統(tǒng)設(shè)計(jì)

4. 風(fēng)險(xiǎn)關(guān)聯(lián)分析

我們對(duì)所有掌握的數(shù)據(jù)進(jìn)行歸類后,可以將該數(shù)據(jù)與預(yù)期風(fēng)險(xiǎn)進(jìn)行關(guān)聯(lián)分析,例如我們有那么多的地址信息,由于我們業(yè)務(wù)的特殊性,一般都是同城內(nèi)打卡,所以用戶注冊(cè)地、日常瀏覽的所在地、打卡地址,都應(yīng)該在本市,且打卡地點(diǎn)不出意外的話,都應(yīng)該距離設(shè)定的任務(wù)地址非常近。

諸如手機(jī)號(hào)歸屬地、銀行卡開(kāi)戶地、身份證歸屬地,這三者可能不是在本地也正常,如在老家辦的身份證、手機(jī)號(hào)、銀行卡等,但是這三者應(yīng)在省份層面,應(yīng)該有一致性趨勢(shì),例如一個(gè)用戶身份證是郴州的,銀行卡是泉州開(kāi)的,手機(jī)號(hào)是衢州的,最后在宿州參加任務(wù)打卡,這風(fēng)險(xiǎn)就很大了。

由于我們業(yè)務(wù)的特性,一個(gè)打卡任務(wù)從發(fā)布到要求打卡完成,都不會(huì)超過(guò)1個(gè)月,且每次獎(jiǎng)勵(lì)都不多(不到百元),所以瀏覽頁(yè)面所在地點(diǎn)與實(shí)際打卡地點(diǎn)大概率應(yīng)該是在一個(gè)城市,臨近的城市都比較少,如果出現(xiàn)廣東省瀏覽了一個(gè)山東省的任務(wù),最后打卡點(diǎn)是山東省,這風(fēng)險(xiǎn)也極大。

所以我們就可以列一下每個(gè)數(shù)據(jù)與最終風(fēng)險(xiǎn)的關(guān)聯(lián)系數(shù)。

從5W1H起入門風(fēng)控系統(tǒng)設(shè)計(jì)

5. 風(fēng)險(xiǎn)閾值設(shè)計(jì)

我們采用“可信度”計(jì)分,標(biāo)記為s,單項(xiàng)最高100分,最低0分。如果一項(xiàng)數(shù)據(jù)可信度越高,則分?jǐn)?shù)越高,相對(duì)而言風(fēng)險(xiǎn)程度就越低。

同時(shí)給每一項(xiàng)數(shù)據(jù)加一個(gè)權(quán)重值,標(biāo)記為w,為方便計(jì)算,需要讓w1+w2+…+wi=1,即所有權(quán)重相加等于100%。

最終可信度分?jǐn)?shù) = ∑ 單項(xiàng)分?jǐn)?shù)s x 單項(xiàng)權(quán)重w,可信度模式,也被稱之為健康分、健康度、信用分等。

(1)打卡地點(diǎn),系數(shù)w假設(shè)為0.1

按要求就應(yīng)該在任務(wù)要求的地點(diǎn)附近,我們采用經(jīng)緯度距離計(jì)算的方式,判斷風(fēng)險(xiǎn)度:

  • d(距離)<=50米:可信度極高,單項(xiàng)+100
  • 50米 <= d < 200米:+80
  • 200米 <= d < 500米:+60
  • 500米 <= d < 1000米:+40
  • 1000米 <= d < 5000米:+20
  • d >= 5000米:+0

(2)打卡ip歸屬地,系數(shù)w假設(shè)為0.02

打卡ip歸屬地其實(shí)并不準(zhǔn)確,由于網(wǎng)絡(luò)運(yùn)營(yíng)商問(wèn)題或使用了虛擬專用網(wǎng)絡(luò)(Virtual Private Network),可能出現(xiàn)“漂移”,不過(guò)ip作弊難度相對(duì)于修改地址而言更難,所以還是有很大的價(jià)值。

  • 打卡ip歸屬地與打卡地點(diǎn)一致在同一個(gè)城市,可以增加打卡的可信度,單項(xiàng)+100
  • 不一致,單項(xiàng)+0

(3)其他ip歸屬地,系數(shù)w假設(shè)為0.03

注冊(cè)ip、瀏覽ip的歸屬地,和打卡ip有同樣的準(zhǔn)確性問(wèn)題,但是我們可以用離散度來(lái)衡量,一般情況,我們預(yù)期的用戶注冊(cè)ip、瀏覽ip與實(shí)際打卡ip都應(yīng)該是同一個(gè)城市的,所以我們可以取注冊(cè)ip歸屬地、最近3天使用最多的ip地址歸屬地(需要占瀏覽記錄的30%以上,如果沒(méi)有則為空)、最近7天使用對(duì)多的ip地址歸屬地(需要占50%,如果沒(méi)有則為空),與打卡地點(diǎn)進(jìn)行比對(duì):

  • 其中0個(gè)同一個(gè)市:+0
  • 其中1個(gè)同一個(gè)市:+30
  • 其中2個(gè)同一個(gè)市:+60
  • 其中3個(gè)同一個(gè)市:+100

采用同樣的方法,我們可以對(duì)5W1H里面的每一項(xiàng)數(shù)據(jù),都擬定一個(gè)權(quán)重、還有一套評(píng)分規(guī)則,就可以進(jìn)行所有人員的風(fēng)險(xiǎn)評(píng)估了。

6. 模型測(cè)算

當(dāng)我們梳理出所有風(fēng)險(xiǎn)相關(guān)的數(shù)據(jù)、擬定了權(quán)重、評(píng)分規(guī)則后,我們就完成了分析評(píng)估模型的初步設(shè)計(jì),但是這個(gè)模型準(zhǔn)不準(zhǔn),我們還需要進(jìn)行測(cè)算。

我們會(huì)從系統(tǒng)中隨機(jī)抽取一定數(shù)量的、包含了已知作弊記錄在內(nèi)的真實(shí)記錄,然后使用模型規(guī)則,算出可信度分?jǐn)?shù),然后查看可信度分布情況:

  • 已知的作弊記錄,是否多數(shù)分布于可信度低的區(qū)域。如果不在,查明是哪個(gè)指標(biāo)權(quán)重或計(jì)算規(guī)則導(dǎo)致的,調(diào)整對(duì)應(yīng)指標(biāo)權(quán)重、計(jì)算規(guī)則
  • 其他可信度低,即風(fēng)險(xiǎn)高的記錄,人工核實(shí)是否真的作弊了,或者具有高作弊嫌疑。
  • 根據(jù)業(yè)務(wù)特征和運(yùn)營(yíng)經(jīng)驗(yàn),分析分?jǐn)?shù)分布情況是否符合預(yù)期的分布特征,如正態(tài)分布,即極高風(fēng)險(xiǎn)的和極低風(fēng)險(xiǎn)的應(yīng)該都在少數(shù),大部分處于中間區(qū)間。
  • 不斷優(yōu)化權(quán)重配置、計(jì)算規(guī)則、多抽樣幾批真實(shí)業(yè)務(wù)記錄進(jìn)行反復(fù)測(cè)算,提高模型的準(zhǔn)確性
  • 總結(jié)不同可信度分值的分布區(qū)間特點(diǎn),對(duì)記錄結(jié)果分類,如總分0-20為極危,20-40分為高危;40-60為低危;60-80為健康;80以上為優(yōu)秀。

目前我們的模型是根據(jù)最終打卡記錄來(lái)計(jì)算的,保障任務(wù)獎(jiǎng)勵(lì)的資金安全、發(fā)放給應(yīng)得的用戶。但是有時(shí)候我們可以會(huì)需要根據(jù)用戶的歷史記錄,來(lái)評(píng)估對(duì)用戶維度的可信度,用來(lái)在任務(wù)報(bào)名節(jié)點(diǎn)就過(guò)濾掉部分用戶,這時(shí)候可能就要建立新的模型進(jìn)行評(píng)估。

另外對(duì)于新用戶,沒(méi)有過(guò)多的數(shù)據(jù)時(shí),可能就需要用更少的數(shù)據(jù)指標(biāo),來(lái)建立用戶維度的可信度等。

四、風(fēng)控第三步:風(fēng)險(xiǎn)模型應(yīng)用

我們根據(jù)任務(wù)的獎(jiǎng)勵(lì)情況,任務(wù)獎(jiǎng)勵(lì)越多,那被刷、用戶作弊的風(fēng)險(xiǎn)就越大,可能造成平臺(tái)的損失就越大,所以對(duì)其打卡記錄,根據(jù)可信度,采用不同的策略,以實(shí)現(xiàn)減少人力成本投入、提高安全系數(shù)的目的。

從5W1H起入門風(fēng)控系統(tǒng)設(shè)計(jì)

到此,我們就完成了風(fēng)控系統(tǒng)的設(shè)計(jì)、應(yīng)用全流程。但是風(fēng)控模型不是一成不變的,是需要通過(guò)不斷積累的技術(shù)、數(shù)據(jù),不斷迭代升級(jí)的:

  • 隨著業(yè)務(wù)場(chǎng)景的拓展、技術(shù)的不斷更新,我們可能采集到更多維度的數(shù)據(jù),用于升級(jí)風(fēng)控模型;
  • 那些“免審核”的優(yōu)秀記錄記錄中,還是會(huì)隱藏著新的作弊手法、作弊風(fēng)險(xiǎn),一旦被發(fā)現(xiàn),我們也需要對(duì)風(fēng)控模型進(jìn)行更新,及時(shí)堵住漏洞,防止損失擴(kuò)大;
  • 通過(guò)與第三方安全公司、風(fēng)控系統(tǒng)的合作,不斷完善風(fēng)控指標(biāo)

五、總結(jié)

萬(wàn)丈高樓平地起,5W1H作為我們?nèi)粘I睢⒐ぷ髦凶顚?shí)用的方法論之一,對(duì)于基礎(chǔ)的風(fēng)控模型設(shè)計(jì)也一樣適用,通過(guò)一定的分類,把雜亂無(wú)章的線索整理歸類,讓其特征得以顯現(xiàn)。

實(shí)際生產(chǎn)實(shí)踐過(guò)程中,由于法律法規(guī)要求、用戶體驗(yàn)需要等,可能還未必能采集到那么豐富的數(shù)據(jù);另外所需要面對(duì)的業(yè)務(wù),復(fù)雜度也可能高得多,很多風(fēng)險(xiǎn)隱患可能深藏于錯(cuò)綜復(fù)雜的業(yè)務(wù)流中,不容易被察覺(jué)。此時(shí)我們就需要設(shè)計(jì)更復(fù)雜的風(fēng)控模型,如通過(guò)灰色關(guān)聯(lián)分析來(lái)設(shè)計(jì)權(quán)重、使用機(jī)器學(xué)習(xí)來(lái)識(shí)別風(fēng)險(xiǎn)等等,路漫漫其修遠(yuǎn)兮,吾將上下而求索。

文:iCheer,公眾號(hào):云主子,房地產(chǎn)/物業(yè)行業(yè)產(chǎn)品經(jīng)理,Python編程愛(ài)好者,養(yǎng)貓發(fā)燒友。

本文經(jīng)授權(quán)發(fā)布,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.gptmaths.com/quan/61600.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2022-03-21 12:47
下一篇 2022-03-21 13:39

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論