廣告主渴望獲得數(shù)據(jù)。
但是,獲得數(shù)據(jù)的路子似乎越來(lái)越窄,窄到當(dāng)有媒體(或者第三方)跟我們說(shuō),我們能給你提供數(shù)據(jù)的時(shí)候,我們會(huì)覺(jué)得異常興奮。
興奮之余,要冷靜。這個(gè)時(shí)候,如同我們?cè)诠ぷ髦谐3?huì)有的好習(xí)慣——那就是,不要模模糊糊,而是要搞清楚,到底是什么情況——就會(huì)對(duì)我們非常有用。
這篇文章,我想快速跟大家聊聊,所謂的提供數(shù)據(jù),到底有哪些方式,又能提供什么樣的數(shù)據(jù)。
全文大綱
1.媒體(或其他第三方)為企業(yè)“提供”數(shù)據(jù)的四種情況
2.第一種方式:Raw Data轉(zhuǎn)移的場(chǎng)景
3.第二種方式:ID匹配后轉(zhuǎn)移命中的個(gè)體級(jí)別屬性或部分屬性的場(chǎng)景
4.第三種方式:ID匹配后提供統(tǒng)計(jì)報(bào)告
5.第四種方式:橫向聯(lián)邦學(xué)習(xí)或者遷移聯(lián)邦學(xué)習(xí)方式
6.總結(jié)
01 媒體(或其他第三方)為企業(yè)“提供”數(shù)據(jù)的四種情況

上圖:為企業(yè)“提供”數(shù)據(jù)的四種情況。
圖片來(lái)自于“宋星大課堂:《數(shù)字化增長(zhǎng)——以消費(fèi)者為核心的數(shù)字營(yíng)銷(xiāo)的 轉(zhuǎn)型、路徑與落地》”
請(qǐng)注意,就像我在上面的圖中所描述的,媒體(或其他第三方)為企業(yè)提供數(shù)據(jù),是有各種方式的。你所認(rèn)為的數(shù)據(jù)提供,和他們?yōu)槟氵M(jìn)行的“提供”,很可能壓根就有很大的區(qū)別。
這四種數(shù)據(jù)提供的方式,分別是:
第一種:直接把原始數(shù)據(jù)(Raw Data)拷貝給你,數(shù)據(jù)發(fā)生了物理上的轉(zhuǎn)移(復(fù)制、下載等)。所謂Raw Data,是指關(guān)于用戶(hù)的一條一條的行為、屬性、興趣等各種原始的記錄。
第二種:不直接拷貝給你Raw Data,但是跟你手中所擁有的用戶(hù)進(jìn)行ID的匹配。匹配之后,把能夠匹配命中的ID項(xiàng)下的屬性數(shù)據(jù)(或部分屬性數(shù)據(jù))轉(zhuǎn)移給你。這些數(shù)據(jù)都是按照ID分為一條一條的,所以是個(gè)體級(jí)別的數(shù)據(jù)。ID的匹配,在《個(gè)保法》出臺(tái)之前,大家常常以明文的方式進(jìn)行匹配,而現(xiàn)在則幾乎都是通過(guò)加密ID再進(jìn)行匹配的方式,甚至?xí)玫礁甙踩?jí)別的加密ID匹配,即采用隱私計(jì)算中的縱向聯(lián)邦學(xué)習(xí)的方式。
第三種:跟第二種類(lèi)似,同樣要進(jìn)行ID匹配,只不過(guò)匹配之后,不是把命中的ID項(xiàng)下的屬性數(shù)據(jù)給你,而是把所有命中的ID的屬性數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整理,然后把統(tǒng)計(jì)結(jié)果以報(bào)告的形式轉(zhuǎn)移給你。
第四種:是相對(duì)比較燒腦的一種方式,在這種方式下,數(shù)據(jù)不進(jìn)行ID的匹配,而是數(shù)據(jù)提供方(暫且這么叫吧,因?yàn)閴焊蜎](méi)有提供實(shí)際數(shù)據(jù))和廣告主分別計(jì)算模型,并向各自返回模型和計(jì)算結(jié)果。這種方式常常采用聯(lián)邦遷移學(xué)習(xí)的高段位方法,也有采用廣告主和數(shù)據(jù)提供方選取同樣的屬性字段各自計(jì)算模型之后再優(yōu)化模型的橫向聯(lián)邦學(xué)習(xí)的方法的。但總體是一種理論上ok,但實(shí)際操作起來(lái)十分“縹緲”的玩法。各種具體的聯(lián)邦學(xué)習(xí)的方式,大家如果感興趣,我會(huì)在我的“宋星大課堂:《數(shù)字化增長(zhǎng)——以消費(fèi)者為核心的數(shù)字營(yíng)銷(xiāo)的 轉(zhuǎn)型、路徑與落地》”上介紹。
下面,我來(lái)講講各種方式下,常用的數(shù)據(jù)“提供”的場(chǎng)景和價(jià)值。
02 第一種方式:Raw Data轉(zhuǎn)移的場(chǎng)景
聽(tīng)說(shuō)用卡車(chē)運(yùn)送硬盤(pán),是目前大數(shù)據(jù)量數(shù)據(jù)轉(zhuǎn)移速度最快的方式,能到達(dá)大概每秒100個(gè)G。但這樣的數(shù)據(jù)轉(zhuǎn)移,基本上只可能發(fā)生在企業(yè)內(nèi)部,比如阿里就用過(guò)這樣的方法轉(zhuǎn)移他們的數(shù)據(jù)。
不過(guò),用卡車(chē)運(yùn),如果萬(wàn)一路上出個(gè)車(chē)禍——不敢想,不敢想。
回到我們的場(chǎng)景中。無(wú)論是媒體,還是外部數(shù)據(jù)提供方,現(xiàn)在都不太可能給企業(yè)提供Raw Data。很多年前確實(shí)有這樣的生意,而且很普遍,有些人還因此發(fā)家買(mǎi)了很多套房。但隱私保護(hù)、個(gè)人信息保護(hù)以及數(shù)據(jù)安全的法律逐漸完善起來(lái)之后,這樣的場(chǎng)景基本上沒(méi)有了。
不過(guò),只是基本上沒(méi)有。如同任何不合法的交易都存在黑市一樣,Raw Data數(shù)據(jù)轉(zhuǎn)移也有黑市。別問(wèn)我這些黑市在哪兒,我也不知道,而且正經(jīng)企業(yè)不會(huì)問(wèn)我這個(gè)問(wèn)題。
03 第二種方式:ID匹配后轉(zhuǎn)移命中的個(gè)體級(jí)別屬性或部分屬性的場(chǎng)景
當(dāng)你看到我寫(xiě)出了個(gè)體級(jí)別四個(gè)字,你可能會(huì)認(rèn)為,這種情形應(yīng)該也不存在了——沒(méi)有什么媒體還愿意給廣告主個(gè)體級(jí)別的數(shù)據(jù)了。但事實(shí)上,這種數(shù)據(jù)轉(zhuǎn)移仍然是有場(chǎng)景的。
電商平臺(tái)的會(huì)員通,會(huì)跟廣告主的會(huì)員,在進(jìn)行ID匹配(通常是用加密的電話號(hào)碼)之后,提供給廣告主該ID的部分與會(huì)員權(quán)益等相關(guān)的數(shù)據(jù),這些數(shù)據(jù)是個(gè)體級(jí)別的。
微信生態(tài),微信也會(huì)在用戶(hù)授權(quán)的情形下,利用OpenID或者UnionID,經(jīng)由API,給廣告主提供個(gè)體級(jí)別用戶(hù)的部分行為或?qū)傩詳?shù)據(jù)。
所以,不像第一種方式,第二種方式仍然是常見(jiàn)的數(shù)據(jù)提供的方式。
但是,這種方式顯然有一個(gè)很值得注意的點(diǎn),那就是,提供的個(gè)體級(jí)別的屬性數(shù)據(jù)能包含什么,是由媒體圈定范圍,并由用戶(hù)實(shí)際授權(quán)同意之后,才可能發(fā)生的。
所以,通常這些數(shù)據(jù)的類(lèi)型會(huì)很有限。
04 第三種方式:ID匹配后提供統(tǒng)計(jì)報(bào)告
這也是一種常見(jiàn)的場(chǎng)景,而且基本上符合法律所規(guī)定的個(gè)人信息保護(hù)的合規(guī)要求。
例如,廣告主將自己CDP中圈選的人群的ID加密后(或縱向聯(lián)邦學(xué)習(xí)的方式),與媒體的DMP中用戶(hù)的ID進(jìn)行匹配。匹配后,媒體把這部分人的屬性進(jìn)行統(tǒng)計(jì)整理,以所謂的“人群畫(huà)像”的方式提供給廣告主。
這種方式,基本上用于做人群畫(huà)像或者人群洞察了。
雖然對(duì)于精細(xì)化運(yùn)營(yíng)每一個(gè)用戶(hù)或者每一個(gè)消費(fèi)者并無(wú)直接作用,但是在幫助形成營(yíng)銷(xiāo)策略上,是很有價(jià)值的。
05 第四種方式:橫向聯(lián)邦學(xué)習(xí)或者遷移聯(lián)邦學(xué)習(xí)方式
在深度利用企業(yè)的CDP方面,需要用到此種方式。
但是,大部分企業(yè)可能都難以擁有這樣的能力。
一個(gè)簡(jiǎn)單的應(yīng)用,以汽車(chē)行業(yè)為例。汽車(chē)行業(yè)的主機(jī)廠,擁有很多用戶(hù)在私域觸點(diǎn)上的各種行為數(shù)據(jù),這些數(shù)據(jù)例如“看了某個(gè)車(chē)型介紹的次數(shù)”或者“查看汽車(chē)金融的次數(shù)”或是“在某類(lèi)車(chē)型頁(yè)面上的停留時(shí)間”。而媒體也有完全一樣類(lèi)型的這樣的數(shù)據(jù)(比如騰訊汽車(chē)或者懂車(chē)帝也有類(lèi)似的數(shù)據(jù))。然后,二者各自基于這些數(shù)據(jù)類(lèi)型和一個(gè)通用模型進(jìn)行計(jì)算,并各自得出一個(gè)比通用模型更優(yōu)化的模型,該模型能判斷這些數(shù)據(jù)的值具體是什么情況時(shí),用戶(hù)就會(huì)表現(xiàn)出較為明確的愿意“留資(就是有購(gòu)車(chē)意向)”的傾向。之后,二者將各自的模型互相傳遞,再基于兩個(gè)優(yōu)化模型得出一個(gè)更新的通用模型,隨之再把這個(gè)新的通用模型給二者,并基于更多的數(shù)據(jù),再做計(jì)算,各自再得出一個(gè)更更優(yōu)化的模型……
這個(gè)過(guò)程循環(huán)n次,直到得到一個(gè)滿(mǎn)意的通用模型,兩邊都能拿著用于預(yù)測(cè)各自的用戶(hù)是否有購(gòu)車(chē)意向?!@就是橫向聯(lián)邦學(xué)習(xí)。

上圖:橫向聯(lián)邦學(xué)習(xí)的示意過(guò)程。
圖片來(lái)自于“宋星大課堂:《數(shù)字化增長(zhǎng)——以消費(fèi)者為核心的數(shù)字營(yíng)銷(xiāo)的 轉(zhuǎn)型、路徑與落地》”
聯(lián)邦遷移學(xué)習(xí)則更加“牛”,不過(guò)比較復(fù)雜,就大致說(shuō)一下。簡(jiǎn)單說(shuō),就是媒體和廣告主,不僅雙方ID不允許做任何匹配,就連用戶(hù)的屬性數(shù)據(jù)類(lèi)型都不一樣,比如媒體只有“看了某個(gè)車(chē)型介紹的次數(shù)”或者“查看汽車(chē)金融的次數(shù)”的數(shù)據(jù)類(lèi)型,而車(chē)企只有“在某類(lèi)車(chē)型頁(yè)面上的停留時(shí)間”的數(shù)據(jù)類(lèi)型。然后二者還是要得到一個(gè)更優(yōu)化的預(yù)測(cè)用戶(hù)是否可能留資的模型。
所以,如同我講的車(chē)企的例子,第四種方式常常用于預(yù)測(cè)和人工智能判斷。通常無(wú)論是廣告主還是媒體,都需要相當(dāng)大體量且類(lèi)型豐富的數(shù)據(jù)。
因此,這種方式,聽(tīng)起來(lái)就已經(jīng)很“玄學(xué)”,落地實(shí)現(xiàn)起來(lái)就更加困難了。也不是沒(méi)有企業(yè)這么做,但是,真的很少。
06 總結(jié)
現(xiàn)在,你再看看你的媒體跟你承諾的,要提供給你數(shù)據(jù),是什么情況?
大部分,我相信,都是第二種和第三種。尤其是第三種,特別多。
你所期待的,全量的Raw Data的提供(也就是第一種),在今天恐怕越來(lái)越難以實(shí)現(xiàn)。

小程序
掃碼打開(kāi)微信小程序
APP下載
掃碼下載市場(chǎng)部網(wǎng) App



