科企如何透視你的祕密

(接前文:大數據比你更了解自己?

美國連鎖零售店Target的營銷部,為增加生意,給公司的數據科學家們出了一道難題:在對方沒有透露的情況下,找出懷孕的顧客來。

因為只要盡早識別,並向他們作針對性產品宣傳,即將為人父母者是個巨大的「金礦」。Target的數據科學家們果然不賴,他們竟從浩瀚的消費數據中發掘出將為人母者的購物規律:比如從第四個月開始,轉買「無香型」潤膚露;第五個月左右,購入保健品如鎂、鋅、鈣之類;到她們臨盆在即,就會囤積棉花球、面巾等等。

透過購物習慣,Target的數據科學家對顧客懷孕預測之準確度極高,幾乎連她們的產期都能猜中!一位少女的父親因為女兒收到嬰兒用品的宣傳單張向Target投訴,不久卻悻悻然致歉,原來女兒瞞著自己有喜了。報導此事的《紐約時報》記者Charles Duhigg說,Target後來把這「孕期預測」模型關掉,因為太多顧客對Target居然發現自己的私隱感到害怕。

而在差不多時期,另一家企業Netflix,也利用大數據做出令人震驚的舉措:宣佈豪擲一億美元,開拍一連兩季由David Fincher導演、Kevin Spacey主演的美國版《紙牌屋》(House of Cards)。這在美國的電視劇製作史上,可謂前無古人的豪賭,沒有人會押注鉅款連拍兩季,因為風險太高、賭注太大。

但Netflix並不認為那是賭博,只是按數據作出的合理商業決定。因為他們從當時3300萬訂戶的瀏覽數據中發現,大部份人看過David Fincher導演的電影《社交網絡》(The Social Network)、凡Kevin Spacey主演的電影在平台上都很成功、而且這兩類觀眾都很喜歡英國版的《紙牌屋》。結果證明Netflix的大數據用得其所:在美版《紙牌屋》推出後僅三個月內,Netflix共增加300萬訂戶,其中200萬來自美國國內,而這些新增用戶大約帶來7200萬美元額外收入。

Netflix沒有賭博,它根本立於不敗之地。它從本質上就是一家數據企業,不斷搜集用戶數據以優化體驗和製作受歡迎劇目,截至2019年在全球已擁有1.67億用戶、年收入200億美元。

Target利用購物數據預測及識別懷孕的消費者,Netflix以數據分析決定開拍一套即將大受歡迎的劇集,他們均可振振有詞宣稱:我們比你更了解自己。

看了這些案例後,我也同意利用大數據,即使不能就全部人的口味作出預測,對統計學上「平均分佈」中的大部份人口,也可作出機會率相當高的推斷。我朋友卻不同意,他認為這種說法只是科技企業的公關口號,令目標受眾產生自我預期,相信所接收的建議適合自己,令科技企業更容易操縱他們。

我認為那是因為朋友的口味不符大部份人的規律(即屬於「平均分佈」上兩端的少數)所致,所以他只是個別例子,而大部份人在大多數情況下,都能被大數據預測。你認為呢?

相關舊文:平行時空

//新手媽媽或許在Facebook上展示嬰兒的可愛笑臉,但她在Google上搜尋的,卻是「產後抑鬱」和「如何減肥卅磅」…//

***

本文率先於《晴報》專欄「創業群俠傳」見報