• 大數據比你更了解自己?

    「大數據比你更了解自己」,這不是一道聯校中文辯論比賽的命題,而是我最近和一位創科界朋友的討論話題。

    因為任教一個大學課程,最近簡略地做了一些有關大數據的研習。不少資料在提及大數據的「威力」時,常用上這句「大數據比你更了解自己」作結論,例如Netflix透過收集你「煲劇」的數據,比你更了解自己看電影的口味、Amazon比你更了解自己要買的書,等等。我也漸被說服。但朋友卻認為這言過其實,只是科技巨企以此來操縱用戶的一句口號、一個公關幌子。

    我在討論過程中提及兩家企業有關大數據的經典案例,Target和Netflix,而朋友卻從未聽過。這是兩個相當有趣和具說服力的案例,不如借此機會向大家稍作介紹,讓你也可以參與這命題的思考練習。

    首先幾個高度簡化的基本概念。「大數據」(Big Data)指極度龐大、人力難以有效處理的數據,它們可以零碎、無序、性質不一…但不管數據再大,如果沒經過有效的整理和分析,並無太大用處。「數據分析」(Data Analytics)就是一個使數據變得有價值的過程,透過「數據挖掘」(Data Mining),從海量的數據中發掘規律,並由規律中作出預測。一般來說,數據越多、呈現的規律越清晰、作出的預測也越準確。這是其中一種數據科學常見的應用,也是我們這次討論的中心思想。

    2012年2月,一位即將獲得普立茲獎的《紐約時報》年輕記者Charles Duhigg,發表了一篇連鎖零售店Target以數據篩選出懷孕顧客的報導,奠下一個歷久不衰的「大數據」應用案例(待續:科企如何透視你的祕密)。

    本文率先於《晴報》「創業群俠傳」見報

  • 高科技抗疫

    上周末開始,香港要求所有由內地入境人士進行14天強制檢疫,包括在家中或指定地點作自我隔離,以減低「新冠肺炎」的社區傳播。被問及如何監察有關人士時,高官回應曰自律、上門突擊檢查、 以WhatsApp分享行蹤等等。

    沒想到口口聲聲說要發展智慧城市的香港,在社區防疫上,幾乎和廿一世紀的尖端科技沾不上邊。比較而言,正大力發展人工智能、人臉識別、大數據等科技的中國內地,正利用抗疫此契機,加快它們的應用。可以預計這將對病源的追縱和傳播途徑監控更為有效,但它所造成的個人私隱後患,亦更深遠。

    在抗疫方面,目前內地有一大武器,教全球幾乎所有國家都瞠乎其後:大數據。首先,國家對近乎所有主要電訊商、航空公司、鐵路營運商等有控制權,能獲取海量的人口移動數據作分析。此外,民眾由高鐵購票到申請電話卡,都需要作實名登記,只要電訊商提交某一手提電話號碼發出的訊號,某人的行蹤就無可遁形。

    這在防疫尤其作病源追縱(contact tracing)上有極大好處。在香港,當某人被確診為患者後,醫護只能透過訪談,讓患者回憶自己14日內曾到訪的地方和接觸過的人,追縱有可能被感染的人作檢疫。不管患者是否合作,記憶並不靠譜,遺漏和錯誤的機會很高,令防疫工作事半功倍。

    但內地的做法可以極高效。假設某人從武漢乘高鐵到廣州後被確認為病毒傳播者,有關當局透過電訊商提供的數據,一方面可把他曾到過的地方一一羅列而出,同時跟據高鐵營運者的資料,通知和患者乘坐同一班次、甚至同一車廂的乘客進行檢疫。若患者確診後沒有自我隔離而外出,只要配合人臉識別,要把他從人海中區別出來也不難。有些地方政府甚至可以把這些資料都公開到社交媒體上,原意是讓曾與患者並處的人提防,但後果卻有可能令患者受到不必要的滋擾。

    根據《華爾街郵報》報導,重慶某區利用這些數據,成功把5,500名農曆新年期間由湖北回鄉的人識別出來,並安排其中約一半人作家居隔離;在浙江,一名患者否認曾在武漢與任何人接觸,但當局借助數據分析,發現他在當地曾與三人接觸過。

    目前當局正以舉國之力抗疫,治亂世用重典,只要能把疫情控制下來,人民對個人資料的提供不大抗拒。當危機過去,國家對大數據和人工智能的應用,將更進一步,這是不能逆轉的。一旦這套監控手段用在太平盛世,那是怎樣一番光景?如何保証不被濫用?到時人們恐怕無法擺脫自由和安全的兩難了。

    ***

    本文精簡版率先見報:《晴報》專欄「創業群俠傳」

  • 廣告人揸UBER

    離開午宴場地,我15分鐘後要到附近開另一個會。這段路距離不遠,走路也不過十來分鐘,但瞄一眼腳上那雙嬌滴滴的鞋子,只得坐車。繁忙時間路擠,這麼短的距離截的士,幾可肯定被拒載,唯有召UBER。

    不多久,一架混能車徐徐駛至。男司機身穿黑色衞衣,配墨鏡和cap帽,轉過頭來和我打招呼:「小姐,咁塞車,行路仲快啊。」他語氣友善,並無譏諷之意。墨鏡遮蓋了容貌,但那聲線配外型,居然與電影導演彭浩翔有九成相似。我無奈回答:「可惜今天沒穿運動鞋呢。」

    「彭浩翔」竟十分理解,還笑出來,「哈哈,我之前替一個老闆開車,個老闆娘唔知點解成日趕時間,於是叫我放了多雙拖鞋在車上,一見塞車,就換拖鞋跳車走。」他還說那老闆娘到步後,有時會把拖鞋藏在某處,讓他開車去取。講起歷次「搵鞋」經歷,「彭浩翔」越發眉飛色舞、繪形繪聲,那刻我真懷疑他是彭浩翔假扮的。於是繼續搭訕,「咦,為什麼要改開UBER呢?」

    「唉…」「彭浩翔」長嘆一聲,「我也不是開車的,我是個廣告人啊,可是已經三個月沒糧出了,不開UBER怎麼維生?」原來「彭浩翔」本來在一家規模約五六人的小型廣告公司工作,可是自去年年中以來公司生意大受打擊,坐困愁城下唯有改揸UBER幫補生計。

    「我老闆連層樓都賣咗!」「彭浩翔」連連嘆息,「我本來也有兩部車,一部讓老婆開車送兒子上學,可是沒法呀,剛賣掉一部。」

    我想不出法子安慰他,便問:「能開UBER幫補一下都好呀,不是嗎?」

    這一問,卻令「彭浩翔」激動起來,「我今早7:30送兒子上學後開始揸,現在下午2:30, 總共才賺了$X00多。我從某區出來,連隧道錢都蝕埋!」他一邊說,一邊想把自己的dashboard按出來給我看。

    這時剛巧我的目的地到了,臨下車之際,我本想引用廣告公司老闆曾錦強的話「經濟低潮是洗牌機會」來安慰「彭浩翔」幾句,又自覺很無力。關上車門,我把話吞回去,在手機上按了5粒星和$15小費給他。

    急景殘年,在這城市裏營營役役的都是同路人。希望「彭浩翔」懷著好心情,下一張單接個大客,早些回家與妻兒團年。過了這關,說不定當UBER司機的經歷,可以令他成為更有創意的廣告人呢。

    ***

    本文精簡版同日見報:《晴報》專欄「創業群俠傳」