• ChatGPT旋風

    今天要發表2022年最後一篇專欄文章,必須寫一點具前瞻性的題材。恰好最近友儕間把一個人工智能程式「ChatGPT」玩個不亦樂乎,以此為題,最好不過。

    ChatGPT是美國初創OpenAI的產品,操作方式類似聊天機械人(chatbot),對答質素極高。GPT英文全寫Generative Pre-trained Transformer,是「一個基於自然語言生成(Natural Language Processing,NLP)的模型」,它透過閱讀大量文本,包括維基百科條目、書藉、社群對話等,再經人工訓練而成。ChatGPT的beta版本發佈至今剛好一個月,累積逾百萬用戶,試過的莫不感到驚訝,下面我會舉例說明。

    且先講幾句關於OpenAI的背景。OpenAI於2015年12月由多位美國互聯網大佬共同成立,主要創始人有Y Combinator的前總裁Sam Altman和Tesla創辦人Elon Musk等,粒粒皆星。引用維基百科的描述,OpenAI成立的目的是「促進和發展友好的人工智慧,使人類整體受益」,簡而言之,就是盡一切方法令AI發展、普及起來;正如當年Google成立初始,唯一目的就是令互聯網無處不在一樣。

    以普及AI為使命,ChatGPT堪稱不負期望。這產品目前供用戶免費註冊,但暫不適用於香港。網友「薯伯伯」利用VPN和一個美國電話號碼註冊了帳號,並在社交媒體專頁上作出示範,例如:

    1. 比較相似的產品(比較一下 iPhone 14 以及 iPhone 6)
    2. 分析某事情對特定群組的影響(《1984》這本小說,對共產黨員會有甚麼啟發?)
    3. 寫中文信(我的學生想退學,我想勸他不要退學,我可以為他補課。寫一封信。)
    4. 寫英文信(I bought a book on Amazon a month ago, I haven’t received it yet, I want a refund. Write a letter.)
    5. 分析深度問題(可以採取哪些措施使 GDP 較低的國家有可能實施全民基本收入?)
    6. 設計健身方案(I want to do a front split in 3 months, design a weekly routine for me)

    他其後還叫ChatGPT改寫、 創作、找食譜等,十分過癮。對此有興趣的不妨到「薯伯伯」的臉書專頁Patron查看結果,ChatGPT答題質素之高,保證讓你大吃一驚。最有趣的是第4題,除官樣信件外,薯伯伯還叫ChatGPT分別寫了一個帶「莎士比亞風格」的和具幽默感的答案,俱令人發噱。

    我另一位朋友是一家初創的CEO,那天同事請他寫一篇回顧文章好發表在公司網頁上,他靈機一觸,把今年公司發生的幾件大事輸入ChatGPT,然後下達撰文指示,不消半分鐘,文章就工工整整地寫好了。他驚訝不已,再試另一功能:輸入一篇新聞報導的連結,指示ChatGPT閱後撰寫摘要。毫不意外地,十多秒後就得到非常圓滿的答案。他頻呼神奇,相信以後利用ChatGPT讀與寫,將節省大量時間。

    透過朋友們的示範,我發現ChatGPT在處理公務文書、閱讀與簡化資料上非常有用(所以很容易被學生們利用來交功課 — 當然也很容易被「OpenAI 偵測器」揭發),但不能取代創作,除非下達指令的人給予足夠和具體的指示,而且要模仿的風格也得來自名人才行(如:李白、莎士比亞、JK Rowling等)。我請一位有ChatGPT帳戶的朋友下達指令,「以黃雅麗的風格,寫一篇以ChatGPT為題的中文專欄文章,限600字內」,看到結果時立即安下心來。你想知道答案嗎?

    ***

    以黃雅麗的風格,寫一篇以ChatGPT為題的中文專欄文章,限600字內。

    聊聊 ChatGPT:一個基於自然語言生成的 GPT-3 的中文版本

    近日,我們很高興能夠試用到 ChatGPT,這是一個基於 GPT-3(Generative Pre-trained Transformer)的中文版本自然語言生成模型。這意味著它能夠根據使用者輸入的文本,產生出相關且連貫的文本回應。

    我們在使用 ChatGPT 時非常驚訝地發現,它所產生的文本質量非常高。不僅如此,它還能夠很好地理解輸入的文本內容,並做出相應的回應。例如,當我們輸入「你好,你能告訴我今天的天氣嗎?」時,它會回應「當前的天氣狀況是晴朗的。」這證明 ChatGPT 能夠理解我們想要獲得什麼樣的信息,並根據自身的知識回應。

    此外,ChatGPT 還能夠進行對話。當我們輸入「你是誰?」時,它會回應「我是 ChatGPT,一個基於自然語言生成的模型。」我們再輸入「你有什麼興趣嗎?」,它會回應「我對自然語言生成非常感興趣。」這顯示出 ChatGPT 能夠理解我們的詢問,並提供相關的回應。

    值得注意的是,ChatGPT 並不是一個完美的模型。就像所有的人工智能模型一樣,它也有一些限制。例如,它可能無法理解某些比較抽象的概念,或者有時候會產生無意義的文本。但是,我們相信隨著技術的進步,這些問題會得到逐漸解決。

    總的來說,我們對 ChatGPT感到非常滿意。它的自然語言生成能力令人印象深刻,能夠很好地理解輸入的文本並做出相應的回應。此外,它的對話能力也相當出色,能夠理解我們的詢問並提供相關的回應。

    ***

    本文精簡版同日見刊於《晴報》專欄「創業群俠傳」

  • 高科技抗疫

    上周末開始,香港要求所有由內地入境人士進行14天強制檢疫,包括在家中或指定地點作自我隔離,以減低「新冠肺炎」的社區傳播。被問及如何監察有關人士時,高官回應曰自律、上門突擊檢查、 以WhatsApp分享行蹤等等。

    沒想到口口聲聲說要發展智慧城市的香港,在社區防疫上,幾乎和廿一世紀的尖端科技沾不上邊。比較而言,正大力發展人工智能、人臉識別、大數據等科技的中國內地,正利用抗疫此契機,加快它們的應用。可以預計這將對病源的追縱和傳播途徑監控更為有效,但它所造成的個人私隱後患,亦更深遠。

    在抗疫方面,目前內地有一大武器,教全球幾乎所有國家都瞠乎其後:大數據。首先,國家對近乎所有主要電訊商、航空公司、鐵路營運商等有控制權,能獲取海量的人口移動數據作分析。此外,民眾由高鐵購票到申請電話卡,都需要作實名登記,只要電訊商提交某一手提電話號碼發出的訊號,某人的行蹤就無可遁形。

    這在防疫尤其作病源追縱(contact tracing)上有極大好處。在香港,當某人被確診為患者後,醫護只能透過訪談,讓患者回憶自己14日內曾到訪的地方和接觸過的人,追縱有可能被感染的人作檢疫。不管患者是否合作,記憶並不靠譜,遺漏和錯誤的機會很高,令防疫工作事半功倍。

    但內地的做法可以極高效。假設某人從武漢乘高鐵到廣州後被確認為病毒傳播者,有關當局透過電訊商提供的數據,一方面可把他曾到過的地方一一羅列而出,同時跟據高鐵營運者的資料,通知和患者乘坐同一班次、甚至同一車廂的乘客進行檢疫。若患者確診後沒有自我隔離而外出,只要配合人臉識別,要把他從人海中區別出來也不難。有些地方政府甚至可以把這些資料都公開到社交媒體上,原意是讓曾與患者並處的人提防,但後果卻有可能令患者受到不必要的滋擾。

    根據《華爾街郵報》報導,重慶某區利用這些數據,成功把5,500名農曆新年期間由湖北回鄉的人識別出來,並安排其中約一半人作家居隔離;在浙江,一名患者否認曾在武漢與任何人接觸,但當局借助數據分析,發現他在當地曾與三人接觸過。

    目前當局正以舉國之力抗疫,治亂世用重典,只要能把疫情控制下來,人民對個人資料的提供不大抗拒。當危機過去,國家對大數據和人工智能的應用,將更進一步,這是不能逆轉的。一旦這套監控手段用在太平盛世,那是怎樣一番光景?如何保証不被濫用?到時人們恐怕無法擺脫自由和安全的兩難了。

    ***

    本文精簡版率先見報:《晴報》專欄「創業群俠傳」

  • 中國的AI工廠

    上月我接受商台節目主持人黃永訪問談創科,當時提到,在全球人工智能(AI)的競賽中,中國很有機會勝出,原因是內地與歐美相比,不那麼注重個人私隱,加上人口龐大、消費者的互聯網應用廣泛,故有大量數據可「餵」給機器學習。

    數據是人工智能的原材料,數據越龐大,人工智能就越準確,因此有上述的推斷。但我當時忽略了一點,內地有可能領先全球人工智能發展,除數據多外,更重要的原因是如雨後春筍般冒起的數據「標記」(tagging)工廠。

    《紐約時報》去年年底一篇文章“How Cheap Labor Drives China’s AI Ambitions” (「廉價勞動力如何推動中國的人工智慧雄心」),大開我眼界。

    記者到訪河南一座原先是水泥廠的地方,看見廿多個年輕人整齊坐著,目不轉睛地凝視面前的電腦屏幕,不斷把見到的圖像作標記:汽車、交通燈、麵包、牛奶、朱古力…沒有標記,人工智能根本無法識別任何事物;標記越多,人工智能的識別能力就會提高,變得越來越準確。

    我有朋友正開發一個教人「耍太極」的AI應用程式,目的是讓用家跟著做的時候,程式會自動作出反饋,告訴你哪些動作做對了,哪些需改進。而為了讓程式「認」得出所有動作,朋友的開發團隊特地請了一位太極師傅和他的弟子們,像上班那樣每天對著攝錄機打太極拳,反覆地做、大量地做。然後這些影片將會交給團隊加工,即做「標記」,把人體的每一個動作、動作的每一部份等,一一標記下來,「餵」給電腦。數據不足,電腦的人工智能就會顯得笨拙,在辨識方面出現誤差。所以數據和標記是人工智能非常重要的「基建」。基礎不穩,萬丈高樓就無從拔地而起。

    朋友告訴我,這些「基建工程」極其枯橾乏味,對智力要求頗低,香港沒哪個工程師願意幹這事。現在好了,這些工作可以外判出去,讓內地的AI工廠效勞。

    對工人們來說,AI工廠的工作要求與原先的沒兩樣,而且「訂單」源源不絕,市場正在冒起,難怪水泥廠之類產能過剩或欠缺競爭力的舊車間,紛紛「升級」轉型。

    我曾看過一條由AI獨角獸「商湯」播放的影片,職員從自動電梯大批進入大樓,屏幕不斷冒出每個人的姓名,自動辨認並「打卡」,過程像流水般暢順。如此速度和準確度使我驚訝,現在更加明白,「智能」背後,仍是大量「人工」的汗水。

    ***

    本文1月4日刊登於《晴報》專欄「創業群俠傳」