《我看見的世界》既是李飛飛的個(gè)人史,也是一部波瀾壯闊、跌宕起伏的人工智能發(fā)展史。在這本書里,李飛飛回憶了自己從底層移民成長到頂尖科學(xué)家的經(jīng)歷。她度過了困頓艱辛的青少年時(shí)代,但對(duì)科學(xué)的熱愛不斷激勵(lì)著她持續(xù)追尋人生的“北極星”,并最終走進(jìn)科學(xué)的殿堂。
李飛飛曾經(jīng)創(chuàng)建現(xiàn)代人工智能的關(guān)鍵催化劑ImageNet,也曾擔(dān)任谷歌云人工智能及機(jī)器學(xué)習(xí)首席科學(xué)家,但她始終秉持著身為學(xué)者的審慎立場(chǎng),對(duì)于人工智能的發(fā)展方向提出自己的判斷和警醒。2015年,很多人工智能的數(shù)據(jù)庫缺乏多樣性,導(dǎo)致了一系列意料之外的結(jié)果,例如,將黑人青少年錯(cuò)誤地標(biāo)記為“大猩猩”。她意識(shí)到,這是因?yàn)榭萍夹袠I(yè)的代表性不足,導(dǎo)致算法無意中帶有偏見,在處理非白人、非男性用戶信息時(shí)表現(xiàn)不佳。她和同事一起推動(dòng)了AI4ALL項(xiàng)目,致力于支持女性、有色人種和經(jīng)濟(jì)困難的學(xué)生參與到人工智能領(lǐng)域,以對(duì)抗偏見的產(chǎn)生。
李飛飛意識(shí)到,人工智能不僅是一種科學(xué),也不僅是“現(xiàn)象”“顛覆”“謎題”“特權(quán)”或“自然之力”,人工智能更是一種責(zé)任,是我們所有人共同承擔(dān)的責(zé)任。她提出,醫(yī)療等領(lǐng)域的規(guī)范、先例和倫理基礎(chǔ)是經(jīng)過幾個(gè)世紀(jì)甚至幾千年的時(shí)間建立起來的,相比之下,人工智能還處于發(fā)展的早期階段,其本身幾乎沒有明確的倫理準(zhǔn)則。這個(gè)領(lǐng)域的自我認(rèn)識(shí)之路才剛剛起步。因此,缺乏倫理框架的不僅僅是谷歌,也不僅僅是年輕工程師,而是我們所有人。
經(jīng)出版社授權(quán),第一財(cái)經(jīng)節(jié)選了書中部分篇章,以饗讀者。
從ImageNet時(shí)代開始,規(guī)模的重要性就已經(jīng)顯而易見,但近年來,“越大越好”的觀點(diǎn)幾乎被賦予了宗教般的意義。媒體上充斥著城市街區(qū)大小的服務(wù)器設(shè)施的圖片,關(guān)于“大數(shù)據(jù)”的討論永無休止,不斷強(qiáng)化著這樣的觀點(diǎn):規(guī)模是神奇催化劑,是機(jī)器中的幽靈,可以將人工智能的舊時(shí)代與令人窒息的夢(mèng)幻未來區(qū)分開來。雖然相關(guān)分析可能會(huì)有些簡化,但本質(zhì)上并沒有錯(cuò)。沒有人能否認(rèn),神經(jīng)網(wǎng)絡(luò)確實(shí)在這個(gè)資源豐富的時(shí)代蓬勃發(fā)展:驚人的數(shù)據(jù)量、大規(guī)模分層架構(gòu)和大量互聯(lián)的硅片確實(shí)帶來了歷史性變化。
這對(duì)科學(xué)意味著什么呢?如果我們的工作秘訣可以簡化為赤裸裸的量化,簡化為蠻力制勝,那么努力思考和創(chuàng)新又有什么意義呢?如果一些想法在層數(shù)太少、訓(xùn)練樣本太少或GPU太少的情況下似乎會(huì)失敗,而在數(shù)量增加到足夠多的時(shí)候突然又可以高效運(yùn)轉(zhuǎn),那么對(duì)于算法的內(nèi)部運(yùn)作機(jī)制,我們又能得到什么教訓(xùn)呢?我們發(fā)現(xiàn)自己越來越多地從經(jīng)驗(yàn)角度觀察人工智能,就好像它是自己出現(xiàn)的一樣,仿佛人工智能是需要先識(shí)別、后理解的東西,而不是根據(jù)第一原理設(shè)計(jì)產(chǎn)生的技術(shù)。我們與人工智能之間的關(guān)系正在發(fā)生轉(zhuǎn)變,對(duì)我這樣的科學(xué)家而言,這樣的前景令人深思。在谷歌云的新職位上,我可以鳥瞰越來越依賴于各個(gè)層面技術(shù)的世界,但我們不能坐而論道、驚嘆于一切的神奇。這種奢侈我們負(fù)擔(dān)不起。新一代人工智能所能做的一切,無論是好是壞,無論是在預(yù)期之內(nèi),還是在意料之外,都因其設(shè)計(jì)本身缺乏透明度而變得復(fù)雜。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)本身充滿了神秘色彩,它是由微小的、權(quán)重微妙的決策單元組成的巨大集合體。這些決策單元孤立地看毫無意義,但以最大的規(guī)模組織起來時(shí),卻強(qiáng)大得令人咋舌,幾乎無法為人類所理解。我們可以從理論的、抽象的意義上談?wù)撋窠?jīng)網(wǎng)絡(luò):它們能做什么,它們達(dá)到目標(biāo)需要什么樣的數(shù)據(jù),它們訓(xùn)練后的性能特征大致在哪個(gè)范圍;但從一次調(diào)用到下一次調(diào)用,它們?cè)趦?nèi)部到底做了什么,卻是完全不透明的。
由此帶來的后果特別令人擔(dān)憂,這就是一種被稱為“對(duì)抗攻擊”的新型威脅。在對(duì)抗攻擊中,輸入內(nèi)容的唯一目的是迷惑機(jī)器學(xué)習(xí)算法,以達(dá)到反直覺甚至破壞性的目的。舉例來說,一張照片看上去是描繪了某種明確的事物(比如藍(lán)天下的長頸鹿),但可以通過單個(gè)像素顏色的細(xì)微變動(dòng)進(jìn)行修改。盡管這種像素顏色的變化是人類肉眼無法察覺的,卻會(huì)在神經(jīng)網(wǎng)絡(luò)中引發(fā)一連串的故障。如果對(duì)抗攻擊設(shè)計(jì)得當(dāng),雖然原始圖像看起來沒有任何變化,但算法會(huì)把“長頸鹿”這樣的正確分類變成“書架”或“懷表”等錯(cuò)誤分類。先進(jìn)技術(shù)無法辨認(rèn)野生動(dòng)物照片的場(chǎng)景可能會(huì)讓人覺得好笑,但如果對(duì)抗攻擊的目的是愚弄自動(dòng)駕駛汽車,導(dǎo)致汽車對(duì)停車標(biāo)志,甚至人行橫道上的兒童進(jìn)行錯(cuò)誤分類,就絕對(duì)不能用好笑來形容了。
當(dāng)然,提高工程技術(shù)水平可能會(huì)有所幫助。“可解釋的人工智能”,或簡稱為“可解釋性”,正在成為新的研究方向,令人備受鼓舞??山忉尩娜斯ぶ悄茉噲D將神經(jīng)網(wǎng)絡(luò)近乎神奇的計(jì)算進(jìn)行簡化,轉(zhuǎn)變成人類可以仔細(xì)研究和理解的形式。但相關(guān)研究尚處于起步階段,無法保證能夠達(dá)到其支持者所期望的高度。與此同時(shí),這項(xiàng)技術(shù)所要詮釋的模型卻已經(jīng)開始在世界各地大量出現(xiàn)。
即使是完全可解釋的人工智能也僅僅是第一步。如果在算法設(shè)計(jì)完成后,再加入安全性和透明度等考慮因素,無論設(shè)計(jì)得多么精妙,都不足以滿足要求。下一代人工智能必須從開發(fā)之初就采取與現(xiàn)在完全不同的理念。以激情為起點(diǎn)固然很好,但我們要面對(duì)的是紛繁復(fù)雜而又不起眼的挑戰(zhàn),要取得真正的進(jìn)展,就必須有敬畏之心。而硅谷似乎缺乏這種心態(tài)。
學(xué)術(shù)界早就意識(shí)到人工智能可能會(huì)帶來負(fù)面沖擊,比如缺乏透明度、容易受到偏見和對(duì)抗性影響等等。然而,由于研究規(guī)模有限,風(fēng)險(xiǎn)一直只存在于理論層面。我的實(shí)驗(yàn)室最有現(xiàn)實(shí)影響力的工作是環(huán)境智能研究。由于臨床法規(guī)的制約,我們對(duì)工作熱情保持謹(jǐn)慎和克制,因此有足夠的機(jī)會(huì)來應(yīng)對(duì)相關(guān)隱患。但現(xiàn)在,市值接近萬億美元的公司已經(jīng)掌握了主導(dǎo)權(quán),潛在風(fēng)險(xiǎn)的發(fā)展步伐也急劇加快。無論是否準(zhǔn)備就緒,這些問題都需要以商業(yè)速度加以解決。
每個(gè)問題單獨(dú)來看都令人擔(dān)憂,但它們共同指向了一個(gè)未來,其特點(diǎn)是監(jiān)督減少、不平等加劇,如果處理不當(dāng),甚至可能導(dǎo)致迫在眉睫的數(shù)字獨(dú)裁主義問題。走在全球最大公司之一的走廊里,我不禁陷入沉思,問題的確很尷尬,尤其是考慮到同事們的誠意和良苦用心。這些都是制度性問題,而不是個(gè)人問題?,F(xiàn)在還沒有出現(xiàn)胡子拉碴的典型惡棍,我們還沒有遇到真正的現(xiàn)實(shí)問題,此時(shí)提出這些挑戰(zhàn),只會(huì)讓人更加困惑。我回想起與阿尼共事的情景,想起當(dāng)時(shí)要在幾家醫(yī)院部署手工制作的小型原型設(shè)備是多么困難。在高度謹(jǐn)慎的醫(yī)療領(lǐng)域,創(chuàng)新是逐步展開的,雖然有時(shí)令人沮喪,但總體上也讓人感到心安。我想知道醫(yī)療領(lǐng)域的做法是否值得廣泛效仿。
硅谷的傲慢態(tài)度向來為外界所詬病。在人工智能時(shí)代,盡管我們對(duì)潛在風(fēng)險(xiǎn)的認(rèn)知不斷加深,企業(yè)的夸夸其談也上升到了新的高度。首席執(zhí)行官們?cè)谑澜绺鞯氐奈枧_(tái)上發(fā)表主題演講,有些內(nèi)容高瞻遠(yuǎn)矚,有些則拙劣不堪,還有一些是徹頭徹尾的侮辱。企業(yè)高管們承諾將在不久后推出自動(dòng)駕駛汽車,設(shè)計(jì)出高超精湛的腫瘤檢測(cè)算法,實(shí)現(xiàn)工廠的端到端自動(dòng)化。至于被先進(jìn)技術(shù)取代了工作的人(出租車司機(jī)、長途卡車司機(jī)、裝配線工人甚至放射科醫(yī)生)的命運(yùn),商業(yè)領(lǐng)域的態(tài)度似乎介于半心半意的“再培訓(xùn)”和幾乎不加掩飾的漠不關(guān)心之間。
無論首席執(zhí)行官和自詡為未來學(xué)家的人的言論如何徹底脫離公眾,技術(shù)的日益普及都會(huì)進(jìn)一步加劇人們對(duì)人工智能的恐懼。在這個(gè)時(shí)代,里程碑接二連三地出現(xiàn),最可怕的情景正在逼近。在人工智能領(lǐng)域的歷史上,第一次出現(xiàn)了流血事件。
在亞利桑那州坦佩市,優(yōu)步先進(jìn)技術(shù)集團(tuán)正在測(cè)試一輛自動(dòng)駕駛原型汽車。伊萊恩·赫茨伯格(Elaine Herzberg)推著自行車過馬路時(shí),被這輛車撞倒身亡。兩年多前,優(yōu)步策劃了卡內(nèi)基梅隆大學(xué)機(jī)器人系團(tuán)隊(duì)離職記,而現(xiàn)在,優(yōu)步的自動(dòng)駕駛項(xiàng)目成了公眾嘲諷的對(duì)象。如果說人工智能如今頻頻遭遇偏見讓我和同事們感到難過,那么我們現(xiàn)在的感受則無法用語言來形容。優(yōu)步的品牌已經(jīng)聲名狼藉,其原因與技術(shù)本身關(guān)系不大。盡管我們很容易將事故歸咎于優(yōu)步,但很明顯,這絕對(duì)不會(huì)是最后一個(gè)類似的事故。
的確,更多教訓(xùn)很快就出現(xiàn)了。2016年,ProPublica1的一系列調(diào)查顯示,有偏見的人工智能被廣泛應(yīng)用于處理貸款申請(qǐng),甚至協(xié)助法官做出假釋決定等方面。類似的報(bào)道還顯示,在某些招聘中,求職者會(huì)先經(jīng)過人工智能技術(shù)的篩選,然后才有真人面試官進(jìn)行面試。此類做法往往會(huì)在無意中造成歧視性影響,這一點(diǎn)并不令人意外。伊萊恩·赫茨伯格的死亡理所當(dāng)然地導(dǎo)致優(yōu)步自動(dòng)駕駛團(tuán)隊(duì)解散,并對(duì)整個(gè)領(lǐng)域造成了負(fù)面影響,但上述更微妙、更機(jī)構(gòu)化的傷害卻不可能迅速得到糾正。相關(guān)問題幾乎是無聲無息的,影響范圍更廣,而監(jiān)管則少之又少。期待出現(xiàn)同樣程度的公憤是不現(xiàn)實(shí)的。但好在公眾意識(shí)在不斷提高,媒體也認(rèn)識(shí)到,當(dāng)涉及人工智能的報(bào)道時(shí),不應(yīng)忽視偏見、公平和隱私等問題。
無法問責(zé)算法、特定人群受到不公平待遇、一個(gè)人意外死亡,這些都是人工智能領(lǐng)域出現(xiàn)的新局面。審視局面,我得出結(jié)論:簡單的標(biāo)簽已經(jīng)不再適用。甚至連“失控”等措辭都顯得委婉。人工智能不是現(xiàn)象,不是顛覆,不是難題,也不是特權(quán)。我們面對(duì)的是一種自然力量。它是如此宏偉,如此強(qiáng)大,如此反復(fù)無常,既能輕易激發(fā)靈感,也很容易摧毀一切。要讓人工智能值得信任,需要的遠(yuǎn)不止商業(yè)公司空洞的陳詞濫調(diào)。
人工智能甚至不是科技界對(duì)公共利益的唯一威脅,這使得情況變得更加復(fù)雜。在人工智能領(lǐng)域出現(xiàn)問題的時(shí)候,劍橋分析公司也爆出丑聞。在2016年美國總統(tǒng)大選期間,公眾普遍對(duì)虛假信息表示擔(dān)憂。關(guān)于社交媒體和新聞源過濾氣泡的不良影響的報(bào)道也在不斷增加。種種事件都有一個(gè)共同之處:世界正在逐漸意識(shí)到,數(shù)據(jù)不僅有價(jià)值,而且具有影響力,甚至可以產(chǎn)生前所未有的決定性影響。
到2018年,已經(jīng)沒有人再質(zhì)疑其中的利害關(guān)系了。對(duì)臉書和Instagram等社交媒體應(yīng)用的審查不斷加強(qiáng),因?yàn)樗鼈兲峁┑某瑐€(gè)性化內(nèi)容可能會(huì)導(dǎo)致青少年出現(xiàn)抑郁和焦慮。社交媒體利用人工智能打磨定制化內(nèi)容,以實(shí)現(xiàn)最大程度的“用戶參與”,這種趨勢(shì)令人不安。亞馬遜使用一系列監(jiān)控工具(包括監(jiān)控腕帶)實(shí)時(shí)追蹤工人的工作效率,這種倉庫管理方式受到媒體抨擊。微軟在試圖推廣其人工智能面部識(shí)別技術(shù)時(shí),遭到了隱私權(quán)倡導(dǎo)者和公民自由組織的批評(píng)。我自己也被卷入爭(zhēng)議的中心。當(dāng)時(shí)谷歌云與美國國防部簽訂的一份合同(內(nèi)部稱Maven項(xiàng)目)引發(fā)了廣泛的爭(zhēng)論。幾個(gè)月后,緊張局勢(shì)從公司內(nèi)部蔓延到媒體,重新點(diǎn)燃了大眾關(guān)于技術(shù)在軍事事務(wù)中所扮演角色的長期爭(zhēng)議??萍嫉种评顺币呀?jīng)來臨,人工智能難以獨(dú)善其身。
(本文節(jié)選自《我看見的世界:李飛飛自傳》第十一章《無人可控》。)