編者按:大數(shù)據(jù)技術并不關心現(xiàn)代科學和法律賴以存在的因果機制,也不關心個體的動機和意識,而是主張“讓數(shù)據(jù)自己說話”,通過挖掘海量的歷史數(shù)據(jù),不斷提升數(shù)據(jù)的精確度,來發(fā)現(xiàn)事物的相關性和潛在秩序,以指導和控制未來。這種大數(shù)據(jù)理性被認為和古代的占卜理性有著驚人的一致性,因此也可稱是一種迷思。它本質(zhì)上將人的主體性和不確定性抽離,用算法系統(tǒng)代替人的自主理性,可以預見的是,現(xiàn)代主體的心智隱私將一步步喪失,逐步被改造為算法依賴主體,進而影響人類社會的創(chuàng)新和未來。正是在這個意義上,作者反思大數(shù)據(jù)神話,提醒其可能帶來的人類文明的深層危機。
《從大數(shù)據(jù)神話拯救隱私》
文 | 余成峰(《讀書》2022年1期新刊)
壹
博爾赫斯曾寫過一則短故事,在這個故事里,他描述了一片遙遠的陸地,那里的地圖學達到了荒謬的極端:地圖師們雄心勃勃地繪制了一張精確的地圖,跟整個帝國的比例是一比一。博爾赫斯諷刺地寫道:子孫后代根本找不到這張笨重地圖的實際用處。于是,這張地圖就這樣爛在了沙漠中,并和它代表的地圖學一起隨風而逝。
博爾赫斯的地圖悖論是:如果地圖和地理同樣龐大,那么地圖也就喪失了存在的意義。但當大數(shù)據(jù)技術興起,這一悖論似乎有了新的解讀可能。當數(shù)據(jù)存儲、處理和展示的能力足夠,一張與帝國比例相同的實時數(shù)字地圖,理論上已不再是天方夜譚。
對于美國《連線》雜志前主編克里斯·安德森(Chris Anderson)來說,博爾赫斯的諷刺本身就是諷刺。在二〇〇八年著名的《理論的終結:數(shù)據(jù)洪流淘汰科學方法》一文中,安德森宣告,面對海量數(shù)據(jù),“假設、模型、檢驗”的一系列科學方法正變得過時。我們可以停止尋找模型,在不經(jīng)假設的前提下對數(shù)據(jù)進行分析,將數(shù)據(jù)投入盡可能大的計算集群,讓統(tǒng)計算法找到科學未能尋找到的模式。
安德森介紹了科學狂人J.克雷格·文特爾(J.Craig Venter)“鳥槍法”基因測序的工作。通過高速測序儀和超級計算機對大數(shù)據(jù)進行統(tǒng)計分析,文特爾先是對單個有機體測序,接著對整個生態(tài)系統(tǒng)測序。二〇〇三年,跟隨庫克船長的航程,他對大量海域進行了測序。而在二〇〇五年,他開始對空氣展開測序。在整個過程中,他發(fā)現(xiàn)了數(shù)千種以前未知的細菌與其他生命形式。
與現(xiàn)代性主要基于個人意向思考和社會自由溝通的理性模式不同,大數(shù)據(jù)的技術原理主要依循后驗性的推斷。它并不預設任何前瞻性標準,而是通過歷史數(shù)據(jù)的搜集、回看與整理,從混沌的數(shù)據(jù)海洋中回溯性地挖掘可供算法自主運作的模式。正如麥肯齊(D.A.MacKenzie)在《引擎,而非照相機:金融模型如何塑造市場》中所說,將過去作為線索,以推斷不可知的未來。
大數(shù)據(jù)的運行基于自我指涉(self-reference)的技術系統(tǒng)閉合性。這要求擺脫人類意志的干預,排除外界意見交流的干擾,通過自身算法和代碼的設置,完成數(shù)據(jù)挖掘與概率預測的全過程。例如,網(wǎng)絡平臺的個性產(chǎn)品推薦和廣告分發(fā),就不再需要專家系統(tǒng)或市場調(diào)查機構的幫助,也不再預備各類前期知識與相應的假設,只需要經(jīng)由機器學習,通過特定的算法機制自動在全平臺流通的信息中搜索、比對和分析,從而產(chǎn)生新的可用知識。這類知識主要基于歷史與實時行為數(shù)據(jù)的存儲記錄,通過特定的算法技術賦予信息以結構,提煉其相關性模式,用以預測和指導后續(xù)的運作方向。借助互聯(lián)網(wǎng)時代海量的數(shù)據(jù)規(guī)模,以及各種用以過濾、篩選與再合成歷史信息的算法技術開發(fā),從而將冗余的數(shù)據(jù)資源通過新的循環(huán)和再利用機制,轉(zhuǎn)化為一種具有自我觀察與自我指向功能的技術裝置。
正因如此,基于“數(shù)據(jù)完備性假設”的大數(shù)據(jù)強調(diào)定量先于定性,在這種認知信念下,海量的數(shù)據(jù)和統(tǒng)計學工具為理解世界提供了一種全新的方式,“相關性取代了因果關系;即使沒有自洽的模型、統(tǒng)一的理論或真正的機械論解釋,科學也會進步”(安德森語)。因果是主觀的,數(shù)據(jù)是客觀的。大數(shù)據(jù)相信表象世界背后的概率相關性,從而拒絕任何帶有主觀色彩的因果設定。世界雖然高度復雜,但此種復雜性只是一種既定的、可被算法有效化約的可計算對象。于此,大數(shù)據(jù)為我們許諾了一個社會物理學的美麗新世界,在這個新世界中,最關鍵的是掌握所有顆粒(你和我)的隱私細節(jié)。一旦掌握了所有細節(jié),便可以設計出更為公平、智能和高效的企業(yè)、組織與社會,這便是大數(shù)據(jù)所宣揚的“微粒社會”(The Granular Society)。
貳
但是,博爾赫斯的諷刺是否具有更為深邃的內(nèi)涵?大數(shù)據(jù)技術是否已完全破解全景帝國地圖的悖論?大數(shù)據(jù)的可能性及其限度是什么?對此,意大利社會理論家埃斯波西托(Elena Esposito)提出的創(chuàng)見頗具啟發(fā)性。她的驚人發(fā)現(xiàn)是,大數(shù)據(jù)理性不同于現(xiàn)代科學理性,而存在某種“返祖”現(xiàn)象,它與古代近東、希臘和中國的占卜術有異曲同工之妙:關注表象、相關性、展示先于提問、完美記憶。
事實上,在近代科學革命之前,占卜術長期是知識發(fā)現(xiàn)、行動決策和應對不確定未來的重要手段。古典學家韋爾南總結了占卜理性的認知結構:強調(diào)必然性,否定偶然性,摒棄對于事件線性因果關系的追索,核心是揭示萬事萬物的同源性、相關性以及宇宙的命定秩序。因為,在占卜世界中,所有現(xiàn)象都是其他現(xiàn)象的征兆,并不存在非對稱的線性因果關系;無論是鳥的飛行軌跡、動物肝臟、星宿遷移、龜甲裂紋、水紋波動,都暗藏了宇宙秩序的玄機,可以用來解釋所有其他未知事物。根據(jù)法國漢學家汪德邁的研究,占卜理性乃以形態(tài)學為基礎,關注事件之間的關聯(lián),忽視因果鏈,重視圖形組合變化,以此代表與每一個無窮盡的新變化相應的宇宙狀態(tài)的整體變化。因此,占卜理性恰與神學理性相區(qū)別,后者將每一事件解釋為神意,每一事件都是神意設計的結果。神意安排是手段,超驗是目的,而此種神學目的論恰恰也正是因果思想的生發(fā)基礎。
如汪德邁所說,占卜術把現(xiàn)象世界的無窮偶合轉(zhuǎn)化為幾種格式化的、付諸計算的知性。它的工作原理是高度技術化和程式化的,“卜”的類型化是對無數(shù)未設定的卜兆的抽象,從而成為可標準化操作的信息一般化媒介。與占卜理性指向宇宙世界的技術類似,大數(shù)據(jù)則以人的數(shù)字痕跡作為勘察資源。大數(shù)據(jù)預設的世界圖景也同樣屏蔽了偶然性的存在,一切事物無非是數(shù)字比特和信息熵潮起潮落的映射,不需要探究現(xiàn)象的深層目的與意義指向,而只需在數(shù)據(jù)的表面搜索其概率空間和模式變量。與占卜術的指導原理相同,大數(shù)據(jù)技術同樣假設在事物之間存在同時性原理,萬物在終極數(shù)學意義上可以相互操作,從而形成控制論意義上的數(shù)字相關性。它同樣無需在過去和未來之間,在原因與結果之間,在問題和答案之間,建立直接的因果律關系,無需理解、詮釋與溝通其深層意涵。相反,代碼、算法和數(shù)據(jù)的同步化運行,借助人工神經(jīng)網(wǎng)絡與深度學習技術,就可以為我們呈現(xiàn)事物的潛在秩序。正如我們無法挑戰(zhàn)神諭,我們也同樣無法對大數(shù)據(jù)提供的答案置言。與占卜術一樣,大數(shù)據(jù)的基本目標也是通過展示世界的隱匿秩序來指導未來,進而控制與塑造未來,或者說,它們都是一種去時間的時間性技術。
在十七世紀之前的基督教世界,時間乃是上帝永恒注視下的概念,而在十七世紀之后,時間變成一個“反身性”(reflexive)的概念,人類主體作為“觀察者”開始打破整體的永恒時間,通過當下的行動介入,干預從過去朝向不確定未來的進程。這種新的啟蒙時間觀,在一系列分類學(Taxonomy)、本體論(Ontology)和認識論(Epistemology)的支持下,成為現(xiàn)代國家與各大社會系統(tǒng)建制的基本動力。
首先產(chǎn)生于歐洲的現(xiàn)代科學與法律理性,同時預設了世界的可知性和偶然性,科學與法律的目的并非尋找世界的必然真理,而是在持續(xù)的命題假設和反復的辯駁驗證中形成可供進一步討論與廓清的結論。與現(xiàn)代科學傳統(tǒng)一樣,現(xiàn)代法律方法論主要通過各種法律理論、命題和學說,對不同法律事件、證據(jù)與法律規(guī)范的因果關系進行推論解釋以及合法性證明,其應用場景通常圍繞當事人的溝通行動以及抗辯活動展開,主要圍繞法律人格、法律行為等主觀意向性概念建構體系。在這種理性傳統(tǒng)下,現(xiàn)代法律需要不斷的質(zhì)疑、提問以及意義的詮釋,其關鍵是通過原則的意義解釋,回應當事人在特定案件語境下深層正義需求的沖突,以此克服硬性法律規(guī)則的僵滯。意義詮釋提供了面向不確定的未來實現(xiàn)價值持續(xù)更新的動力。這要求現(xiàn)代法律主體必須同時具備觀察能力、行動能力與反思能力。而大數(shù)據(jù)神話的信條則預設過往歷史業(yè)已囊括了未來的所有線索,無需意義的因果建構,無需深層的價值追問,最關鍵的只是數(shù)據(jù)、速度以及效率。如果說,現(xiàn)代理性需要不斷突破事物表象,探尋事件背后的原因、機制和意義,而大數(shù)據(jù)理性則堅稱只需返回表面的關聯(lián),而無需深入探究和反思社會深層結構的原理。
事實上,整個現(xiàn)代科學、道德與法律傳統(tǒng)都建立在對于因果理性的思考之上。命題假設和實驗證明、理性選擇與道德責任、規(guī)范預期和法律后果,都有賴于因果推斷及其意義解釋作為基礎。更關鍵的是,因果思維為人類文明演化提供了一種反事實推理(what-ifs)的能力,提供了某種基于模態(tài)邏輯(modal logic)進行社會想象與世界創(chuàng)造的可能。在韋伯新教倫理的論述中,反對現(xiàn)狀的救贖期望也正是一切現(xiàn)代道德行動和科學思想的基石,回溯過往的行為以及設想其他可能情境的能力,成為一切自由意志與道德責任的基礎。
近代以降,我們生活在一個以因果科學為基礎的時代,占卜理性對宇宙命定秩序的探尋逐漸淪為前現(xiàn)代的迷信和僭妄。現(xiàn)代科學與法律理性都必須借助理論學說、命題假設和方法論操作,將理性結論通過可操作與可驗證的機制反復辯駁。換言之,現(xiàn)代真理始終是有邊界的、不完美的、有條件的,真理不是必然的而是偶聯(lián)的,是據(jù)時間、空間和觀察者視角的不同而隨時發(fā)生變化的。正因如此,現(xiàn)代社會的運行同時預設了各種自由與民主論證的制度架構的存在。
現(xiàn)代性的核心特征在于由人類行動本身的不確定性所決定的未來的高度開放性,而占卜理性的式微在于其宣示宇宙秩序的必然性。正因如此,由于同樣不能回應現(xiàn)代世界的偶聯(lián)性和不可決定性特征,大數(shù)據(jù)技術與現(xiàn)代社會的理性文化構成了深刻沖突。
叁
盧曼使用“雙重偶聯(lián)性”(Double Contingency)概念概括現(xiàn)代社會的核心特征,即社會是由互為黑箱的隱私個體在無法確知彼此意圖的狀態(tài)下互動演化的。世界的復雜性正來自此種隱私黑箱所帶來的微妙狀態(tài)。這種不確定性決定了人類必須在各種可能性中主動或被迫進行選擇,從而存在各種期望落空、事與愿違和突發(fā)意外的可能。但在隱私保護下,這種不確定性不會構成對未來行動機會的毀滅性打擊,從而提供了不斷自由試錯的空間。同時,隱私也讓現(xiàn)代主體獲得突破任何既定秩序的能力,為新的因果可能性探索提供了庇護所。而在這個意義上,大數(shù)據(jù)技術由于難以把握雙重偶聯(lián)性的深度,它只能依照歷史數(shù)據(jù)的相關性映射出某種簡單的概率模式,它無法真正理解社會溝通的不可預測性,而只是借助算法機制強行遮蔽與簡化人類社會的復雜性,并以此限制新的社會想象和實踐探索。而從根本上說,這一困境無法通過數(shù)據(jù)本身的規(guī)模與處理速度的提升解決,這是由大數(shù)據(jù)和占卜技術所共享的理性模式所決定的。
現(xiàn)代性的文化演化依托于個體隱私的豐富和深度,隱私保護個人心理的黑箱不被外部洞穿與支配,以此應對各種例外情況和不確定性,這成為一系列現(xiàn)代自由價值發(fā)育的基礎?,F(xiàn)代法律因此假定個體身份的獨特性與不可決定性,隱私保護從而在現(xiàn)代法律中承擔了至關重要的權利功能。在隱私權保護背后,實際上蘊含了整個現(xiàn)代法律人文主義的基礎假設,即作為自由個體的心理情感深度、社會角色蘊含的行動和溝通潛力,及由因果歸責所捍衛(wèi)的自主道德尊嚴。換言之,現(xiàn)代主體的隱私深度從根本上排斥外在的監(jiān)控與干預。
美國法學家萊斯格(Lawrence Lessig)在《代碼2.0》中指出,現(xiàn)代憲法所保護的包括隱私在內(nèi)的法律價值,事實上依賴于技術能力的局限所帶來的制度性生態(tài)平衡。而當技術能力轉(zhuǎn)變,大數(shù)據(jù)等數(shù)字技術迅猛發(fā)展,現(xiàn)代隱私權所扎根的生態(tài)系統(tǒng)開始面臨深刻危機。
大數(shù)據(jù)的運作結構及其智能機制具有獨特性,海量數(shù)據(jù)經(jīng)由算法挖掘生成特定的知識,無需調(diào)用任何個人的動機或意向。因此,大數(shù)據(jù)技術對隱私的影響,也不同于傳統(tǒng)隱私的侵權類型。核心表現(xiàn)在于,大數(shù)據(jù)技術并不指向因果性質(zhì)的刺探與入侵,而是圍繞對社會群體相關性行為模式的挖掘。它無需意圖邪惡地深入掌握不可告知的個人秘密,而以日常的信息基礎設施捕捉各類數(shù)字化的表面蹤跡。通過無與倫比的存儲能力和計算能力,主要基于對歷史行為的估算學習來展開對未來的概率預測。
現(xiàn)代性的哲學、政治和法律概念立足于人的自由意識,包括精神、心靈、自主與隱私等概念。換言之,個體心理系統(tǒng)作為現(xiàn)代性最寶貴的主體資源,有賴于隱私保護來確立法律人格與社會的邊界。此種主體心智隱私不僅是新教倫理與資產(chǎn)階級理性的基礎,同時也是現(xiàn)代科學發(fā)現(xiàn)和法律溝通的前提。而大數(shù)據(jù)的智能形態(tài)及其知識生產(chǎn)機制,則與此種以人類主體意志為中心且意在保護人格資源的現(xiàn)代法律邏輯產(chǎn)生沖突。在這種背景下,大數(shù)據(jù)技術正開始瓦解現(xiàn)代權利的隱私根基。因為,近代隱私權立足于個體意識與自主理性,由主體控制其信息邊界從而捍衛(wèi)基本權利的完整性。然而,大數(shù)據(jù)智能的運行模式,則在很大程度上取代了主體自主理性發(fā)揮的空間,使信息決策權從理性個人轉(zhuǎn)向匿名的算法系統(tǒng),這構成了對傳統(tǒng)隱私哲學假設的嚴峻挑戰(zhàn)。
傳統(tǒng)隱私權圍繞主體之間的信息溝通及其沖突模式展開,隱私侵權是特定主體對其他特定主體信息邊界的侵入,在其背后可以尋找出明確的侵權因果關系。而大數(shù)據(jù)技術則無需因果關系的行動管道實施物理意義上的干預或傷害。相反,只需要信息常規(guī)的搜集、組織、處理與挖掘,通過相關性模式的提取、預測和應用,就足以影響、引導乃至支配主體的行動選擇。
在美國法學家朱麗·科恩(Julie Cohen)看來,大數(shù)據(jù)絕不只是對數(shù)據(jù)的簡單挖掘,在相關性模式識別的背后,實際預設了相應模式選擇的價值理由。在每個數(shù)據(jù)源采集伊始,就已隱含了有關數(shù)據(jù)內(nèi)容與類型化的選擇偏見。機器學習之父湯姆·米切爾(Tom Mitchell)同樣指出大數(shù)據(jù)的一系列設計問題:特定算法與特定問題及其表征的對應關系是如何建立的?需要何種規(guī)模的訓練數(shù)據(jù)?學習假設和假設空間應該基于何種經(jīng)驗進行定位?選擇后續(xù)訓練經(jīng)驗的最佳策略是什么?此種選擇策略又會如何改變學習問題的復雜性?
毋庸諱言,數(shù)據(jù)本身并不具備因果關系表述的能力,它充其量只能對靜態(tài)世界的概率分布進行編碼。而從根本上說,任何大數(shù)據(jù)在理論上也只能是無限數(shù)據(jù)總體中抽取的有限樣本。圖靈獎獲得者珀爾(Judea Pearl)因此認為,深度學習不過只是對柏拉圖洞穴比喻中墻壁投影活動的預測,大數(shù)據(jù)無法觀察到這些陰影其實只是三維物體的空間運動在二維平面上的投射。
科恩進而指出,大數(shù)據(jù)作為當代調(diào)制社會(The Modulated Society)的知識引擎,已不再是技術中立的,作為配置與攫取消費者剩余,以及風險管理、分配與定價的工具,其正當性亟須接受拷問。易言之,大數(shù)據(jù)作為一種社會技術和制度技術,業(yè)已與經(jīng)濟系統(tǒng)、政治系統(tǒng)以及法律系統(tǒng)形成緊密的耦合關系,它以其自命精準的算法判斷主體的偏好,同時又以自己推斷的模式反向塑造和調(diào)節(jié)此種偏好。正因如此,大數(shù)據(jù)已不只是對數(shù)據(jù)的簡單挖掘,不只是對數(shù)據(jù)隱藏知識的提煉,它同時也是影響深遠的行為主義社會實驗,是當代最為激進的社會物理學工程。信息資本主義的大數(shù)據(jù)戰(zhàn)略,有可能將現(xiàn)代主體改造為算法預測指導的路徑依賴主體,從而迥異于近代印刷術時代鍛造的啟蒙隱私主體。
與此同時,大數(shù)據(jù)的廣泛商業(yè)化應用,意味著人類主體研究的私人化趨勢,對此也尤其缺乏制度、程序以及倫理層面的防護措施。正如帕斯奎爾在《黑箱社會》中所說,大數(shù)據(jù)所承諾的“計算社會科學”可能演變?yōu)橄到y(tǒng)壓迫的工具。它們將主觀偏見偽造成看似中立的分數(shù),從而成為分配機遇和施加懲罰的仲裁者。由于算法系統(tǒng)將人看作數(shù)據(jù)點的集合,受此影響的人將不再被當作獨立個體來對待和理解。在此意義上,隱私保護所捍衛(wèi)的人格獨立與離經(jīng)叛道,恰與大數(shù)據(jù)對于可預測性和行為模式趨同化的追求形成對立。
在一個運行良好的社會,其理性形式和知識類型應當是多元而制衡的。換言之,占卜理性、科學理性與大數(shù)據(jù)理性作為人類社會的不同認知模式,理應占據(jù)各自的生態(tài)位,從而形成豐富的心智形態(tài)。而大數(shù)據(jù)神話的盛行,則可能經(jīng)由資本和權力之手的聯(lián)盟,悄然取代其他各種知識類型、智慧觀念與理性動機,蛻變?yōu)槟撤N霸權意識形態(tài),進而威脅現(xiàn)代文明的深層基因。與流行的觀點不同,科恩認為大數(shù)據(jù)而非隱私保護才構成創(chuàng)新的阻礙,因為大數(shù)據(jù)理性對于既往行為模式的全然順應,對于個體偏好的標準化塑造,可能扼殺創(chuàng)新所倚賴的各種機緣巧合與零敲碎打。如果說數(shù)據(jù)即事實,那么創(chuàng)新所需要的恰恰是一種反事實、反數(shù)據(jù)的虛構想象力(would haves),它所提供的不僅是靈活性和適應性,更重要的還包括持續(xù)的反思能力以及反其道而行之的打破現(xiàn)狀、勇于承擔道德責任的能力。人類的因果觀察、行動干預以及反事實的建構能力,是一種獨特的心智天賦,由此進一步孕育出共情、信任、遠期預測和自制能力。在原因與結果的繁復網(wǎng)絡中,這種天賦能夠幫助人類跨越漫長的歷史時間線,超越當下的利益結構和視野偏見,而這尤其依賴于隱私保護所提供的心智容器。
大數(shù)據(jù)技術的興起有其社會根源:可選擇性的不斷增加造成了決斷的困難,必要時,放棄選擇的權利,將選擇交由機器完成,以此降低自主決定的成本與風險,將風險預測和成本管理交由大數(shù)據(jù)之手,可大大減輕沉重的決策負擔。但是,在理性意識、心理意向、主體智能、自主權利與隱私保護之間,實際存在著深奧而隱秘的關聯(lián)。換言之,保護隱私也即保護人類特有的心智類型和人性尊嚴。
正因如此,只有在隱私的邊界之內(nèi),才能為浮面的數(shù)據(jù)和信息提供具身性的意義框架,為主體的道德判斷與商談溝通提供可能,為創(chuàng)造各種不同的“假如世界”提供靈感的避風港。而當大數(shù)據(jù)理性成為社會的凌駕性標準,就可能排斥人類心智的參與和干預,逐漸將現(xiàn)代啟蒙主義的因果理性傳統(tǒng)邊緣化,從而成為人類隱私被機器監(jiān)控全面吞沒的前奏。當理性的定義逐步改變,人類的心智隱私可能也將隨之消亡。
來源:讀書雜志