互聯(lián)網(wǎng)IDC圈12月5日報(bào)道:大家在瀏覽網(wǎng)頁中,越來越發(fā)現(xiàn)一個(gè)令人“驚訝”的現(xiàn)象,有些網(wǎng)站似乎特別了解自己,在一些顯現(xiàn)的地方會不斷向自己推送一些看似自己非常有興趣的內(nèi)容。原來,互聯(lián)網(wǎng)留下了每一個(gè)人的行為軌跡,搜索過什么內(nèi)容,看過什么新聞和視頻,玩過什么游戲,買過什么東西,發(fā)過什么言,這些真實(shí)的屬性數(shù)據(jù)都被一一記錄下來,數(shù)據(jù)分析者認(rèn)為這甚至比起注冊時(shí)填寫的社會屬性等信息更真實(shí)。也就是說,時(shí)下不少互聯(lián)網(wǎng)公司正通過大數(shù)據(jù)分析,捕捉每一個(gè)人的網(wǎng)上行為,并據(jù)此來全面地描述目標(biāo)受眾的屬性特征,對消費(fèi)者進(jìn)行360度畫像,進(jìn)而進(jìn)行有的放矢的精準(zhǔn)營銷和推介個(gè)性化廣告。
創(chuàng)新互聯(lián)主營麻城網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,成都App定制開發(fā),麻城h5微信小程序搭建,麻城網(wǎng)站營銷推廣歡迎麻城等地區(qū)企業(yè)咨詢一、信用卡、手機(jī)、瀏覽、交通
過去的精準(zhǔn)營銷,無非是先進(jìn)行市場細(xì)分,針對目標(biāo)客戶進(jìn)行特征和傾向分析,然后再考慮實(shí)現(xiàn)與客戶、消費(fèi)者一對一的溝通。但是,一個(gè)企業(yè)不可能將所有的產(chǎn)品購買者或者潛在購買者都列入自己的會員系統(tǒng),因?yàn)橄M(fèi)者們已經(jīng)厭煩了那些入會廣告。那么一個(gè)人互聯(lián)網(wǎng)上留下的行為軌跡就是一個(gè)重要的突破點(diǎn)。資深互聯(lián)網(wǎng)數(shù)據(jù)專家指出:“大數(shù)據(jù)就是對每一個(gè)個(gè)體的精確描述,就是從百萬中間找到一個(gè)具體的人。”過去營銷的對象是一群人,一群被標(biāo)上各類標(biāo)簽的人,年齡、職業(yè)、愛好等,現(xiàn)在互聯(lián)網(wǎng)大數(shù)據(jù)能使企業(yè)從一群人當(dāng)中更細(xì)分地去對待每一個(gè)消費(fèi)者、用戶。這些企業(yè)越來越相信,大數(shù)據(jù)能夠讓他們發(fā)現(xiàn)新的藍(lán)海。
的確,一個(gè)人自出生之日,他的數(shù)據(jù)跟蹤就開始了。他的名字,身高和體重都被記錄下來,還可能有一些照片。幾年后,進(jìn)入托兒所,首次生日晚會的邀請,在人口普查中被記錄。再長大一些,有了形影不離的身份證、銀行賬戶、信用卡和智能手機(jī)。他在網(wǎng)上的行為透露出他不斷變化的興趣、憂慮和欲望。有時(shí)他還會特意向朋友、陌生人、公司和政府分享一些自己的數(shù)據(jù)。
從好的方面來講,人類行為的大規(guī)模數(shù)據(jù)集有可能從根本上改變我們對抗疾病、設(shè)計(jì)城市或進(jìn)行研究的方式。無處不在的技術(shù)產(chǎn)生了規(guī)模巨大的個(gè)人元數(shù)據(jù)。我們的智能手機(jī)、瀏覽器、汽車或信用卡產(chǎn)生了我們在什么地方、我們叫什么名字,我們花了多少錢等信息。一些新的領(lǐng)域如計(jì)算社會科學(xué)(computational social science)依靠元數(shù)據(jù)來解決一些重要問題,如抗擊瘧疾,研究信息傳播或監(jiān)視貧困等。對科學(xué)家來說,目前這種大規(guī)模行為數(shù)據(jù)集的使用與顯微鏡的發(fā)明相提并論。約翰霍普金斯大學(xué)2011年獲得了美國國家科學(xué)基金會(NSF)120萬美元的資助,建立秒傳億兆(100 gigabit)的網(wǎng)絡(luò),網(wǎng)絡(luò)每天可傳輸?shù)臄?shù)據(jù)量相當(dāng)于8千萬文件柜的文本數(shù)據(jù)。該項(xiàng)目的負(fù)責(zé)人Alex Szalay博士說,“在每個(gè)科學(xué)領(lǐng)域我們都在生成千兆級數(shù)據(jù),如果我們沒有與21世紀(jì)這個(gè)時(shí)代相當(dāng)?shù)臄?shù)據(jù)顯微鏡、更快的網(wǎng)絡(luò)和相應(yīng)的計(jì)算能力,我們就被困住了。”在他看來,采用大規(guī)模處理能力來過濾千兆級數(shù)據(jù)的新方法是一種全新的計(jì)算,將引發(fā)天文學(xué)和物理學(xué)的新進(jìn)步,就像17世紀(jì)顯微鏡的出現(xiàn)所導(dǎo)致的生物學(xué)和化學(xué)上的進(jìn)步。因此,霍普金斯大學(xué)這個(gè)秒傳億兆的網(wǎng)絡(luò)不僅是一個(gè)高速網(wǎng)絡(luò),而且是研究和發(fā)現(xiàn)必不可少的工具,是21世紀(jì)顯微鏡的必需部件。
但是,人們每天流露出的大量數(shù)據(jù)提供了一些奇妙的新機(jī)遇,也帶來了一些新難題。應(yīng)該注意到,這些有關(guān)某個(gè)人的大量信息收集只是得到別人表面上的同意,或者根本就沒有得到任何首肯。不久以后,一個(gè)人的整個(gè)基因組序列也可能伴隨其醫(yī)療記錄在全球各地研究人員中共享,安置在生活圈子附近的攝像頭也記錄下一個(gè)人的許多行為,甚至當(dāng)他進(jìn)入一家商店或機(jī)場時(shí)就已經(jīng)通過人臉識別出來。上周(2015-01-30)的Science,發(fā)表了以“隱私的終結(jié)(The end of privacy )”為題的特刊的17篇文章。今天這篇博文,先向大家介紹其中一篇Montjoye等的報(bào)告:在購物中心留下的唯一性:有關(guān)信用卡元數(shù)據(jù)的識別。
根據(jù)110萬人3個(gè)月的信用卡記錄的研究發(fā)現(xiàn),只需要四個(gè)時(shí)空節(jié)點(diǎn)的數(shù)據(jù)就足于將90%的人獨(dú)一無二地識別出來。如果再增加一個(gè)數(shù)據(jù),比如某一特定交易的價(jià)格,被識別的風(fēng)險(xiǎn)平均增加22%.即使數(shù)據(jù)集提供的信息比較粗糙,那么在某些方面或者在所有維度下其實(shí)也提供了難于隱藏身份的信息。例如,為了保護(hù)隱私,可能只提供在某特定地理區(qū)域內(nèi)購物,而不是說在某特定商店內(nèi)購物,或者在15天內(nèi)購物而不是說在哪一天內(nèi)購物。如果類似的數(shù)據(jù)再增加幾個(gè),就可能具體確定到某個(gè)人了。這個(gè)研究還發(fā)現(xiàn),女性及在較高收入范圍內(nèi)的人更容易通過這種方法被識別,這可能是因?yàn)樗麄冊谄渌ド痰曛g的時(shí)間分配有著獨(dú)特的模式。
新的計(jì)算技術(shù)可以結(jié)合一些數(shù)據(jù)片段來識別人或跟蹤他們的行為。信用卡記錄與手機(jī)數(shù)據(jù)具有唯一性,這并不會讓人感到奇怪。但其他大規(guī)模元數(shù)據(jù)集,如網(wǎng)站瀏覽歷史、財(cái)務(wù)記錄、交通出行等,其實(shí)也是具有很高唯一性的。將這些數(shù)據(jù)收集起來,進(jìn)行一些技術(shù)處理,就可體現(xiàn)出一個(gè)人的行為特質(zhì)。瀏覽網(wǎng)頁或交通出行看似零散的,是一個(gè)高維不確定的數(shù)據(jù),因?yàn)橐粋€(gè)人可能會瀏覽各種網(wǎng)站,或者在出行中有各種地鐵出入口的組合。但是,針對一個(gè)具體的人來說,他的瀏覽習(xí)慣和出行組合是相對穩(wěn)定的。
該研究還提出了個(gè)人可識別信息(PII)的概念,這是美國和歐盟隱私法的基礎(chǔ),但現(xiàn)在對管理元數(shù)據(jù)集來說有些力不從心了。一方面,在美國隱私法中,只要略去姓名、家庭地址、電話號碼或其他PII中列出的信息就可以不違反隱私法,而如今在這種具有高度唯一性元數(shù)據(jù)集存在的背景下,并不足以保護(hù)個(gè)人的隱私。另一方面,在歐盟提出的數(shù)據(jù)監(jiān)管中,要讓隱私法擴(kuò)展到保護(hù)“任何可能涉及到確定或識別某人的信息”,德國電信要達(dá)到“不可能識別一個(gè)特定人的狀況”,但這些看來都是難于證實(shí)的。
從技術(shù)的角度來看,該研究結(jié)果強(qiáng)調(diào)了改變的需要。在可能的情況下,開發(fā)出更先進(jìn)和更互動的個(gè)人與群體交互的謹(jǐn)慎隱私技術(shù),以及計(jì)算隱私權(quán)方面的研究。從政策的角度來看,該研究強(qiáng)調(diào)了需要改革數(shù)據(jù)保護(hù)機(jī)制,讓其超越PII和匿名性,對被識別可能性進(jìn)行更定量的評估。找到隱私與利用之間的良好平衡,這對保護(hù)元數(shù)據(jù)絕對有至關(guān)重要的作用。
總的來看,盡管有許多方法可用來保護(hù)隱藏在大數(shù)據(jù)文件中的私人信息,但這可能限制了科學(xué)家所能進(jìn)行的研究,因此必須達(dá)成一種平衡。一些醫(yī)學(xué)研究人員坦承,保護(hù)患者的數(shù)據(jù)隱私幾乎是不可能的事兒了。相反,他們正在測試一些新的方法來獲得患者的信任與合作。同時(shí),我們?nèi)绾嗡伎己涂创[私問題也應(yīng)該發(fā)生一些變化。年輕人的網(wǎng)絡(luò)行為已經(jīng)比年紀(jì)大的人暴露了更多有關(guān)他們生活的信息。我們想保護(hù)什么也是發(fā)生變化的,這主要取決于具體的內(nèi)容、時(shí)機(jī)或我們將如何推進(jìn)。正如我們所知,隱私正在終結(jié),我們現(xiàn)在才剛剛開始理解其后果。
二、你的臉和聲音出賣了你
說到利用人體的生物特征進(jìn)行身份識別的問題,大家肯定首先會想到指紋識別。每個(gè)人的指紋是不同的,即使同一個(gè)人的十指之間,指紋也有明顯區(qū)別,因此指紋用于身份鑒定是非??煽康?。雖然指紋特征并非肉眼可輕易分辨的,但作為身份識別的工具至少也用了上千年了。影像記錄和聲音記錄是現(xiàn)代技術(shù)的產(chǎn)物,如果說這些記錄也可以作為生物特征進(jìn)行身份識別,你可能有些小小的驚訝。
不久之前,我們還認(rèn)為匿名是安全的。如果一個(gè)人的照片出現(xiàn)在抗議游行的隊(duì)伍中,可能只有他的朋友能將他認(rèn)出來,電腦是無能為力的,除非這臺電腦一直在負(fù)責(zé)搜尋某個(gè)人,并針對這個(gè)人訓(xùn)練了人臉照片,而且還必須保證用于識別的照片質(zhì)量足夠高。在游行隊(duì)伍中,某人大聲發(fā)表了時(shí)間并不算太長的演講,事后如果只有錄音,也不大可能找出這個(gè)人是誰。
但目前,這些技術(shù)的發(fā)展突飛猛進(jìn),人臉識別的準(zhǔn)確性越來越高,據(jù)Facebook的DeepFace研究團(tuán)隊(duì)在機(jī)器視覺社區(qū)進(jìn)行的測試發(fā)現(xiàn),人類識別的正確率約為98%,而DeepFace團(tuán)隊(duì)的機(jī)器為97.35%,高于其他領(lǐng)域 27%的準(zhǔn)確性。這個(gè)測試的基準(zhǔn)是辨認(rèn)來自LFW中的兩張照片是否為同一個(gè)名人。“我的聲音就是我的密碼。”也許很快大家在給銀行或信用卡公司打電話的時(shí)候就會這么說。指紋或虹膜掃描,每個(gè)人的聲音都是獨(dú)一無二的。安全公司也已經(jīng)將語音識別作為一個(gè)方便的新層進(jìn)行身份驗(yàn)證。
DeepFace的人臉識別效果如此之高,好在他們的目的不是為了侵犯別人的隱私,而是為了保護(hù)隱私。一旦DeepFace從每天上載的4億張新照片識別出某人,就會警告用戶是否要將這張照片進(jìn)行模糊化處理,以保障用戶的隱私。
簡單的面部偵測對電腦來說很容易,至少可以與識別常見的花朵、座椅板凳和燈具等物件相媲美。幾乎所有的人臉都有類似的特征:耳朵、鼻子和嘴而且都處在相對固定的位置。這種一致性為電腦的有效識別提供了一個(gè)捷徑,因此20年前就已經(jīng)做到了,一些廉價(jià)的相機(jī)中都可以采用這種技術(shù)來偵測和聚焦面部。但是,識別人臉則比簡單的面部偵測要困難得多,特別是要將人臉作為惟一性標(biāo)識,那就更是困難重重。與人的指紋不同,人臉總是在不斷變化的。只是微笑一下,人臉就發(fā)生了改變。眼角紋、鼻子的反光點(diǎn)、露出的牙齒,統(tǒng)統(tǒng)都在改變。仰天大笑,臉上顯現(xiàn)的形狀很快發(fā)生變化。即使有同樣的表情,人的頭發(fā)也在不斷發(fā)生變化,剛理發(fā)后的變化更是非常大。然而,人眼卻能毫不費(fèi)力地從一堆照片中認(rèn)出他認(rèn)識的人,即使這個(gè)人他們只見過一面。根據(jù)我們所感知的周圍世界,人臉識別可能是人類大腦最擅長之處,而電腦則要與研究者們所稱的A-PIE(衰老、姿勢、照明、表情)進(jìn)行頑強(qiáng)的斗爭,來自這些因素的噪聲淹沒了人與人之間細(xì)微差別。
在深度學(xué)習(xí)方法的幫助下,電腦取得了進(jìn)展。正如所有的機(jī)器學(xué)習(xí)工藝,深度學(xué)習(xí)也是從訓(xùn)練數(shù)據(jù)開始的,通過大規(guī)模含標(biāo)簽數(shù)據(jù)集的學(xué)習(xí),理想情況下包括每個(gè)人的多張照片。在該領(lǐng)域,素顏檢測數(shù)據(jù)庫(Labeled Faces in the Wild,LFW)可用于研究非限定臉部識別問題,包含13000多幅從網(wǎng)絡(luò)上搜集的臉部圖像,其中有5749位名人的面孔。這個(gè)數(shù)據(jù)庫是在線免費(fèi)使用的,因此成為人臉識別算法領(lǐng)域最廣泛的測試基準(zhǔn)。對電腦來說,人臉也就是明暗不同的像素集合。深度學(xué)習(xí)系統(tǒng)的訓(xùn)練首先讓系統(tǒng)自行對比臉部特征并發(fā)現(xiàn)其自身的特征,比如眼睛和鼻子,還包括一些無法直觀感受的統(tǒng)計(jì)學(xué)特性,也就是讓機(jī)器和數(shù)據(jù)說話。系統(tǒng)首先要將面部像素的集群識別為元素,即定義輪廓的邊界。后續(xù)處理層將元素組合成非直觀的統(tǒng)計(jì)特性,就是那些看起來很普通,但足于區(qū)分不同的面孔的特征。這就是深度學(xué)習(xí)的“深度”:每個(gè)處理層的輸入是下面層的輸出。訓(xùn)練的最終結(jié)果是一個(gè)人臉的具象模型:比較面孔的圖像并猜測他們是否屬于同一個(gè)人的統(tǒng)計(jì)機(jī)器。系統(tǒng)訓(xùn)練的面孔越多,這種猜測越準(zhǔn)確。
所謂聲紋(Voiceprint),是指用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜,一般通過采集一段演講錄音并分析聲音集中區(qū)域的頻率而完成的。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過程,人在講話時(shí)使用的發(fā)聲器官(舌、牙齒、喉頭、肺、鼻腔)在尺寸和形態(tài)方面差異很大,所以每個(gè)人的聲紋圖譜都有獨(dú)特的,既有相對穩(wěn)定性,也有一些變異。這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,由于每個(gè)人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。
與指紋不同,聲紋需要結(jié)合一些行為元素來鑒別。說話的節(jié)奏、方言和口音這些特征是很容易區(qū)分的。一般的語音識別系統(tǒng),主要是為了理解說話的內(nèi)容,因此會盡量減少一些差異,比如降低過高的音量,忽略停頓和口音等。但如果是為了鑒定某個(gè)人,這些差異卻是非常重要的。一些聲紋系統(tǒng)應(yīng)用設(shè)備中,通常要求用戶重復(fù)一個(gè)標(biāo)準(zhǔn)的短語,而盜賊們恰好可利用這點(diǎn),事先錄下一些短語而糊弄過關(guān)。為了擋住這個(gè)漏洞,系統(tǒng)就被設(shè)計(jì)成一種可檢測錄音或合成語音。在這方面,一個(gè)更簡單、安全、有效的方法是讓客戶重復(fù)讀出一個(gè)隨機(jī)選擇的文本,盜賊很難準(zhǔn)備出所有可能的錄音。還有些系統(tǒng)根本就不需要用戶說什么短語,而是分析一個(gè)人的聲音,提取相關(guān)特征,與存儲的聲紋進(jìn)行比較。
要精確說出自動人臉識別將如何使用,以及有什么樣的法律限制,現(xiàn)在還說不清楚。根據(jù)目前的資料,美國FBI的識別準(zhǔn)確率低于Facebook,導(dǎo)致這種差距的主要原因是其數(shù)據(jù)庫,F(xiàn)BI所采集的臉部信息圖片質(zhì)量參差不齊。臉部識別系統(tǒng)采集的最佳照片是正面照,以臉部為中心點(diǎn) 15 度角拍攝。如果不是被拍攝者自愿拍照,一般很難獲得這樣的照片。FBI的道路拍攝難以獲得最有效的臉部信息,鏡頭處于路人之上,角度和畫質(zhì)都難以達(dá)到識別要求。而Facebook 中的圖片大多是拍攝者主動提供的。除此之外,DeepFace的優(yōu)勢來自更聰明的編程能力。他們通過建立人臉的三維形狀結(jié)構(gòu)克服了識別中A-PIE的部分問題。如果是一張側(cè)面照,程序根據(jù)它所看到的人臉重建一幅正面容貌。這個(gè)“對齊”步驟使DeepFace更加高效,這樣就可以將更多的精力集中在在細(xì)微差別上。這個(gè)過程占用單核電腦幾分之一秒的時(shí)間,這足于讓DeepFace用于智能手機(jī)了。經(jīng)過學(xué)習(xí)之后,每張人臉都可以用一個(gè)256位的哈希(hash)字符串代碼來表示,這種壓縮能力太強(qiáng)大了!10億人的面部數(shù)據(jù)庫就可以儲存在一個(gè)拇指大小的驅(qū)動器上。但是,DeepFace大的優(yōu)勢其實(shí)是它的訓(xùn)練數(shù)據(jù)。DeepFace在發(fā)表的文章中卻輕描淡寫地稱之為社會面部分類庫(SFC),這是一個(gè)有440萬有標(biāo)注的人臉數(shù)據(jù)庫。盡管用戶在注冊時(shí)允許Facebook使用他們的個(gè)人資料,DeepFace并沒有說明是否征得照片主人的同意。
同樣,聲紋提供了便利和安全,也可能帶來隱私問題,因?yàn)樗梢宰屍髽I(yè)和政府有可能來識別一些并不認(rèn)識的人,這對匿名言論保護(hù)來說是一個(gè)挑戰(zhàn),而這恰好是美國憲法第一修正案中的內(nèi)容。商業(yè)公司為了最求大利潤,有追蹤消費(fèi)者移動軌跡和習(xí)慣的需求。如果顧客拿起電話或接近收銀員時(shí)就被識別出來,這將打開一個(gè)市場機(jī)遇,讓消費(fèi)倍感便利。與許多新的認(rèn)證技術(shù)相比,便利性和隱私之間就是一對矛盾。有人擔(dān)心,聲紋可以不經(jīng)他們同意來鑒定說話者,是否侵犯他們的隱私和言論自由。這些技術(shù)一旦成熟,它必將產(chǎn)生許多隱私問題,這是非常容易理解的。如何獲得聲紋以及何時(shí)獲得聲紋是合法這個(gè)問題是非常模糊的。許多國家已立法來規(guī)范竊聽,但聲音識別則增加了一個(gè)重要的新維度,大多數(shù)立法都還未來得及考慮。
私人數(shù)據(jù)的買賣已經(jīng)是一個(gè)繁華的市場了,有合法的,也有非法的,人臉識別將成為另一個(gè)熱門商品。例如,人臉身份證可讓廣告商通過攝像頭捕捉到某個(gè)人后來迎合他們的偏好,甚至根據(jù)他們所知道的這個(gè)人的購物習(xí)慣和人口統(tǒng)計(jì)學(xué)數(shù)據(jù)而提供不同的價(jià)格。但麻煩的是,陌生人也可能從繁華的街道人群中找到你,現(xiàn)實(shí)生活中已經(jīng)無法逃避人臉識別了。美國的FacialNetwork公司利用自己的深度學(xué)習(xí)系統(tǒng)開發(fā)了一個(gè)應(yīng)用程序稱為NameTag(名牌),可用于智能手機(jī)或類似谷歌眼鏡這樣的可穿戴設(shè)備中。NameTag不僅能顯示一個(gè)人的名字,還可以顯示從社交媒體、交友網(wǎng)站和犯罪數(shù)據(jù)庫中挖掘的內(nèi)容。這樣的內(nèi)容顯然令人反感的,F(xiàn)acebook叫停了FacialNetwork,并阻止它收集用戶信息。Learned-Miller認(rèn)為更好的人臉識別其可能的商業(yè)應(yīng)用是個(gè)麻煩,但他更擔(dān)心政府可能濫用這項(xiàng)技術(shù)。他說,“我是100% 支持斯諾登的,我們必須提高警惕”。
如果FBI取得Facebook數(shù)據(jù)庫中的照片,那么辨識率可就不可同日而語了,F(xiàn)BI離取得 Facebook的圖片數(shù)據(jù)庫到底有多遠(yuǎn)呢?Facebook正在面臨用戶隱私的官司,一旦在這場官司中敗訴,政府部門只需要一紙法院執(zhí)行令就可以獲取更多有價(jià)值的用戶數(shù)據(jù)了??磥肀娙说木W(wǎng)絡(luò)隱私權(quán)又面臨重大挑戰(zhàn)了。一篇表示這種擔(dān)心的文章寫道:“很顯然,警察和其他執(zhí)法部門將使用這種技術(shù)搜索我們的照片,而我們卻一無所知”。Facebook也承認(rèn)如果法官有這樣的請求,他們將提供讓其訪問這些數(shù)據(jù)的權(quán)利。人們知道了這樣的情形非常害怕,但馬薩諸塞大學(xué)安姆斯特分校的計(jì)算機(jī)科學(xué)家Learned-Miller教授認(rèn)為這些擔(dān)心是多余的,他說,“如果像Facebook這樣的公司真的踩越社會可接受規(guī)則的界限……他們可能會倒閉。如果他們違反了法律,那么公司就可能關(guān)張,也有人會因此而被逮捕。”懷疑源于缺乏透明度。而學(xué)術(shù)研究者在使用這些私人數(shù)據(jù)進(jìn)行研究時(shí)必須征得別人明確的同意,也就是在注冊網(wǎng)站時(shí)他們在最終用戶許可協(xié)議(EULA)上點(diǎn)“同意”授予該公司使用他們數(shù)據(jù)及一些附加條件。這種在線合同其實(shí)并不是透明的,沒有多少人真正去認(rèn)真看了這個(gè)合同。
三、令人糾結(jié)的人類社會黑匣子
曾經(jīng)在IT歷史上顯赫一時(shí)的美國Sun Microsystems公司似乎總有著超人的先知先覺能力,在公司成立之初的1982年,就接受了約翰。蓋奇(John Gage)的建議,將公司的口號定為“網(wǎng)絡(luò)就是計(jì)算機(jī)”。雖然這句話在目前看來是多么理所當(dāng)然的事兒,但在互聯(lián)網(wǎng)還沒有走入大眾生活,甚至連“信息高速公路”概念都還沒有提出的時(shí)候說出這句話,其實(shí)是很匪夷所思的。而現(xiàn)在,該理念被認(rèn)為與云計(jì)算思想不謀而合,但這已經(jīng)是20年之后的事兒了。無獨(dú)有偶,1999年,面度正如火如荼發(fā)展的互聯(lián)網(wǎng)技術(shù),時(shí)任該公司CEO的斯科特。麥克尼利(Scott McNealy)在一次發(fā)布會上對臺下眾多媒體記者和分析師說道:“你的隱私只剩零了,想開點(diǎn)吧。”,他認(rèn)為互聯(lián)網(wǎng)的分享將徹底“殺死”隱私。自此,關(guān)于互聯(lián)網(wǎng)時(shí)代隱私的爭議不絕于耳,而2013年愛德華。斯諾登披露的棱鏡門事件更是將公眾對隱私問題的關(guān)注推到了一個(gè)新的高度。有不少人呼吁人們要學(xué)會適應(yīng)這個(gè)越來越透明的社會,甚至有人提供一些技巧來拒絕某些互聯(lián)網(wǎng)服務(wù)。其實(shí),這樣的認(rèn)識存在著一個(gè)嚴(yán)重的問題,就是將用戶個(gè)人信息的收集過程等同于對隱私的侵犯。
我也曾對此類話題充滿了興趣。我認(rèn)為社會已經(jīng)發(fā)展到這一步——人類目前并不是擁有選擇信息的自由,相反,通過放棄使用數(shù)字科技來達(dá)到隱私保護(hù)是不可取的?,F(xiàn)在的智能手機(jī)平均配有七個(gè)傳感器,只要人們還在使用互聯(lián)網(wǎng),相關(guān)數(shù)據(jù)就會被搜集,而且會越來越普遍,幾乎可以說是無所不在,無所不包??v觀人類歷史,每當(dāng)一個(gè)新技術(shù)來臨,總有一部分人決定不參與其中,但殘酷的現(xiàn)實(shí)告訴我們,最有可能享受新技術(shù)帶來利益的是那些總是追隨技術(shù)的忠實(shí)客戶。在這個(gè)新的時(shí)代,人們正在發(fā)明新的隱私保護(hù)方式。例如,在電子交易中,網(wǎng)上支付籍于風(fēng)控大腦的幫助會變得越來越安全,而且是用得越多的用戶越安全,因?yàn)橹Ц断到y(tǒng)已經(jīng)找到了一種更接地氣的創(chuàng)意——通過場景來“認(rèn)人”。
最早關(guān)注弗蘭克?帕斯夸(Frank Pasquale)的《黑箱社會》這本書,是源于今年開年之初Nature和Science的幾乎同時(shí)對該書的推薦。究竟是什么好書呢?居然得到了這兩本被學(xué)術(shù)界稱為最高大上刊物的青睞,我充滿了好奇!書名中的black box,讓人聯(lián)想到兩個(gè)概念:飛機(jī)中的黑匣子和系統(tǒng)工程中的黑箱模型??赐赀@本書,讀者會發(fā)現(xiàn),這個(gè)詞的確是一語雙關(guān)的。一方面,物聯(lián)網(wǎng)、大數(shù)據(jù)和無處不在的傳感器網(wǎng)絡(luò)記錄著我們的世界和世界中的人群,就像我們?nèi)巳硕紦碛辛俗约旱囊粋€(gè)黑匣子,隨時(shí)可以被查閱而采取更好的對策。人類行為的大規(guī)模數(shù)據(jù)集有可能從根本上改變我們對抗疾病、設(shè)計(jì)城市或進(jìn)行科學(xué)研究的方式,有人甚至將這種大規(guī)模數(shù)據(jù)集的使用行為與顯微鏡的發(fā)明相提并論。另一方面,我們個(gè)人卻不知道有多少信息被記錄了,這些信息會傳播到什么地方,也不知道哪些人會使用它,使用這些信息的目的何在,更無從知道這些信息的泄露會產(chǎn)生怎樣的后果,依據(jù)這些信息所做的判斷是否準(zhǔn)確,是否存在偏見或破壞性?這對目前的人類社會來說,就是一個(gè)神秘的黑箱運(yùn)作機(jī)制!我們正處于一種迫切希望收集更多的數(shù)據(jù),又害怕數(shù)據(jù)被收集太多的糾結(jié)之中,本書就主要針對探討這種糾結(jié)進(jìn)行探討,提供了不少新思維,閱讀該書可能推進(jìn)我們對于隱私爭議的理解和認(rèn)識上的更新。
《黑箱社會》這本書最可取之處,是脫離了以往那些空談隱私保護(hù)的話題,而是時(shí)不時(shí)給出了問題的癥結(jié)和可能的解決方案。早期的隱私專家只是強(qiáng)調(diào)信息威力的力量失衡對社會造成的后果,那些所謂的經(jīng)典補(bǔ)救措施也就是要求個(gè)人知情同意。問題是,只要告訴如何使用這些數(shù)據(jù),只要他們同意,隱私就得到了維護(hù)嗎?帕斯夸里認(rèn)為這遠(yuǎn)遠(yuǎn)不夠。知情同意面對目前的社會已經(jīng)退化到一個(gè)呆板的鬧劇,因?yàn)槲覀兇蠖鄶?shù)人既沒有時(shí)間也沒有足夠的專業(yè)知識來解讀這個(gè)潘多拉魔盒。雖然大數(shù)據(jù)能夠從大量多維數(shù)據(jù)和組合中獲得新的洞見,但在如此背景下也只有富人能承擔(dān)數(shù)據(jù)使用的費(fèi)用,總體上只會加劇系統(tǒng)本身的缺點(diǎn)。因此,帕斯夸里主張隱私保護(hù)制度的根本轉(zhuǎn)變,放棄知情同意這種形式上的做法,去嚴(yán)格監(jiān)管實(shí)際使用這些數(shù)據(jù)的企業(yè)和政府機(jī)構(gòu)。難怪Science周刊在書評中稱之為“史詩般的變化”。
對待信息的角力,帕斯夸里在書中強(qiáng)調(diào)了三個(gè)關(guān)鍵詞:信譽(yù)、搜索和金融。信譽(yù)是被他人認(rèn)識的結(jié)果,搜索為了認(rèn)識他人,金融則是幫助人們做出經(jīng)濟(jì)決策。各公司都在為挖掘潛在的客戶詳細(xì)信息費(fèi)盡心思,但在面向監(jiān)管時(shí),卻極盡手段隱藏它們的統(tǒng)計(jì)數(shù)據(jù)和操作規(guī)程,也阻止用戶對由此生成的數(shù)字檔案進(jìn)行任何操控,這其實(shí)是在制造黑箱。試想,如果這些東西是隱藏的,那么錯(cuò)誤的數(shù)據(jù)、無效假設(shè)和有缺陷的模型就不能得到糾正,這種黑箱可能最終危及我們所有人。我們?nèi)缃竦纳钜呀?jīng)受到了信息的影響,制定一個(gè)緊跟時(shí)代的信息管理框架已迫在眉睫,其中政府公共部門應(yīng)發(fā)揮什么作用呢?也許,我們需要一個(gè)公共機(jī)構(gòu)來利用全面的數(shù)據(jù)提供信用評分,用一個(gè)開放的、可解釋的算法決策工具來代替黑箱系統(tǒng),而不是靠各自私營企業(yè)自己搜集的數(shù)據(jù)和評定代碼。真正將黑箱社會變成顯式社會,確保最重要公司的關(guān)鍵決策是公平的,一視同仁的,并能接受批評。
本文名稱:大數(shù)據(jù)時(shí)代:致我們終將逝去的隱私
本文地址:http://redsoil1982.com.cn/article24/chjjce.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供全網(wǎng)營銷推廣、用戶體驗(yàn)、云服務(wù)器、定制開發(fā)、動態(tài)網(wǎng)站、品牌網(wǎng)站設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容