2021年7月4日,國(guó)家網(wǎng)信辦發(fā)布重要通告:根據(jù)舉報(bào),經(jīng)檢測(cè)核實(shí),“滴滴出行”App存在嚴(yán)重違法違規(guī)收集使用個(gè)人信息問題。國(guó)家互聯(lián)網(wǎng)信息辦公室依據(jù)相關(guān)規(guī)定,通知應(yīng)用商店下架“滴滴出行”App,要求滴滴出行科技有限公司嚴(yán)格按照法律要求,參照國(guó)家有關(guān)標(biāo)準(zhǔn),認(rèn)真整改存在的問題,切實(shí)保障廣大用戶個(gè)人信息安全。
網(wǎng)友的臆測(cè)
滴滴是出行行業(yè)的巨頭企業(yè),且領(lǐng)先優(yōu)勢(shì)明顯。我們看一組統(tǒng)計(jì)數(shù)據(jù),單單只在2020年5月,滴滴出行平臺(tái)的月活躍人數(shù)就高達(dá)5439萬(wàn)人,比第二名高出了5193萬(wàn)人。
最新的招股書顯示,截至2021年3月,滴滴在包括中國(guó)在內(nèi)的15個(gè)國(guó)家約4000多個(gè)城鎮(zhèn)開展業(yè)務(wù)。2020年,滴滴出行中國(guó)出行業(yè)務(wù)收入達(dá)1336億元,比第二名哈啰出行的60.44億元高出20倍有余。
高額營(yíng)收的背后是滴滴擁有的龐大的用戶群,以及用戶數(shù)據(jù)。2020年,滴滴出行僅在中國(guó)地區(qū)就有3.77億活躍用戶。
在滴滴出行被國(guó)家網(wǎng)信辦發(fā)布審查通告之后,有網(wǎng)友猜測(cè)原因是滴滴出行將數(shù)據(jù)資料打包給了美國(guó),以此來(lái)獲取上市的資格,要不然該公司用不著低調(diào)上市。不過(guò)從目前的處理結(jié)果來(lái)看,這種情況發(fā)生的可能性很小。
我們從滴滴出行就被網(wǎng)信辦下架一事發(fā)表的回應(yīng)中能夠獲取到以下幾點(diǎn)重要信息:
·暫停新用戶注冊(cè);
·嚴(yán)格按照有關(guān)部門的要求下架整改;
·已下載滴滴App的用戶可正常使用;
·乘客的出行和司機(jī)師傅的接單不受影響。
倘若滴滴出行真的做了向美國(guó)打包送數(shù)據(jù)的行為,那么處罰想必不會(huì)只是暫停和下架這么簡(jiǎn)單。 對(duì)此,滴滴出行也進(jìn)行了回應(yīng),呼吁網(wǎng)友不信謠,不傳謠!
那么,滴滴出行會(huì)有敏感信息威脅到國(guó)家信息安全嗎?實(shí)際上,在滴滴出行的數(shù)據(jù)信息中,不僅僅是用戶數(shù)據(jù),還有道路信息、建筑物信息等等,牽扯甚廣。能源、電力、通信、交通等領(lǐng)域的關(guān)鍵信息基礎(chǔ)設(shè)施是經(jīng)濟(jì)社會(huì)運(yùn)行的神經(jīng)中樞,是網(wǎng)絡(luò)安全的重中之重,也是可能遭到重點(diǎn)攻擊的目標(biāo)。
回到“嚴(yán)重違法違規(guī)收集使用個(gè)人信息問題”這一點(diǎn),對(duì)用戶有多重風(fēng)險(xiǎn)。首先,平臺(tái)能夠利用敏感信息進(jìn)行大數(shù)據(jù)“殺熟”;其次,敏感信息一旦泄露將會(huì)因?yàn)樵p騙等原因侵害個(gè)人財(cái)產(chǎn)安全;第三,敏感信息泄露容易造成用戶思想被裹挾,甚至被大規(guī)模操縱。
大數(shù)據(jù)造富捷徑的誘惑
當(dāng)然,如果大家關(guān)注網(wǎng)信辦的官網(wǎng)信息,大概就能理解,也許滴滴出行頭天上市,隔天被查只是一個(gè)巧合,整治網(wǎng)絡(luò)信息環(huán)境的大刀早就在揮舞,只是恰巧這個(gè)時(shí)間點(diǎn)上落在了滴滴出行的脖子上。
我們看到,緊隨滴滴出行App下架事件之后,7月5日國(guó)家網(wǎng)信辦再次出手,宣布對(duì)“運(yùn)滿滿”、“貨車幫”以及“BOSS直聘”實(shí)施網(wǎng)絡(luò)安全審查,并叫停了相關(guān)平臺(tái)的新用戶注冊(cè)。
在此之前,網(wǎng)信辦在6月11日發(fā)布消息,“關(guān)于Keep等129款A(yù)pp違法違規(guī)收集使用個(gè)人信息情況的通報(bào)”中提到,對(duì)運(yùn)動(dòng)健身、新聞資訊、網(wǎng)絡(luò)直播、應(yīng)用商店、女性健康等常見類型公眾大量使用的部分App的個(gè)人信息收集使用情況進(jìn)行了檢測(cè),包括Keep和小米運(yùn)動(dòng)在內(nèi)的109款A(yù)pp都存在App非法獲取、超范圍收集、過(guò)度索權(quán)等侵害個(gè)人信息的現(xiàn)象。
滴滴、美團(tuán)、Keep、小米……在過(guò)往的處罰名單上,很多公司都是叫的上名號(hào)的響當(dāng)當(dāng)?shù)拇笃髽I(yè),為什么伸出來(lái)的非法獲取用戶的手遲遲不肯收回呢?原因其實(shí)很簡(jiǎn)單,數(shù)據(jù)是互聯(lián)網(wǎng)公司的命根兒。
在很早之前,我們就開始講大數(shù)據(jù)殺熟。
電商、外賣、旅游等各種類型的網(wǎng)絡(luò)平臺(tái),老用戶都能夠感受到深深的惡意。信息閉塞的年代,賺錢的方式更多是欺生,50元商品報(bào)出1000元價(jià)格就是因?yàn)樯碳铱茨忝嫔?,一錘子買賣當(dāng)然要利益最大化。
互聯(lián)網(wǎng)的崛起讓商品信息開始變得公開透明,淘寶、拼多多等購(gòu)物平臺(tái)讓大部分商品的價(jià)格一低再低,有的商品價(jià)格已經(jīng)低到讓我們懷疑其質(zhì)量絕對(duì)有問題的地步。
但互聯(lián)網(wǎng)公司也是要賺錢的,不能一味靠著補(bǔ)貼新用戶的方式生存,如果遲遲不能夠扭虧為盈,那么平臺(tái)背后投資人的耐心也將被磨滅。于是,在各大平臺(tái)一點(diǎn)點(diǎn)摸索到用戶的底線之后,開始了大數(shù)據(jù)“殺熟”,也就是同樣的商品或服務(wù),老客戶看到的價(jià)格反而比新客戶要貴出許多。
近幾年,大數(shù)據(jù)“殺熟”頻現(xiàn)報(bào)端但屢禁不止,似乎已經(jīng)成為互聯(lián)網(wǎng)企業(yè)造富的捷徑。即便媒體和監(jiān)管機(jī)構(gòu)在盯著這一塊,但巨大的利潤(rùn)誘惑讓平臺(tái)決定鋌而走險(xiǎn)。
2021年1月,新華社發(fā)布《中消協(xié):“大數(shù)據(jù)殺熟”如何影響消費(fèi)者權(quán)益?》指出,網(wǎng)絡(luò)消費(fèi)領(lǐng)域算法應(yīng)用中存在的一些問題,其結(jié)果直接或間接影響著消費(fèi)者的消費(fèi)決策和消費(fèi)行為,消費(fèi)者應(yīng)提高警惕。
然而,新華社的報(bào)道并沒有對(duì)各大平臺(tái)起到警醒作用,在今年的“3·15”當(dāng)天,一些互聯(lián)網(wǎng)平臺(tái)被記者實(shí)測(cè)曝出依然普遍存在不同程度的“殺熟”行為,涉及出行、餐飲等多個(gè)生活領(lǐng)域。
利用大數(shù)據(jù)賺錢是各大平臺(tái)不愿意放棄的一條財(cái)路。就以大數(shù)據(jù)“殺熟”為例,雖然監(jiān)管在升級(jí),但憑借數(shù)據(jù)規(guī)模不斷壯大,以及算法逐年優(yōu)化,目前我們已經(jīng)很難從平臺(tái)表面去感受大數(shù)據(jù)“殺熟”的存在,“千人千面”的數(shù)據(jù)引擎在個(gè)性化推送下完成了更為精準(zhǔn)的“殺熟”。因此,相關(guān)法律專家也提出,現(xiàn)在大數(shù)據(jù)“殺熟”具有隱蔽性,維權(quán)往往難以舉證。
數(shù)據(jù)庫(kù)引擎養(yǎng)“惡龍”的玩法
實(shí)際上,過(guò)往種種大數(shù)據(jù)“殺熟”屢禁不止,都是互聯(lián)網(wǎng)背后的數(shù)據(jù)玩法引起的“禍端”,在當(dāng)前的互聯(lián)網(wǎng)體系下,數(shù)據(jù)就是其運(yùn)轉(zhuǎn)的血液。
我們總喜歡講,屠龍少年終成惡龍。時(shí)下,我們看到的這些改變傳統(tǒng)行業(yè)的互聯(lián)網(wǎng)平臺(tái),實(shí)際上背后都是數(shù)據(jù)庫(kù)引擎在推動(dòng),用大數(shù)據(jù)+智能推薦的方式,廢除了傳統(tǒng)渠道分銷,信息不對(duì)稱交易,以及緣分交易等模式。個(gè)性化的服務(wù)方式讓用戶在大多數(shù)情況下都能夠感覺到方便,但也讓價(jià)格差異更難被感受到。
數(shù)據(jù)庫(kù)引擎是用于存儲(chǔ)、處理和保護(hù)數(shù)據(jù)的核心服務(wù)。利用數(shù)據(jù)庫(kù)引擎可控制訪問權(quán)限并快速處理事務(wù),從而滿足企業(yè)內(nèi)大多數(shù)需要處理大量數(shù)據(jù)的應(yīng)用程序的要求。數(shù)據(jù)庫(kù)引擎被認(rèn)為是數(shù)據(jù)庫(kù)的發(fā)動(dòng)機(jī),當(dāng)應(yīng)用或者程序人員需要訪問數(shù)據(jù)庫(kù)時(shí),并不是直接讀寫數(shù)據(jù)庫(kù)文件,而是通過(guò)數(shù)據(jù)庫(kù)引擎去訪問數(shù)據(jù)庫(kù)文件。
在不斷地演變過(guò)程中,數(shù)據(jù)庫(kù)引擎已經(jīng)逐漸成為一種智能化的推薦機(jī)制,也就是現(xiàn)在大家提到的智能推薦引擎。這是目前各大互聯(lián)網(wǎng)平臺(tái)做到“千人千面”推薦的核心所在。目前,我們能夠看到基于各種算法的推薦引擎,包括基于ruby/redis的推薦引擎,基于PostgreSQL的推薦引擎,基于Python的推薦引擎等等。
為什么企業(yè)要費(fèi)心費(fèi)力地冒著各種風(fēng)險(xiǎn)收集用戶數(shù)據(jù)呢?答案就在推薦引擎工作原理上。
推薦引擎是一個(gè)經(jīng)過(guò)訓(xùn)練的算法模型,而商品信息、服務(wù)信息以及用戶信息等就是其訓(xùn)練的數(shù)據(jù)源,大致包含以下幾個(gè)類型:
·物品或內(nèi)容的元數(shù)據(jù),主要是名稱、關(guān)鍵詞和描述信息等。
·用戶的基本信息,主要是姓名、性別、年齡和地區(qū)等。
·用戶的行為信息,包括瀏覽、出行、點(diǎn)擊、購(gòu)買、搜索、評(píng)價(jià)等。
對(duì)于推薦系統(tǒng)而言,能夠獲取到的用戶信息數(shù)據(jù)量越大,那么其推薦的精準(zhǔn)度就越高。同時(shí),用戶信息維度越多,推薦信息的玩法也就越多,包括基于大眾行為的推薦方式、基于人口統(tǒng)計(jì)學(xué)的推薦方式、基于用戶協(xié)同過(guò)濾的推薦方式和個(gè)性化推薦方式等多種推薦機(jī)制。而他們存在的根本就是用戶大數(shù)據(jù)。
因此,當(dāng)前各大互聯(lián)網(wǎng)公司都有一項(xiàng)非常明確的競(jìng)爭(zhēng)力參數(shù)指標(biāo),那就是活躍用戶數(shù)。我們上面提到了滴滴出行在中國(guó)2020年活躍用戶數(shù)為3.77億;微博2020年12月份的月活數(shù)就達(dá)到了5.21億;京東2020年的活躍用戶也超過(guò)5億……翻看各大平臺(tái)的財(cái)務(wù)報(bào)告,活躍用戶數(shù)都會(huì)講出來(lái),因?yàn)檫@是核心競(jìng)爭(zhēng)力之一。
而再結(jié)合上面提到的推薦機(jī)制來(lái)看,平臺(tái)想要讓用戶活躍就需要了解用戶,而了解用戶就需要更多的用戶信息,短期內(nèi)這是一個(gè)死循壞。
數(shù)據(jù)庫(kù)玩法還帶來(lái)了另一個(gè)隱患,那就是信息安全。商品信息、內(nèi)容信息、服務(wù)信息、出行信息以及用戶信息都需要經(jīng)過(guò)處理才能夠成為有效的數(shù)據(jù)資源。我們都知道處理數(shù)據(jù)的是服務(wù)器里面的處理器配合內(nèi)存,被處理的數(shù)據(jù)按照系統(tǒng)規(guī)定的熱度值儲(chǔ)存起來(lái),熱度較高的會(huì)存儲(chǔ)在SSD(固態(tài)硬盤)中,熱度較低的會(huì)存儲(chǔ)在HDD(機(jī)械硬盤)中。而這些數(shù)據(jù)都匯聚在數(shù)據(jù)中心中。
那么數(shù)據(jù)中心就是一塊金光閃閃的靶子,不法分子會(huì)想盡各種手段侵蝕它。我們?cè)谶^(guò)往案例中已經(jīng)看到過(guò)領(lǐng)英數(shù)據(jù)泄露提到的數(shù)據(jù)抓取;A站數(shù)據(jù)泄露時(shí)遭受的黑客攻擊;攜程數(shù)據(jù)泄露中的支付漏洞;以及華住旗下酒店用戶約1.3億人的個(gè)人信息及開房記錄在暗網(wǎng)被售賣。案例在增加,不法分子的手段也在增加。因而,企業(yè)將如此大量的信息匯總在一起,也需要高額的成本去保護(hù),這就像一顆定時(shí)炸彈,指不定什么時(shí)間就爆炸了。
關(guān)于信息安全問題,筆者采訪了上海煜日信息科技有限公司CTO王骕,他表示:“信息安全首先是要強(qiáng)調(diào)權(quán)限的管理,很多時(shí)候人往往是安全攻防最薄弱的環(huán)節(jié)?!?/p>
他也給那些擁有大數(shù)據(jù)的公司以忠告:“信息安全是一個(gè)時(shí)刻不能疏忽的問題。平臺(tái)如果從代碼開發(fā)、內(nèi)容輸出等角度形成自己的安全體系,將單一的技術(shù)問題變成與平臺(tái)運(yùn)作息息相關(guān)的架構(gòu),會(huì)提升自己應(yīng)對(duì)信息泄露的能力?!?/p>
最后
這個(gè)時(shí)代,數(shù)據(jù)是新的“石油”。在過(guò)往的世界發(fā)展中,有太多的戰(zhàn)爭(zhēng)因?yàn)槭蜖?zhēng)奪而打響,上一個(gè)時(shí)代,誰(shuí)掌握了石油,誰(shuí)就站在了國(guó)與國(guó)競(jìng)爭(zhēng)的制高點(diǎn)。今天,信息數(shù)據(jù)已經(jīng)在公司競(jìng)爭(zhēng)中展現(xiàn)出,掌握大數(shù)據(jù)就能夠所向披靡。對(duì)于互聯(lián)網(wǎng)公司而言,要成為行業(yè)龍頭,就要掌握比對(duì)手更多更精的數(shù)據(jù)。
面對(duì)競(jìng)爭(zhēng)的壓力和利潤(rùn)的誘惑,單靠企業(yè)以及運(yùn)營(yíng)人員的自制力是行不通,沒有嚴(yán)苛適用的法律法規(guī)套在脖子上,每一個(gè)互聯(lián)網(wǎng)公司都會(huì)有脫韁的風(fēng)險(xiǎn)。