這兩天,百度網盤的瓜,大家吃了嗎?
有一位可能是入職百度網盤審核崗的網友爆料,百度網盤的照片是人工審核,并且審核人員還能隨意把用戶的照片截下來保存發到網上。

還能這么玩?
那黑馬保存在網盤里的照片,豈不是被看到了?照片都能看到,會不會找黑馬要聯系方式?
正當黑馬胡思亂想的時候,百度網盤發了一條公告:
百度網盤不存在所謂的照片人工審核,網絡上關于百度網盤照片真人審核的內容是謠言。

總而言之,此事完全是子虛烏有。
公告是發了,但黑馬看到一些網友似乎不太相信。
這也難怪,百度網盤信息泄露這事,也不是一回兩回了,但人工審核用戶上傳照片,還是有點駭人聽聞。
那么網盤有沒有必要人工審核照片?
先說大多數情況下,網盤一般不需要人工審核,大家可以想一下,網盤的用戶數量,每天那么多用戶上傳下載和分享文件,如果主要靠人工審核,這工作量實在很大。
當然,文件還是要審核的,有違規的信息,該屏蔽還是要屏蔽,該刪除還是要刪除。
網盤是怎么檢測違規文件的?
大致有這么幾種檢測方式:
最簡單的就是建立一個搜索關鍵詞庫,網羅違規關鍵詞,一旦機器檢測到違規詞,可以立馬屏蔽。
不過這種檢測方式,難免會有漏網之魚。
所以我們就給文件們建立了一個身份檔案庫。
就像是我們每個人的指紋都是我們獨一無二的特征一樣,文件也有自己獨一無二的特征,而這個特征是 MD5,可以簡單理解成一個文件的特有數字信息。

(圖源:百度百科)
通過建立文件的 MD5 數據庫,用戶上傳文件后自動分析文件特征是否存在違規,避免違規的文件重復傳播。
在去年 Meta 公司推出了一個據說開發了 4 年的鑒黃工具,也差不多類似的原理,通過提取照片的數字指紋,將指紋共享到社交平臺上,檢測是否有人分享這些涉黃照片。

不過最初的版本,在搜集照片的數字指紋時,是靠人工審核的,直到去年這個工作才交給 AI 來做。
別擔心,目前的網盤對文件指紋特征的識別一般也是通過 AI 識別的。
對于視頻文件,一般網盤都能自動截取視頻縮略圖,提取圖片中特征元素,根據元素判斷圖像類別并與違規數據庫進行比對判定是否違規。
以上的這些審核,一般來說都是有 AI 進行,在識別審核完成后,系統也會擦除審核過程中所記錄的數據,防止信息泄露。

但是任何機器審核,都無法做到百分百過濾違規信息,勢必需要人工審核。
隨便在各大招聘平臺上搜索,也都能找到互聯網公司招聘的人工審核崗位。
百度網盤需要人工審核,這并不奇怪,但審核的范圍界限在哪里?這就不得而知了。
總而言之,我們上傳的文件,一般情況下,都不會經過人工,AI 足以應對大多數的審核。
至于有沒有特殊情況,那就視情況而定了。
最好的辦法就是敏感的個人信息,盡可能不要上傳到云端上。
還有分享的文件,務必選擇加密方式分享,也就是需要密碼才能獲取文件,如果是選擇沒有密碼的公共分享,分享的文件是可以被網絡爬蟲檢測到的。

總而言之,在這個大數據時代,絕對的安全是沒有的,黑馬覺得如果不是什么太隱私的信息,該怎么保存到網盤還是怎么保存到網盤。
過于擔心隱私問題,反而會失去便利性。
當然,對于網盤運營者來說,用戶的數據安全還是要放在第一位的。
我可以接受 " 小姐姐 " 突然消失,但我的正當合法數據,總不能也消失吧?甚至是曝露在大眾視野中。
原文地址:http://www.myzaker.com/article/62ffa5cd8e9f09336607eccc