在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蘋果的差分隱私技術(shù)原理詳解

OSC開源社區(qū) ? 來源:OSCHINA 社區(qū) ? 2023-07-19 10:17 ? 次閱讀

來源| OSCHINA 社區(qū)

作者 |PrimiHub開源

原文鏈接:https://my.oschina.net/u/6662337/blog/10087905

在 2016 年 6 月份的蘋果 WWDC 大會(huì)上提到了一項(xiàng)差分隱私技術(shù)(Differential Privacy),其作用是對(duì)用戶的數(shù)據(jù)進(jìn)行擾動(dòng),然后上傳到蘋果服務(wù)器。蘋果能通過這些擾動(dòng)過的數(shù)據(jù)計(jì)算出用戶群體的行為模式,但是對(duì)每個(gè)用戶個(gè)體的數(shù)據(jù)卻無法解析。

蘋果通過采用差分隱私技術(shù),實(shí)現(xiàn)了在不得到用戶原始數(shù)據(jù)的前提下,學(xué)習(xí)用戶行為。如果你想知道 “數(shù)據(jù)可用不可見” 背后的技術(shù),就跟著我們一起來學(xué)習(xí)下蘋果的差分隱私技術(shù)背后的原理吧!

一、簡(jiǎn)介

差分隱私是一種數(shù)據(jù)隱私保護(hù)技術(shù),它通過在數(shù)據(jù)中引入隨機(jī)化擾動(dòng)的手段來保護(hù)隱私。簡(jiǎn)單來說,擾動(dòng)后的數(shù)據(jù)是無法精確地推斷出其原始值。同時(shí),它允許對(duì)隨機(jī)化后數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,保證了數(shù)據(jù)的有用性。差分隱私提供了衡量隱私的嚴(yán)格數(shù)學(xué)定義,是近些年來業(yè)界常見的一種隱私保護(hù)技術(shù)。

1.1 差分隱私應(yīng)用場(chǎng)景

蘋果使用本地化差分隱私(Local Differential Privacy)技術(shù)來收集用戶設(shè)備上的信息,其部署的產(chǎn)品見下表 [1, 2]。

QuickType suggestions 學(xué)習(xí)熱門新詞匯,用于鍵盤打字預(yù)測(cè)
Emoji suggestions(Emoji 預(yù)測(cè)) 學(xué)習(xí)流行表情包趨勢(shì),預(yù)測(cè)用戶使用的表情包
Lookup Hints(搜索提示) iOS 搜索框提示
Safari Energy Draining Domains & Crashing Domains 統(tǒng)計(jì)電量消耗大(高 CPU、高內(nèi)存使用)的網(wǎng)站、易崩潰的網(wǎng)站
Safari Autoplay Intent Detection 統(tǒng)計(jì)用戶傾向于自動(dòng)播放且不靜音的網(wǎng)站
Health Type Usage 流行的健康數(shù)據(jù)類型(睡眠、心率、卡路里等)統(tǒng)計(jì)
產(chǎn)品名稱 用途

1.2 本地化差分隱私

在本地化差分隱私框架中,用戶在上傳的原始數(shù)據(jù)中添加噪聲(擾動(dòng)),服務(wù)器則無法知道用戶的真實(shí)數(shù)據(jù)。這項(xiàng)技術(shù)最早是由 Warner 提出的隨機(jī)響應(yīng)(Randomized response)[3]。

4a6335d4-2556-11ee-962d-dac502259ad0.png

本地化差分隱私技術(shù)可用于聯(lián)合統(tǒng)計(jì),比如計(jì)算平均數(shù)、中位數(shù)、頻率直方圖等。其算法框架(E-R-A-P)一般分為四個(gè)步驟:

編碼(Encoding,E)

隨機(jī)化(Randomizing,R)

聚合(Aggregation,A)

后處理(Post-processing,P)

用戶端進(jìn)行編碼與隨機(jī)化,保證傳輸?shù)臄?shù)據(jù)是擾動(dòng)后的;服務(wù)器端進(jìn)行聚合與后處理,得到相應(yīng)的統(tǒng)計(jì)量。

4a8d774a-2556-11ee-962d-dac502259ad0.png

二、蘋果的方案

蘋果的本地化差分隱私方案參見 [2, 4, 5],其中 [4, 5] 是專利。這里介紹 [2] 中方案的簡(jiǎn)易版本,以統(tǒng)計(jì)表情包的頻率直方圖為例。

4ab4a504-2556-11ee-962d-dac502259ad0.png

2.1 用戶端

依照上面提到的 算法框架(E-R-A-P),用戶端需要在上傳數(shù)據(jù)之前對(duì)做原始數(shù)據(jù)做編碼 (E)和隨機(jī)化 (R)。 編碼 (E):編碼是為了后續(xù)的隨機(jī)化和聚合步驟。蘋果的編碼采用哈希表的方式,初始表中的元素均為 “-1”。然后通過哈希函數(shù)hh將元素dd(使用頻率最高的表情包)映射到位置h(d)h(d),并標(biāo)記 “1”。假設(shè)哈希表的長(zhǎng)度為mm(聚合時(shí)會(huì)用到該參數(shù))。

4ade1c9a-2556-11ee-962d-dac502259ad0.png

2.2 服務(wù)器端

依照上面提到的 算法框架(E-R-A-P),服務(wù)器端需要在接收到數(shù)據(jù)后對(duì)做 “擾動(dòng)” 后的數(shù)據(jù)做聚合 (A)和后處理 (P)。

4afbcb14-2556-11ee-962d-dac502259ad0.png

后處理 (P):在不同應(yīng)用場(chǎng)景中,計(jì)算的統(tǒng)計(jì)量可能有先驗(yàn)知識(shí),比如取值范圍的限制(如大于 0),或者保持加和不變(如統(tǒng)計(jì)個(gè)數(shù)),這時(shí)就需要進(jìn)行后處理操作。差分隱私的性質(zhì)使得任何后處理操作均不影響其結(jié)果的隱私性。

2.3 其他技術(shù)

數(shù)據(jù)隱私保護(hù)需要考慮的方面很多,僅使用差分隱私技術(shù)無法解決所有的問題。蘋果在方案中還使用了其他技術(shù)來保護(hù)數(shù)據(jù)隱私,例如數(shù)據(jù)脫敏、通信加密、訪問控制等。

用戶上傳的數(shù)據(jù)已移除設(shè)備標(biāo)識(shí)符、時(shí)間戳等信息

用戶與服務(wù)器通信使用 TLS 協(xié)議,即數(shù)據(jù)加密傳輸

服務(wù)器收到用戶數(shù)據(jù)后首先移除 IP、地址、時(shí)間戳等 meta 信息,并將數(shù)據(jù)順序打亂(shuffle)

數(shù)據(jù)聚合在受限訪問環(huán)境中執(zhí)行

數(shù)據(jù)只在蘋果內(nèi)部流通,且蘋果的員工不能隨意訪問數(shù)據(jù)

2.4 隱私預(yù)算

看到這里大家應(yīng)該明白了,差分隱私是通過在增加噪聲(擾動(dòng))來實(shí)現(xiàn)隱私保護(hù),但由于擾動(dòng)增加,聚合的結(jié)果會(huì)變得不精確(統(tǒng)計(jì)量的方差增大)。所以下面介紹平衡算法的隱私性和實(shí)用性的隱私預(yù)算??。

4b2a40de-2556-11ee-962d-dac502259ad0.png4b4a0554-2556-11ee-962d-dac502259ad0.png

而且,雖然數(shù)據(jù)添加了差分隱私擾動(dòng),但同一用戶會(huì)不斷地上傳新數(shù)據(jù),根據(jù)差分隱私的串型組合定理,隱私預(yù)算??會(huì)隨著時(shí)間累積逐步增加。因此,蘋果限制了用戶每天上傳數(shù)據(jù)的最大次數(shù),并表示數(shù)據(jù)最多只會(huì)留存三個(gè)月。

QuickType suggestions 8 2
Emoji suggestions(Emoji 預(yù)測(cè)) 4 1
Lookup Hints(搜索提示) 4 2
Safari Energy Draining Domains & Crashing Domains 4 2
Safari Autoplay Intent Detection 8 2
Health Type Usage 2 1
產(chǎn)品名稱 隱私預(yù)算??的取值 數(shù)據(jù)最多上傳次數(shù) / 每天

有研究 [6] 指出,蘋果應(yīng)該解釋是如何設(shè)置隱私預(yù)算??的取值的,告知用戶并將其透明化。例如,雖然 Emoji 產(chǎn)品中宣稱的隱私預(yù)算??取值為 1,但通過代碼逆向工程后發(fā)現(xiàn)其取值為 2(iOS 10.1.1 和 MacOS 10.12.3 版本的數(shù)據(jù))。而且,隱私預(yù)算隨時(shí)間累積也是其方案存在的一個(gè)重要問題。

三、方案優(yōu)化

第 2 節(jié)中描述的是方案的簡(jiǎn)易版,而蘋果的方案針對(duì)通信、統(tǒng)計(jì)量的精確性、場(chǎng)景適配等均做了優(yōu)化 [2] 如下:

為了減少哈希碰撞的影響,實(shí)際有kk個(gè)哈希函數(shù),每個(gè)用戶在編碼時(shí)隨機(jī)選擇一個(gè),并將選擇的哈希函數(shù)告訴服務(wù)器。服務(wù)器則構(gòu)建kk個(gè)哈希表,然后進(jìn)行聚合計(jì)算。

為了降低通信量,蘋果的方案中對(duì)編碼后的數(shù)據(jù)進(jìn)行了阿達(dá)馬變換(Hadamard transform),并通過采樣的方式,隨機(jī)選擇 1 比特的數(shù)據(jù)發(fā)送到服務(wù)器。這樣不僅可以降低通信量,而且不會(huì)增加統(tǒng)計(jì)值的方差。

表情包的數(shù)據(jù)一般是固定的,但在一些場(chǎng)景下,用戶數(shù)據(jù)是無法預(yù)知的。比如學(xué)習(xí)熱門新詞匯,統(tǒng)計(jì)網(wǎng)站。蘋果對(duì)此采用了 Sequence Fragment Puzzle 技術(shù),并設(shè)計(jì)了本地化差分隱私的方案。

四、無偏估計(jì)證明

這里依舊是按照 算法框架(E-R-A-P)順序進(jìn)行講解,證明f~(d)f~(d)是f(d)f(d)的無偏估計(jì)。

4b75068c-2556-11ee-962d-dac502259ad0.png

4.1 編碼

4b945f3c-2556-11ee-962d-dac502259ad0.png

4.2 隨機(jī)化

4bbdcaca-2556-11ee-962d-dac502259ad0.png

4.3 聚合

4beaee92-2556-11ee-962d-dac502259ad0.png4c0a3ad6-2556-11ee-962d-dac502259ad0.png

統(tǒng)計(jì)量的方差小才意味著估計(jì)的精確性高。 以上通過公式推導(dǎo)的方式證明了蘋果采用的「差分隱私」算法的準(zhǔn)確性,可以實(shí)現(xiàn)在 “數(shù)據(jù)可用不可見” 的情況下實(shí)現(xiàn)統(tǒng)計(jì)計(jì)算。

五、最后

看似 “高不可攀” 的差分隱私技術(shù),其實(shí)早已走進(jìn)了我們的日常生活和工作中,為我們的個(gè)人隱私保駕護(hù)航。 本文通過通俗易懂的圖文和嚴(yán)謹(jǐn)?shù)墓酵茖?dǎo),講解了蘋果的差分隱私技術(shù)原理,希望能夠勾起你對(duì)隱私計(jì)算技術(shù)的興趣。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3643

    瀏覽量

    134519
  • 蘋果手機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    2245

    瀏覽量

    34233

原文標(biāo)題:一文讀懂蘋果的差分隱私技術(shù)原理

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    匹配技術(shù)對(duì)比

    本帖最后由 gk320830 于 2015-3-9 05:42 編輯 匹配技術(shù)對(duì)比,匹配
    發(fā)表于 08-11 22:00

    基于隱私的軌跡模式挖掘算法

    針對(duì)現(xiàn)有基于隱私的頻繁軌跡模式挖掘算法全局敏感度過高、挖掘結(jié)果可用性較低的問題,提出一種基于前綴序列格和軌跡截?cái)嗟?b class='flag-5'>差
    發(fā)表于 11-25 11:38 ?0次下載
    基于<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b>的軌跡模式挖掘算法

    隱私和現(xiàn)有的隱私保護(hù)方法相結(jié)合:從用戶群體中學(xué)習(xí)的系統(tǒng)架構(gòu)詳解

    研究人員設(shè)計(jì)了高效可擴(kuò)展的本地化隱私算法,經(jīng)過嚴(yán)謹(jǐn)?shù)姆治龃_定了應(yīng)用程序、隱私、服務(wù)器計(jì)算能力和設(shè)備帶寬四個(gè)要素的重要性應(yīng)如何分配。平衡這些因素將有助于成功地部署本地
    的頭像 發(fā)表于 12-08 17:31 ?1.6w次閱讀

    基于隱私的數(shù)據(jù)匿名化隱私保護(hù)模型

    在保護(hù)數(shù)據(jù)隱私的匿名技術(shù)中,為解決匿名安全性不足的問題,即匿名過程中因計(jì)算等價(jià)類質(zhì)心遭受同質(zhì)性和背景知識(shí)攻擊造成的隱私泄漏,提出了一種基于
    發(fā)表于 12-11 16:31 ?0次下載
    基于<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b>的數(shù)據(jù)匿名化<b class='flag-5'>隱私</b>保護(hù)模型

    本地化隱私研究綜述

    大數(shù)據(jù)時(shí)代信息技術(shù)不斷發(fā)展,個(gè)人信息的隱私問題越來越受到關(guān)注,如何在數(shù)據(jù)發(fā)布和分析的同時(shí)保證其中的個(gè)人敏感信息不被泄露是當(dāng)前面臨的重大挑戰(zhàn),中心化
    發(fā)表于 12-15 16:07 ?0次下載
    本地化<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b>研究綜述

    線性查詢的一種近似最優(yōu)隱私機(jī)制

    隱私保護(hù)程度確定的條件下使數(shù)據(jù)的有用性最大化的問題,稱為隱私的最優(yōu)機(jī)制問題.最優(yōu)機(jī)制問
    發(fā)表于 12-26 14:10 ?0次下載

    單端怎么轉(zhuǎn)分信號(hào)_單端轉(zhuǎn)分信號(hào)電路詳解

    本文為大家介紹單端-轉(zhuǎn)換器的電路詳解。
    發(fā)表于 01-15 10:31 ?7.5w次閱讀
    單端怎么轉(zhuǎn)<b class='flag-5'>差</b>分信號(hào)_單端轉(zhuǎn)<b class='flag-5'>差</b>分信號(hào)電路<b class='flag-5'>詳解</b>

    一種軌跡隱私發(fā)布方法

    針對(duì)現(xiàn)有軌跡隱私保護(hù)發(fā)布方法面臨的獨(dú)立噪聲容易被濾除的問題,提出一種軌跡隱私發(fā)布方法-C
    發(fā)表于 01-17 14:11 ?0次下載
    一種軌跡<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b>發(fā)布方法

    面向隨機(jī)森林的隱私保護(hù)算法

    提出一種基于隨機(jī)森林的隱私保護(hù)算法DiffPRFs,在每一棵決策樹的構(gòu)建過程中采用指數(shù)機(jī)制選擇分裂點(diǎn)和分裂屬性,并根據(jù)拉普拉斯機(jī)制添加噪聲。在整個(gè)算法過程中滿足
    發(fā)表于 02-08 17:10 ?3次下載

    如何使用隱私保護(hù)進(jìn)行譜聚類算法

    針對(duì)傳統(tǒng)的聚類算法存在隱私泄露的風(fēng)險(xiǎn),提出一種基于隱私保護(hù)的譜聚類算法。該算法基于
    發(fā)表于 12-14 10:54 ?11次下載
    如何使用<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b>保護(hù)進(jìn)行譜聚類算法

    利用k-prototype聚類的隱私混合數(shù)據(jù)發(fā)布算法

    隱私是一種提供強(qiáng)大隱私保護(hù)的模型。在非交互弌框架下,數(shù)據(jù)管理者可發(fā)布采用
    發(fā)表于 03-31 16:09 ?4次下載
    利用k-prototype聚類的<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b>混合數(shù)據(jù)發(fā)布算法

    一種支持本地化隱私技術(shù)的聚類方案

    如何在保護(hù)數(shù)據(jù)隱私的同時(shí)進(jìn)行可用性的數(shù)據(jù)挖掘已成為熱點(diǎn)問題。鑒于在很多實(shí)際應(yīng)用場(chǎng)景中,很難找到一個(gè)真正可信的第三方對(duì)用戶的敏感數(shù)據(jù)進(jìn)行處理,文中首次提出了一種支持本地化隱私
    發(fā)表于 04-13 15:17 ?6次下載
    一種支持本地化<b class='flag-5'>差</b><b class='flag-5'>分</b><b class='flag-5'>隱私</b><b class='flag-5'>技術(shù)</b>的聚類方案

    基于ExtraTrees的隱私保護(hù)算法DiffPETs

    為在同等隱私保護(hù)級(jí)別下提高模型的預(yù)測(cè)準(zhǔn)確率并降低誤差,提出一種基于 Extratrees的隱私保護(hù)算法 Differs。在決策樹生成過程中,根據(jù)不同的準(zhǔn)則計(jì)算出各特征的結(jié)果值,利用
    發(fā)表于 05-11 14:42 ?10次下載

    面向分?jǐn)?shù)據(jù)挖掘隱私保護(hù)的隨機(jī)森林算法

    數(shù)據(jù)挖掘中的隱私保護(hù)問題是目前信息安全領(lǐng)域的研究熱點(diǎn)之一。針對(duì)隱私保護(hù)要求下的分類問題,提出一種面向隱私保護(hù)的隨機(jī)森林算法 REDPP-
    發(fā)表于 05-12 14:14 ?1次下載

    面向數(shù)據(jù)流頻繁模式的隱私保護(hù)方案

    面向數(shù)據(jù)流頻繁模式的隱私保護(hù)方案
    發(fā)表于 06-01 15:28 ?1次下載
    主站蜘蛛池模板: 黄色福利小视频| 一区二区三区无码高清视频| 美女被免费网站视频在线| 全免费午夜一级毛片真人| 国内精品网站| 免费视频网站在线看视频| 又粗又长又大真舒服好爽漫画| 网女色| 精品新一区二区三区四区| 国产精品视频你懂的| 真实子伦视频不卡| 人人插人人草| 精品二区| 视频免费黄色| 亚洲精品久久片久久| 成人理论片| 人人插人人爱| 日日干日日爽| 在线亚洲色图| 日韩毛片网| 天天影视网天天影网| 国产精品久线观看视频| 婷婷在线网站| 免费一级大毛片a一观看不卡| 97av在线播放| 成人啪啪免费视频| 人人看人人添人人爽| 日日干夜夜爽| 亚洲免费成人网| www.久久综合| 福利视频免费观看| 四大名著成人高h肉版| 午夜痒痒网| h在线免费视频| 亚洲国产成人精品不卡青青草原| 欧美性爽xxxⅹbbbb| 国产卡一卡2卡三卡免费视频| 欧美又粗又长又湿又黄的视频| 国产精品久久久久国产精品三级 | 色综合亚洲天天综合网站| a成人|