久久精品99久久|国产剧情网站91|天天色天天干超碰|婷婷五天月一av|亚州特黄一级片|亚欧超清无码在线|欧美乱码一区二区|男女拍拍免费视频|加勒比亚无码人妻|婷婷五月自拍偷拍

經(jīng)濟畢業(yè)論文

分析隱私保護的經(jīng)濟統(tǒng)計信息發(fā)布論文

時間:2023-03-21 14:42:30 經(jīng)濟畢業(yè)論文 我要投稿
  • 相關推薦

分析隱私保護的經(jīng)濟統(tǒng)計信息發(fā)布論文

  1 引 言

分析隱私保護的經(jīng)濟統(tǒng)計信息發(fā)布論文

  21世紀以來,隨著信息技術的進步和互聯(lián)網(wǎng)的廣泛應用,信息共享已成為人們?nèi)粘9ぷ、生活和學習中的普遍行為。政府部門、社會團體和個人的統(tǒng)計信息大量涌現(xiàn),信息數(shù)據(jù)收集的種類和數(shù)量呈指數(shù)級增長。與此同時,國家和有關部門制定了有關信息安全的法規(guī)及相關制度,輿論媒體對統(tǒng)計數(shù)據(jù)的關注度和要求也越來越高,但有關國民經(jīng)濟的各種統(tǒng)計數(shù)據(jù)因存在虛假和泄露隱私受到質(zhì)疑的情況卻時有發(fā)生。大量的隱私數(shù)據(jù)發(fā)布和共享已經(jīng)對隱私和信息安全構(gòu)成威脅,隱私數(shù)據(jù)的泄露已成為急待解決的問題[1]。如何保證隱私數(shù)據(jù)在發(fā)布或使用時不被對應到特定人和特定部門已成為一個研究熱點。

  統(tǒng)計信息通過分析統(tǒng)計數(shù)據(jù)得到,統(tǒng)計數(shù)據(jù)按屬性可分為4類:① 能直接識別個體身份信息的顯式標志符(EiD),如身份證號、姓名、社會保險代碼等;② 有助識別個體信息身份的準標志符(QID),如一些組合屬性;③ 敏感屬性(SA),即隱私信息;④ 非敏感屬性(NSA),即非上述3類的其他屬性。本文所述的隱私保護主要是指對統(tǒng)計數(shù)據(jù)中個人敏感信息的安全保護,是防止不法分子對個人敏感信息非法竊取的私有信息保護[2]。隱私攻擊者除了能訪問發(fā)布的統(tǒng)計數(shù)據(jù)表外,還可能通過文獻資料、技術文檔等獲得發(fā)布的統(tǒng)計數(shù)據(jù)表中所采用的隱私模型和實現(xiàn)算法等。我們假定攻擊者可能獲得的數(shù)據(jù)信息統(tǒng)稱為背景知識。通常攻擊者都是從背景知識中獲得目標對象的QID屬性(如出生日期、性別、出生地、郵政編碼等)。

  用戶對經(jīng)濟統(tǒng)計數(shù)據(jù)的第一要求是查詢結(jié)果必須準確。從這個前提出發(fā),本文提出一種基于交互的序列表發(fā)布模型,它能保證敏感信息不泄露,同時又能最大程度地減少統(tǒng)計數(shù)據(jù)的信息損失,提高統(tǒng)計數(shù)據(jù)的效用。實驗結(jié)果表明,該模型對于大數(shù)據(jù)集的隱私能很好地進行保護,而且丟失的重要信息少,能夠滿足統(tǒng)計數(shù)據(jù)發(fā)布的需要。

  2 隱私保護模型

  為了解決隱私保護問題,國內(nèi)外研究者提出了很多方法,這些方法主要有:① 匿名保護。為了保護個人信息,在數(shù)據(jù)發(fā)布時,對能夠直接標識個人身份的標識符進行刪除或加密。② 擾亂、隨機化數(shù)據(jù)技術。通過對數(shù)據(jù)的隨機化處理,增加數(shù)據(jù)“噪聲”,使得數(shù)據(jù)不再反映真實的世界,從而無法被濫用而侵犯個人隱私。當然,關鍵的技術是要從處理后的數(shù)據(jù)中獲得有效的分析結(jié)果。③ 分布式的隱私保護技術。雙方或多方進行數(shù)據(jù)分析挖掘時,由于某種原因,參與者不愿將數(shù)據(jù)與他人共享而只愿共享數(shù)據(jù)分析挖掘結(jié)果。這需要運用密碼學技術來解決實際的隱私問題。如安全兩方或多方計算問題等。④ k-匿名技術。它要求在公布后的數(shù)據(jù)中保留一定數(shù)量的個體特征,從而防止匿名處理后的數(shù)據(jù)被鏈接攻擊,造成個人隱私泄露。

  研究者們根據(jù)隱私保護方法建立了很多隱私信息保護發(fā)布模型,如k-匿名模型[3]、L-多樣性模型[4]、t-closness框架[5]和個性化匿名模型[6]等。這些隱私保護模型都是針對可能存在隱私泄露建立的。

  3 基于統(tǒng)計應用的交互序列發(fā)布模型及算法

  3.1 序列發(fā)布模型

  隱私保護模型實際是利用好的數(shù)據(jù)發(fā)布方法來保護隱私,使用最多的算法是泛化或有損連接(降低QID和SA兩者之間的聯(lián)系)[7]。在一些統(tǒng)計分析中,需要進行聯(lián)合查詢,用戶對統(tǒng)計數(shù)據(jù)進行查詢最重要的要求是查詢結(jié)果準確,這樣發(fā)布的數(shù)據(jù)才有較高的應用價值。而匿名化技術將發(fā)布的數(shù)據(jù)表中涉及個體的標志屬性刪除了,因此降低了QID屬性和SA之間的聯(lián)系,無法得到用戶關心的準確查詢結(jié)果。在對應用查詢的實際需求和大量實際數(shù)據(jù)集的QID屬性的統(tǒng)計中發(fā)現(xiàn),應用查詢中所涉及的QID屬性數(shù)目一般只有3個左右,而原始數(shù)據(jù)集中一般都存在大量滿足匿名要求的數(shù)據(jù)記錄,且所占比例跟QID的數(shù)目存在密切的關系。例如一個人口統(tǒng)計的實際數(shù)據(jù)集共有14 種屬性,記錄約4萬條,其中QID的全部組合數(shù)目為9。在k-匿名模型中,當k = 20,QID數(shù)目為3時,其平均滿足k-匿名的記錄比例可高達85%,而QID數(shù)目為全部組合時滿足k-匿名的記錄比例只有5%左右;當k = 2,QID數(shù)目為全部組合時,滿足k-匿名的記錄比例只有40%左右。由此可見,如果將所有的QID屬性捆綁在一起進行匿名,必然會導致大量記錄的QID屬性和SA被割斷。

  本文提出一種基于用戶應用查詢的序列發(fā)布模型,將滿足k-匿名的記錄按照QID數(shù)目由高到低分成一組序列表進行發(fā)布。首先發(fā)布屬性包含了全部QID組合和SA的記錄,然后將QID數(shù)減少一個,發(fā)布屬性包含QID組合和SA的剩余記錄。如此類推,直到最后QID的數(shù)目減少為3,再將這些剩余記錄按照屬性為3個QID和SA泛化發(fā)布,從而提高泛化表的查準率。

【分析隱私保護的經(jīng)濟統(tǒng)計信息發(fā)布論文】相關文章:

關于物聯(lián)網(wǎng)信息安全與隱私保護的研究論文10-06

多元統(tǒng)計分析在經(jīng)濟中的應用論文10-11

信息安全等級保護的分析論文10-09

醫(yī)院經(jīng)濟管理中統(tǒng)計信息的作用論文10-11

經(jīng)濟信息下的宏觀經(jīng)濟管理分析論文10-08

經(jīng)濟管理中信息技術分析論文10-08

實體經(jīng)濟與虛擬經(jīng)濟的分析論文10-09

網(wǎng)絡隱私保護下的電子商務論文10-08

問題導向下的經(jīng)濟統(tǒng)計學教學改革分析論文10-09

區(qū)域經(jīng)濟管理信息化建設分析論文10-12