云存儲(chǔ)數(shù)據(jù)加密與檢索的探討

云計(jì)算數(shù)據(jù)存儲(chǔ)安全問題是實(shí)用者最期待的事情。通過對數(shù)據(jù)進(jìn)行加密可對單位和個(gè)人的數(shù)據(jù)進(jìn)行有效保護(hù),對加密過的數(shù)據(jù)難以用傳統(tǒng)檢索方法實(shí)現(xiàn)。在分析云存儲(chǔ)過程中的存儲(chǔ)安全技術(shù)的基礎(chǔ)上,根據(jù)常見加密檢索方法和相關(guān)技術(shù),針對加密存儲(chǔ)的要求,結(jié)合自己的探索,可用全同態(tài)加密的檢索方法,在一定程度上能提高檢索效率。

云計(jì)算的主要目標(biāo)是提供高效的計(jì)算服務(wù)

云計(jì)算是并行計(jì)算、分布式計(jì)算和網(wǎng)格計(jì)算的綜合改進(jìn),是通過網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲取所需服務(wù)的在線網(wǎng)絡(luò)服務(wù)交付和使用模式,是分布式計(jì)算的一種方式。云計(jì)算主要目標(biāo)是提供高效的計(jì)算服務(wù)。為解決數(shù)據(jù)的保護(hù)問題,常見的方法是由用戶對數(shù)據(jù)進(jìn)行加密,把加密過的密文信息存放在服務(wù)端。當(dāng)存儲(chǔ)在云端的加密數(shù)據(jù)形成規(guī)模之后,那么對加密數(shù)據(jù)的檢索就成為急需解決的問題。在相關(guān)的加密信息的檢索中,主要有單用戶線性搜索、公鑰搜索、安全索引等幾種方式的算法。

這幾種算法可以快速地檢索出所需信息,但不適用于大規(guī)模數(shù)據(jù)的檢索。在云存儲(chǔ)中,檢索時(shí)相關(guān)的文檔較多,對其進(jìn)行相關(guān)排序是解決問題的所在,這幾種算法均不能解決其問題。全同態(tài)加密提供可以對密文進(jìn)行操作的加密算法。而且通過全同態(tài)加密,一方面可以保證密文信息不被統(tǒng)計(jì)分析,另一方面可以對加密信息進(jìn)行加法和乘法運(yùn)算,同時(shí)保持其對應(yīng)明文的順序。

云存儲(chǔ)應(yīng)用中的加密存儲(chǔ)技術(shù)

云存儲(chǔ)應(yīng)用中,高性能的存儲(chǔ)安全技術(shù),是網(wǎng)絡(luò)環(huán)境下存儲(chǔ)應(yīng)用的根本保證,已成為當(dāng)前網(wǎng)絡(luò)存儲(chǔ)領(lǐng)域的熱點(diǎn)研究對象。云存儲(chǔ)應(yīng)用中的存儲(chǔ)安全包括認(rèn)證服務(wù)、數(shù)據(jù)加密存儲(chǔ)、安全管理、安全日志、審計(jì)等。訪問控制服務(wù)實(shí)現(xiàn)用戶身份認(rèn)證、授權(quán),防止非法訪問和越權(quán)訪問。主要功能包括:用戶只能對管理員或文件所有者授權(quán)的許可文件進(jìn)行被許可的操作;管理員只能進(jìn)行必要的管理操作,如用戶管理、數(shù)據(jù)備份、熱點(diǎn)對象遷移,而不能訪問用戶加密了的個(gè)人數(shù)據(jù)。

安全管理主要功能是用戶信息和權(quán)限的維護(hù)

加密存儲(chǔ)是對指定的目錄和文件進(jìn)行加密后保存,實(shí)現(xiàn)敏感數(shù)據(jù)存儲(chǔ)和傳送過程中的機(jī)密性保護(hù)。安全管理主要功能是用戶信息和權(quán)限的維護(hù),如用戶帳戶注冊和注銷等,授權(quán)用戶、緊急情況下對用戶權(quán)限回收等。安全日志和審計(jì)是記錄用戶和系統(tǒng)與安全相關(guān)的主要活動(dòng)事件,為系統(tǒng)管理員監(jiān)控系統(tǒng)和活動(dòng)用戶提供必要的審計(jì)信息。對用戶來說,在上述各種存儲(chǔ)安全服務(wù)中,存儲(chǔ)加密尤為重要。加密存儲(chǔ)是保證用戶個(gè)人數(shù)據(jù)在共享存儲(chǔ)平臺(tái)上,機(jī)密性是核心技術(shù)。

隨著存儲(chǔ)系統(tǒng)和存儲(chǔ)設(shè)備越來越網(wǎng)絡(luò)化,存儲(chǔ)系統(tǒng)在保證敏感數(shù)據(jù)機(jī)密性的同時(shí),必須提供相應(yīng)的加密數(shù)據(jù)共享技術(shù)。保護(hù)用戶存儲(chǔ)安全是建立在對存儲(chǔ)系統(tǒng)的信任基礎(chǔ)之上的。必須適用于網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)的加密存儲(chǔ)技術(shù),提供端到端加密存儲(chǔ)技術(shù)及密鑰長期存儲(chǔ)和共享機(jī)制,以確保用戶數(shù)據(jù)的保密性,提高密鑰存儲(chǔ)的安全性、分發(fā)的高效性及加密方法的靈活性。在海量的加密信息存儲(chǔ)中,加密檢索是實(shí)現(xiàn)信息共享的主要手段,是加密存儲(chǔ)中必須解決的問題。

加密信息檢索技術(shù)

①線性搜索算法。線性搜索方法是一次一密的加密信息檢索算法,因此有極強(qiáng)的抵抗統(tǒng)計(jì)分析的能力。但其有一個(gè)致命的弱點(diǎn),是逐次匹配密文信息,這種檢索方法在大量數(shù)據(jù)集的情況下難以應(yīng)用。

②關(guān)鍵詞的公鑰搜索算法。關(guān)鍵詞的公鑰搜索其目的是可以在用戶端存儲(chǔ)、計(jì)算資源不足的情況下,通過訪問遠(yuǎn)端數(shù)據(jù)庫獲取數(shù)據(jù)信息。但存儲(chǔ)、計(jì)算資源分布具有不對稱性,即用戶的計(jì)算存儲(chǔ)能力不能滿足其需求。另一方面用戶在移動(dòng)情況下存儲(chǔ)、索引數(shù)據(jù)的需求也有增加,在這種特定情況下,需要保護(hù)用戶的數(shù)據(jù)隱私。加密數(shù)據(jù)有多個(gè)不同來源,針對這一問題的解決方法是加密算法使用公鑰加密。

③引入相關(guān)排序的加密搜索算法。這一種方法可以在給定多個(gè)可能相關(guān)文檔的情況下對加密文檔進(jìn)行排序,進(jìn)而把最可能相關(guān)的文檔返饋給用戶。但這種算法首先不適用于一個(gè)查詢包含多個(gè)查詢詞的情況,其次算法只利用了文檔中的詞頻信息,無法利用詞的逆文檔頻率,因而向量空間模型無法直接應(yīng)用。解決前一種問題的方法是用加法同態(tài)加密算法,對詞頻信息進(jìn)行加密處理。

本文綜合分析了目前加密檢索和相關(guān)技術(shù)及存在的問題。在幾種算法基礎(chǔ)上,提出了全同態(tài)加密檢索方法并簡要介紹全同態(tài)加密檢索方法的基本思路。根據(jù)實(shí)驗(yàn)數(shù)據(jù)說明,全同態(tài)加密檢索方法與其他加密檢索算法比較,在一定程度上提高檢索效率。

小知識(shí)之公鑰加密:

公鑰加密是由對應(yīng)的一對唯一性密鑰(即公開密鑰和私有密鑰)組成的加密方法,它解決了密鑰的發(fā)布和管理問題,是目前商業(yè)密碼的核心。