热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

云存储数据安全研究,主要集中在哪几个方面?

完整性审计外包数据存储为用户解决了内存不足、硬件维护成本高等问题的同时也带来了新的安全挑战。事实上,用户并不完全清楚自己在云上数据的真实情况。为了保证自己的数据在云

完整性审计

外包数据存储为用户解决了内存不足、硬件维护成本高等问题的同时也带来了新的安全挑战。事实上,用户并不完全清楚自己在云上数据的真实情况。为了保证自己的数据在云上完整且正确地存储,需要定期对云服务器上的数据进行审计,也就是用户能够高效地对云服务器存储数据的完整性和可用性进行审计。而事实上,用户并不会将云数据全部取回进行验证,因为海量的数据取回会消耗大量带宽以及终端的计算资源,所以将数据全部取回不实际。因此,用户通过下载或使用关于原始文件的部分信息来执行外包数据的完整性验证。数据完整性审计是云存储的重要安全技术之一,用于用户(或审计者)验证其存储于云端的数据是否保持完整。

完整性审计主要包含两种审计机制:可证明数据持有(ProvableDataPossession,PDP)和可证明数据可恢复(ProofofRetrievability,PoR),其对应的网络模型。这两个方案都是基于审计方(包括数据拥有者)与云服务器通过挑战-响应协议来验证数据的准确性或可恢复性。区别在于,PDP在效率方面有巨大优势,在判断云中数据是否损坏上更加快速。而PoR机制对所存储的数据进行了预先编码处理。因此,PoR方案不仅能验证数据是否被损坏,并且能在数据受到一定损坏时恢复数据。随着学术研究的发展,PDP和PoR这两个方向的研究也在高效性、动态数据支持方面不断完善。通常,考核数据持有性证明方案优劣的指标如表1所示。

2003年,远程数据存在验证的概念被首次提出后表明用户可以对文件进行无限次数的完整性验证。在此基础上,基于公钥密码体制的可证明数据拥有模型PDP和可证明恢复模型PoR被提出,这两种模型分别用来检测存储在半可信服务器中的数据是否完整和检测数据是否可恢复。近年来,学者们对支持动态更新的PDP方案进行了大量研究,提出了很多特殊场景下(如多用户、带有重复数据、支持密文检索等)的数据完整性审计方案。

以PDP为例,数据完整性审计方案执行过程。首先,用户对文件(明文或者密文)进行预处理和上传,包括数据的分块并计算数据块的校验标签。标签本质上是对数据块进行签名处理后获得的信息,他可以证明文件是否完整。现有两种方法对标签进行计算,一是基于对称密码学的方式,二是将公钥密码学用于计算标签。上传过程中用户将数据块以及对应的校验标签存储在云服务器上并删除本地备份,本地只保留与完整性审计相关的密钥信息。然后,用户再对云端数据进行完整性审计,审计者可以通过挑战—响应协议来完成数据完整性审计。其中,为了降低审计的通信开销,云服务器可以利用标签的同态性质,将与数据块相关的标签聚合成一个同态标签并反馈给审计者。审计者在验证阶段可以利用相关的密码参数验证云服务器上存储数据的完整性。如果在审计验证阶段输入的密码参数不包括数据拥有者的私密信息(如私钥),那么该审计者可以是除数据拥有者之外的任何第三方。基于该性质,我们可以称这种审计方案是公开可审计的。否则,完整性审计只能由数据拥有者完成,那么方案则是私有可审计的。

密文数据去重

在云存储服务带来诸多便利的同时,服务器中大量的冗余数据成为限制云存储发展的另一瓶颈。根据EMC的调查报告显示,随着云端数据的快速增长,云存储中的冗余数据在备份应用中达到80%以上,在文件系统中已经达到60%以上,这些冗余数据消耗着大量的存储资源和管理资源。因此,如何通过删除重复数据从而保证数据存储的高效性成为了亟待解决的问题。为了解决上述问题,数据去重技术应运而生,通过数据去重技术可以消除数据冗余,相同文件只保留一个物理副本,从而有效降低用户端上传数据耗费的带宽及节省服务器端的存储空间。对于云计算平台而言,数据去重不仅可以减少存储时付出的硬件成本,还可以提升存储空间的利用率,提高访问效率。数据去重存储技术目前广泛应用于商业云存储及数据备份服务,例如Dropbox、Mozy和Memopal等商业存储中。

然而现有的绝大多数去重方案仅适用于明文数据。为了保护敏感数据的隐私性,用户在上传敏感数据之前通常会使用加密算法对数据加密,由于不同的用户随机选取的密钥不同,因此,即使是相同的明文数据也会被加密成不同的密文,这使得云服务器无法判断两个密文数据是否是由相同的明文数据加密得到的。为了解决传统加密方案与去重方案不兼容的问题,收敛加密技术营运而生,通过将文件的哈希值作为其加密密钥的方案,收敛加密算法使得即使是不同的用户在不需要通信的前提下也能得到同样的密钥,这使得密文去重得以实现。

用户在上传文件之前,首先对文件F进行哈希操作,得到加密密钥k,若云服务器中的文件与用户所拥有的文件相同,则得到的密钥k也相同,然后基于密钥k对文件F进行加密,得到密文C,对密文C进行哈希得到标签T。然后用户将标签T上传到云服务器,云服务器根据得到的标签T和原来存储的数据标签进行对比,并将结果返回给用户。若用户得到云服务器返回结果是“重复”,则用户需要向云服务器进行数据拥有证明,证明自己拥有此数据;用户若收到结果为“没有重复”,则将密文及相应标签上传到云服务器进行存储。

通常,数据安全去重技术按照去重粒度可分为文件级去重和块级去重,顾名思义,在文件级去重中文件是去重执行的最小单元,服务器根据文件的标签进行去重并保留唯一文件副本。块级去重中,数据块是去重执行的最小单元,而服务器根据块标签进行去重并保留唯一的数据块副本。按照去重框架可分为服务器端去重和客户端去重,顾名思义,服务器端去重指的是在服务器端进行去重操作,用户不参与也不知道数据是否被执行去重;客户端去重是指去重在客户端进行,用户只上传不重复的数据给服务器。

可靠数据删除

由于云存储中用户的数据外包存储在云服务器上,这导致了用户数据的所有权与管理权分离,使得数据不在可控的范围内。对于用户来说,其外包的数据往往可能包含大量的敏感信息,这些敏感信息都可能会泄露用户的隐私。由于云服务器的不完全可信,传统的本地数据删除方法也无法适用于云场景中,云存储中的用户难以确信其数据是否被服务器安全删除。因此,可靠的数据删除服务就显得尤为重要。用户对可靠的数据删除的需求包括两个方面:一方面,用户希望在数据的生命期结束或它向云服务提供商请求删除数据后,这一数据就应该是永远不可访问的;另一方面,为了保证云存储的容灾能力,云服务提供商通常会保存用户的多个副本,但是在执行数据删除时,用户希望云服务提供商删除所有的数据副本。

现有的数据删除技术主要包含两种:安全覆写方法和密码学删除方法。安全覆写方法是一种物理删除数据的方法,它对数据进行删除操作时首先需要对数据进行破坏,然后使用新的数据在原有数据的位置上进行覆写,从而使得用户数据无法恢复,进而实现可靠的数据删除;具体标准与算法要求如表2所示。

密码学删除方法指的是用户在上传敏感数据文件之前,通常会先对其数据文件进行加密操作,然后再将密文数据上传到云服务器上;用户所有数据文件的密钥按树形结构组织,然后将主密钥保存在物理安全的存储介质中,其他数据和加密的密钥树则被保存在一般存储介质。当数据需要被删除时,将密钥管理者所持有的密钥进行删除,也就是说即使云服务器保留了这一被加密的数据的密文,但是因为无法拥有相应的解密密钥,存储在云服务器上的密文数据无法解密,这样就能保证用户存储在云端数据的安全删除。此外,为了实现对每个数据文件的可操作性,每个数据需要单独选择不同的加密密钥,并在本地保留尽量少的主密钥,其它密钥通过主密钥加密方式存储在服务器中。对重复数据删除方案的考核标准主要体现在表3所示的几个方面。

高效密文检索

许多的敏感信息如电话、个人材料、图像等存储在云端上。因此,为了保护客户的敏感信息,客户在上传数据到云端之前对数据进行加密处理。然而,加密技术破坏了数据原有的状态,使得在极其多的密文文件中搜索指定的文件变得十分困难。传统的明文检索方式不再适用于密文数据,高效的密文数据检索技术是保护云存储数据安全的一个关键技术。

在密文数据检索中,主要包含关键词搜索、多关键词检索、模糊关键词检索等多种检索方式。现有的加密数据检索方案分为4种类型:

·利用索引访问类型。用户根据文件数据的关键词建立具有隐私保护性质的索引,其中索引与加密数据一一对应。检索时,只需根据索引查找检索请求,再由索引的信息返回相关文件。

·利用陷门信息访问类型。最常用的方法是利用文件关键词构造陷门信息,即用户的访问信息,从而可以直接使用文档的关键词检索加密文件,从而获得需要的资源。

·利用秘密共享方案访问类型。数据拥有者对数据计算多个隐私信息,并将隐私数据分散地存在不同的云中,只要服务器之间不相互勾结,则该方法能够对数据隐私进行保护。

·利用同态加密的访问类型。存在一些同态加密函数能够实现对密文数据的相关操作直接作用于明文数据上,因此可是现实密文状态下的信息检索。但同态加密在实际使用中计算开销和通信开销较大,不适合实际使用。

云环境下的安全密文检索网络图如图4所示。首先,数据拥有者根据文件的明文信息提取关键词创建与文件相对应的索引表,然后对文件数据和索引进行加密,并将加密后的文件和密文索引发给云进行存储。当有客户需要检索指定文件时,客户根据需求向数据拥有者获取文件解密密钥以及生成索引陷门的密钥,并通过检索的文件创建检索请求,发给云服务器。云服务器收到客户的检索请求后执行检索操作,并将检索后的结果返回给客户。

根据方案中使用的不同的密码体制,可搜索加密技术分为以下两个技术:对称可搜索加密技术和公钥可搜索加密技术。其中对称可搜索加密技术在使用过程中,数据拥有者和用户之间需要进行密钥协商,因此只有合法用户才能生成检索请求和解密密文。因为对称可搜索技术计算速度快的优势,已经逐步成为了学术研究的焦点。其中早期的研究工作主要集中在单关键词检索,之后大量的方案被提出,如相似性检索,多关键词检索,模糊关键词等,使得可搜索加密技术应用更加广范。2004年公钥密码首次被引入可搜索领域,提出第一个基于关键词的公钥可搜索加密方案。对于公钥可搜索加密技术中,用户利用共享者的公钥进行加密,双方不需要进行交互,因此应用场景更为广阔。

云计算是时代的必然产物,而从某种程度上讲,云计算安全是为云计算服务的一种服务。随着云计算的高速发展和快速应用,现有的云计算安全研究已经体系化,专业化,云计算安全已经成为很多IT从业者关注的主题。用户在云端进行存储、计算和访问数据时不希望泄露自己的隐私信息,用户对自己的数据安全性需求催生了云存储可靠数据删除,完整性审计技术的发展;本文通过对云存储数据安全框架的综述,从完整性审计、安全数据去重和可靠数据删除、高效密文检索这几个方面分析了各领域的研究内容。随着国内外研究的不断深入,我们相信这一领域的发展将会越来越好,为人类科技的高速发展做出更大的贡献。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
如何有效降低云存储成本?
http://www.duozhishidai.com/article-11863-1.html
企业如何迁移和管理云存储
http://www.duozhishidai.com/article-9500-1.html
云存储发展与新商业模式的关系
http://www.duozhishidai.com/article-8811-1.html
物联网环境下的云存储安全问题研究
http://www.duozhishidai.com/article-8026-1.html
企业构建私有云存储的四大技巧
http://www.duozhishidai.com/article-7578-1.html


多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

推荐阅读
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 本文介绍了新款奇骏的两个让人上瘾的功能,分别是智能互联系统和BOSE音响。通过对新款奇骏的配置和功能进行评测,探讨了这两个新增功能的使用体验和优势。此外,还介绍了新款奇骏的其他配置和改进,如增加的座椅和驾驶辅助系统,以及内饰的舒适性提升。对于喜欢音响的消费者来说,BOSE音响的升级也是一个亮点。最后,文章提到了BOSE音响的数字还原能力,以及7座版无法配备BOSE音响的原因。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 本文介绍了一些好用的搜索引擎的替代品,包括网盘搜索工具、百度网盘搜索引擎等。同时还介绍了一些笑话大全、GIF笑话图片、动态图等资源的搜索引擎。此外,还推荐了一些迅雷快传搜索和360云盘资源搜索的网盘搜索引擎。 ... [详细]
  • 单点登录原理及实现方案详解
    本文详细介绍了单点登录的原理及实现方案,其中包括共享Session的方式,以及基于Redis的Session共享方案。同时,还分享了作者在应用环境中所遇到的问题和经验,希望对读者有所帮助。 ... [详细]
  • 大学生自学复制假饭卡:2个月卖出3千张,获利10万元!背后的神器长啥样?
    山东淄博的一名在校大学生通过自学复制饭卡的技术,2个月内成功卖出3千张假饭卡,获利10万元。他使用了一种特殊的设备来复制饭卡,并通过网店销售给其他学生。该学生已被刑拘。此事被发现是因为学校食堂管理员发现了大量负数的情况,经警方调查后发现是这名学生所为。他制作的假饭卡与真卡几乎一模一样,售价仅为面值的40%。该学生一共复制了三千多张饭卡,并已全部卖完,获利十万余元。 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • SpringMVC接收请求参数的方式总结
    本文总结了在SpringMVC开发中处理控制器参数的各种方式,包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver,处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor,以及PathVariableMapMethodArgumentResol等子类。 ... [详细]
  • 本文介绍了一种处理AJAX操作授权过期的全局方式,以解决Asp.net MVC中Session过期异常的问题。同时还介绍了基于WebImage的图片上传工具类。详细内容请参考链接:https://www.cnblogs.com/starluck/p/8284949.html ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
author-avatar
php学者
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有