热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

16年云存储历程,亚马逊云科技如何应对数据存储挑战

随着千行万业的数字化转型,数据量暴涨,数据获得了空前的关注度。作为存储计算网络的三大IT基础设施之一,数据存储一直占据IT支出的重要部分。不过,在疫情和经济下行的趋势与压力之下,如

随着千行万业的数字化转型,数据量暴涨,数据获得了空前的关注度。作为存储计算网络的三大 IT 基础设施之一,数据存储一直占据 IT 支出的重要部分。不过,在疫情和经济下行的趋势与压力之下,如何通过创新的 IT 技术去降本增效,成为企业与技术团队必须要面对的问题。

提到灵活的云上资源与存储,业界必然会想到亚马逊云科技的王牌级存储产品 S3。从 2006 年推出 S3 到现在的 16 年间,亚马逊云科技一直在存储技术上投入研发,比如仅 2021 一年,就发布了 130 多项存储领域的新服务和功能特性。亚马逊云科技对于存储成本和性能的优化,为业界提供了重要的参考范本。

连续 16 年,让存储成本持续下降,怎么做到?

在存储技术上,想要提升数据存储和调用性能,降低存储介质成本,通常利用各类存储介质特点,依据数据重要级去分级存储,这一直是存储技术中重要的一项。亚马逊云科技的王牌存储产品 Amazon S3 在 16 年间价格降低 7 倍(以 S3 标准频繁访问层 Amazon S3 Standard Frequent Access 为例),2021 年底,Amazon S3 的标准非频繁访问层和单区非频繁访问层的存储价格又降低了 31%!

压缩存储成本空间的底气,是亚马逊云科技分层存储技术背后的设计逻辑。

数据量爆发,庞杂的数据其实可细分为各种类型,例如实时交易平台数据、业务监控数据、机器学习推理所涉及数据,以及社交媒体产生数据、音视频与图像数据,另外还要容灾备份、开发测试数据以及历史归档数据等等。亚马逊云科技为这些数据定义了“数据的温度”,依据数据调用的频率,分为热数据、温数据、冷数据和冻数据。

2018 年亚马逊云科技就推出了 Amazon S3 智能分层功能,面向未知访问模式的海量数据。Amazon S3 可以自动为数据进行冷热分层,实现至多 68%的成本节省。

另外,亚马逊云科技数据分层存储已经拓展到文件存储 Amazon EFS。Amazon EFS 提供四种存储等级,可节省高达 72%的存储成本。

现在,Amazon S3 智能分层已经涵盖了 Amazon S3 家族的几乎所有存储类别,实现数据全生命周期的智能化存储与使用。用户可以将 Amazon S3 智能分层作为默认的存储层级,用以构建包括数据湖、机器学习等各种云端应用。

存储走向场景细分,亚马逊云科技积累存储全线产品

说到存储的应用场景,数字化深入各行业,也催生了多种多样的业务场景。依据云计算的发展进程,我们可以将业务场景分为云上原生的场景,以及传统的企业业务场景。

如网站托管、数据湖、数字营销、云相册、音视频分享、电商平台、社交媒体等应用,这些云原生现代化应用,客户可以使用云原生 Serverless 文件存储  Amazon EFS,获得简单、无管理成本、海量弹性扩展、高度集成、自动优化的体验。

另外,例如 ERP/CRM、数据库、自动驾驶、生命科学、混合云、模拟仿真、气象分析、EDA、视频渲染等更为复杂多样化的企业级应用,亚马逊云科技提出“专门构建”的思路去提供云端存储产品和服务。

针对企业级工作负载,亚马逊云科技提供了 Amazon EBS IO2 BX 和 Amazon FSx 系列服务。Amazon EBS IO2 BX 是为运行在线下数据中心 SAN 存储上的应用而设计。Amazon FSx 家族是为各类企业应用而专门构建的共享文件存储。FsX = File X System,详细来说,Amazon FSx 家族已经有以下多个存储产品:



  • Amazon FSx for Windows File Server,2018 年 11 月推出,支持 Windows Server 工作负载。



  • 全新一代 Amazon FSx for Lustre,2021 年 11 月发布,面向 HPC 计算密集型工作负载,帮助客户快速完成高性能计算,如基因测序,新药研发,自动驾驶模拟仿真,半导体设计等任务。



  (1)Amazon FSx for Lustre 与当前一代相比,提供 5 倍的吞吐量(每 TB 高达 1GB/秒)。

  (2)Amazon FSx for Lustre 支持与 S3 的数据更新双向同步,在 S3 或 Lustre 任一侧更新数据,都可以在另外一侧实现自动快速同步。



  • Amazon FSx for OpenZFS,2021 年 11 月发布,面向大数据分析 Linux 工作负载。针对那些以往把数据放在 ZFS 或者其它 Linux 文件服务器、而不希望改变架构的云迁移客户。通过它可以让 ZFS 或其他基于 Linux 的文件服务器迁移到亚马逊云科技时,不需要改变应用和管理数据的方式,提供高达 1 百万 IOPS,而延迟仅有几百微秒,非常适合运行像机器学习和音视频实时处理这类数据密集型工作负载。



  • Amazon FSx for NetApp ONTAP,2021 年 9 月发布,方便企业业务无缝迁移上云。使客户能够在亚马逊云科技上启动、运行和扩展全面托管的 NetApp ONTAP 文件存储服务,无需修改其应用、工具、流程或工作流,即可将其在 NAS 设备上运行的应用迁移至亚马逊云科技。Amazon FSx for NetApp ONTAP 让客户可使用其已经熟悉的 NAS 工作流来部署、管理应用和数据,同时尽享亚马逊云科技带来的敏捷性、可扩展性和安全性,以及与亚马逊云科技其它服务之间的无缝集成。



通过对场景的细分与对应存储需求的研究,亚马逊云科技已经覆盖了从块存储、对象存储,到文件存储、备份、容灾,以及数据传输和边缘处理的全线存储产品和服务,堪称云巨头亚马逊云科技在存储技术领域的“全家桶”式产品矩阵。

强大产品矩阵,覆盖场景全面,不是一句简单的宣传口号。举个例子,亚马逊云科技存储产品“全家桶”所覆盖的场景,甚至已经拓展到了地球以外的国际空间站中。今年亚马逊云科技已经向国际空间站部署了 AWS Snowcone 服务,设备内含有固态硬盘,为国际空间站端到端的数据下载和分析事件从 20 小时缩短到 20 分钟。

这应该算是极端的一种边缘场景了,毕竟和地球上的场景比起来,国际空间站的边缘场景中,硬件要尽一切可能轻,经受发射时极端震动和重力,以及在微重力下安全连接主航天器电力、冷却和网络系统。

图:在国际空间站“服役”的 Amazon Snowcone

从存储技术层面看,这款 Amazon Snowcone 是专为运行边缘计算工作负载而设计,所有工作负载均受多层加密保护。在本地收集和处理数据后,通常会将设备运回亚马逊云科技数据中心,以便处理后的数据可以存储在云中并进一步处理。或者,也可以使用 Amazon DataSync 将数据从 Snowcone 设备复制回亚马逊云科技数据中心。

除了极端的边缘场景,以能源电力场景下的金风慧能案例为例。

 

总结

每一代科学技术迭代和变革的背后,都是因为技术切实提升人们生产生活效率,这也是 IT 吞噬一切,并重塑千行万业的终极价值。在不确定因素和多变的市场环境中,如何持续降低成本、提升效率,是每一位技术人都该去思考的问题。在技术实践和积累中,亚马逊云科技在存储领域的产品构建思路,给业界提供了很好的参考样本,值得参考和借鉴。

当然,亚马逊云科技丰富的存储产品和服务矩阵,以及最佳实践、应用案例,还有很多很多。2022年9月22日-23日,亚马逊云科技将在上海举办重要的技术盛会——2022亚马逊云科技中国峰会。点击链接或者扫描下图中二维码获取更多大会信息,更多的技术创新,等你来发现。

 



推荐阅读
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 寻求更强大的身份和访问管理(IAM)平台的企业正在转向云,并接受身份即服务(IDaaS)的灵活性。要为IAM选择正确的场外解决方案,业务管理人员和IT专业人员必须在实施之前评估安全 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 恶意软件分析的最佳编程语言及其应用
    本文介绍了学习恶意软件分析和逆向工程领域时最适合的编程语言,并重点讨论了Python的优点。Python是一种解释型、多用途的语言,具有可读性高、可快速开发、易于学习的特点。作者分享了在本地恶意软件分析中使用Python的经验,包括快速复制恶意软件组件以更好地理解其工作。此外,作者还提到了Python的跨平台优势,使得在不同操作系统上运行代码变得更加方便。 ... [详细]
  • 本文分享了一位Android开发者多年来对于Android开发所需掌握的技能的笔记,包括架构师基础、高级UI开源框架、Android Framework开发、性能优化、音视频精编源码解析、Flutter学习进阶、微信小程序开发以及百大框架源码解读等方面的知识。文章强调了技术栈和布局的重要性,鼓励开发者做好学习规划和技术布局,以提升自己的竞争力和市场价值。 ... [详细]
  • 老牌医药收割AI红利:先投个15亿美元抢中国人才
    萧箫发自凹非寺量子位报道|公众号QbitAI没想到,一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场,能看见不少熟悉的身影, ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了在Hibernate配置lazy=false时无法加载数据的问题,通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程,包括运行环境和数据库的配置信息。 ... [详细]
  • 本文介绍了在Linux下安装和配置Kafka的方法,包括安装JDK、下载和解压Kafka、配置Kafka的参数,以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例,帮助读者快速完成Kafka的安装和配置。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 前言:拿到一个案例,去分析:它该是做分类还是做回归,哪部分该做分类,哪部分该做回归,哪部分该做优化,它们的目标值分别是什么。再挑影响因素,哪些和分类有关的影响因素,哪些和回归有关的 ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
author-avatar
Shirley韻
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有