热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

充分利用DB29.7的重复数据删除设备支持

重复数据删除能够最大程度地减少存储需求、加速备份和恢复、降低网络流量,从而显著改善数据库环境。但在发布DB2v9.7FixPack3之前,如果需要为重复数据删除设备优化DB2备份映像,则必须合理地设置多个BACKUPDATABASE命令选项。否则,备份目标的重

重复数据删除能够最大程度地减少存储需求、加速备份和恢复、降低网络流量,从而显著改善数据库环境。 但在发布 DB2 v9.7 FixPack 3 之前,如果需要为重复数据删除设备优化 DB2 备份映像,则必须合理地设置多个 BACKUP DATABASE 命令选项。否则,备份目标的重

重复数据删除能够最大程度地减少存储需求、加速备份和恢复、降低网络流量,从而显著改善环境。

但在发布 DB2 v9.7 FixPack 3 之前,如果需要为重复数据删除设备优化 DB2 备份映像,则必须合理地设置多个 BACKUP DATABASE 命令选项。否则,备份目标的重复数据删除设备很可能无法使用您生成的数据流来识别冗余的数据“块”。为了简化将 DB2 数据库备份到重复数据删除设备的过程(同时提高删除备份映像中重复数据的效率),IBM 在 DB2 v9.7 FixPack 3 中为 BACKUP DATABASE 命令引入了 DEDUP_DEVICE 选项,并在 FixPack 4 中改进了该选项的行为。在这篇专栏文章中,我将介绍重复数据删除是什么,以及重复数据删除的常见实现方法。此外,我还会介绍如何执行 DB2 备份操作,包括如何在指定了 BACKUP DATABASE 命令的 DEDUP_DEVICE 选项时执行此操作,以及如何在未指定此选项时执行该操作。最后,我会提供一些建议:如果您使用 DB2 v9.7 FixPack 4 以外的版本,应该如何为重复数据删除设备优化 DB2 备份映像。

重复数据删除是什么?它是如何实现的?

重复数据删除(有时也称为“智能压缩”或者“单实例存储”)是一种特殊的数据压缩形式,旨在消除冗余数据。与其他压缩形式类似,重复数据删除的工作方式是检查数据,识别具有等同字节模式的部分。如果发现此类模式,则会仅将数据的单独一个惟一实例写入存储;将出现的重复实例替换为“数据指针”,引用之前存储的版本。考虑到相同的字节模式可能会出现数十次、数百次乃至数千次,使用重复数据删除设备之后,需要物理存储的数据量可能会大幅减少。

例如,假设一个电子邮件系统包含某个 4 MB 附件的 100 个完全相同的实例。如果在未使用重复数据删除的情况下备份这个电子邮件系统,保存该附件的全部 100 个实例,那么需要 400 MB 的存储空间。然而,如果将相同的电子邮件系统备份到重复数据删除设备,那么实际上仅储存了附件的一个实例,后续出现的每个实例仅引用已保存的副本。这样,备份该系统所需的 400 MB 存储空间就会缩减为 4 MB!

如前所述,大多数重复数据删除设备的工作方式都是对比相对较大的数据“块”,例如整个文件或者文件中较大的部分。设备会为所检查的每个块指派一个标识符,这个标识符通常使用加密散列函数计算得出。很多实现都假设:如果标识符等同,则对应的数据也等同。其他一些实现摒弃了这种假设,而是执行逐个字节的对比,验证标识符相同的数据是否确实相同。无论如何,如果确定某个特定的数据块在删除了重复数据的命名空间内已经存在,就会使用一个指向已存储数据的链接取代该数据块。随后,在访问删除了重复数据的数据时,如果遇到链接,就会将该链接替换为它所指向的数据。当然,整个过程对于最终用户和应用程序都是透明的。

通常情况下,重复数据删除通过两种方法之一执行:“内联”或“后处理”。使用内联重复数据删除时,会在将数据写入磁盘之前执行散列计算和查找。这样,内联重复数据删除能够显著减少所需的原始磁盘容量,因为任何未经过重复数据删除处理的数据均不会写入磁盘。出于这方面的原因,内联重复数据删除往往被视为最有效、最经济的重复数据删除方法。尽管某些内联重复数据删除解决方案供应商已经能实现与后处理重复数据删除水平相当的性能,但由于内联重复数据删除需要耗费时间来执行散列计算和查找,因此会减缓某些操作的速度。

对于后处理重复数据删除,所有数据会在重复数据删除过程开始之前写入磁盘。这种方法的优势在于,无需在存储数据之前等待散列计算和查找完成。缺点在于,必须暂时将重复数据写入存储,因此需要的初始存储量更多一些。这种方法也会延长完成重复数据删除的延迟时间。

传统 DB2 备份操作的工作方式

为了理解 BACKUP DATABASE 命令的 DEDUP_DEVICE 选项如何为重复数据删除设备优化 DB2 备份映像,最好先了解一下发起备份操作时,数据通常会得到怎样的处理。在 DB2 备份操作开始时,会启动一个或多个缓冲区操作器 db2bm 线程。这些线程负责访问数据库中的数据,并将它们以流程方式传送至一个或多个备份缓冲区。另外还会启动一个或多个介质控制器 db2med 线程。这些线程负责将备份缓冲区中的数据写入目标备份设备上的文件。(所用的 db2bm 线程数量由 BACKUP DATABASE 命令的 PARALLELISM 选项控制;所用的 db2med 线程数量由 OPEN n SESSIONS 选项控制。)最终,将指派一个 DB2 代理 db2agent 线程负责指导缓冲区操作器线程与介质控制器线程之间的通信。图 1 展示了这个过程。

充分利用DB2 9.7的重复数据删除设备支持
图1:DB2 备份流程模型。

通常情况下,会读取缓冲区操作器 db2bm 线程检索到的数据,并跨介质控制器 db2med 线程使用的所有输出流来多路复用这些数据,将数据置入输出流中的方式没有确定的模式。(图 2 展示了这种行为。)因此,在将输出流导向重复数据删除设备时,设备会尝试识别已经备份的数据块,这会造成了某些问题。

充分利用DB2 9.7的重复数据删除设备支持

图 2:默认数据库备份行为。请注意,表空间的元数据会出现在输出流中,先于该表空间的任何数据,空区段永远不会置入输出流。

推荐阅读
  • 本文介绍了如何使用PHP向系统日历中添加事件的方法,通过使用PHP技术可以实现自动添加事件的功能,从而实现全局通知系统和迅速记录工具的自动化。同时还提到了系统exchange自带的日历具有同步感的特点,以及使用web技术实现自动添加事件的优势。 ... [详细]
  • Matplotlib,带有已保 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 本文描述了作者第一次参加比赛的经历和感受。作者是小学六年级时参加比赛的唯一选手,感到有些紧张。在比赛期间,作者与学长学姐一起用餐,在比赛题目中遇到了一些困难,但最终成功解决。作者还尝试了一款游戏,在回程的路上感到晕车。最终,作者以110分的成绩取得了省一会的资格,并坚定了继续学习的决心。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 基于layUI的图片上传前预览功能的2种实现方式
    本文介绍了基于layUI的图片上传前预览功能的两种实现方式:一种是使用blob+FileReader,另一种是使用layUI自带的参数。通过选择文件后点击文件名,在页面中间弹窗内预览图片。其中,layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块,并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 关羽败走麦城时路过马超封地 马超为何没有出手救人
    对当年关羽败走麦城,恰好路过马超的封地,为啥马超不救他?很感兴趣的小伙伴们,趣历史小编带来详细的文章供大家参考。说到英雄好汉,便要提到一本名著了,没错,那就是《三国演义》。书中虽 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
author-avatar
素材火2
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有