热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

DLFM:ATransactionalResourceManager(论文阅读)

目录DLFM:事务性资源管理器论文背景简介DataLinks技术datalinks架构DataLinks应用程序DatalinkFileManager持久数据结构链接

目录

  • DLFM:事务性资源管理器
  • 论文背景
  • 简介
  • DataLinks技术
  • datalinks 架构
  • DataLinks应用程序
  • Datalink File Manager
  • 持久数据结构
  • 链接和取消链接
  • 协调备份和还原
  • DLFM流程模型


DLFM:事务性资源管理器
论文背景

在IBM Almaden研究中心开发的DataLinks技术现已在DB2 UDB 5.2中提供,它引入了一种称为DATALINK的新数据类型,用于数据库引用和管理存储在数据库外部的文件。通过将文件“链接”到数据库,将外部文件置于数据库控制之下。也可以通过“取消链接”来删除对文件的控制。该技术提供了有关在存储或更新DATALINK值时链接或取消链接文件的事务语义。此外,它提供了以下属性集:
(1)管理对链接文件的访问控制,
(2)强制执行引用完整性,例如,只要从RDBMS进行引用,就不能删除或重命名所引用的文件,以及
(3)
提供RDBMS数据与文件数据的协调备份和恢复。 DataLinks文件管理器(DLFM)是
DataLinks技术
的关键组件。 DLFM是一个复杂的SQL应用程序,在文件服务器节点上驻留了一组守护进程,这些守护进程与主机数据库服务器协同工作以管理外部文件。为了减少数据库服务器和DLFM之间的消息数量,DLFM在文件系统和受数据库控制的文件上维护一组元数据。
**我们做出的主要决策之一是在现有的数据库管理器(例如DB2)之上构建DLFM,而不是实现专有的持久性数据存储。**对于使用RDBMS构建这样的资源管理器,我们有不同的感觉。主要挑战之一是为DLFM操作支持事务语义。为此,我们在DLFM中实现了两阶段提交协议,并设计了一种创新的方案以允许在本地数据库提交后回滚事务更新。另外一个主要问题是,RDBMS的基于成本的优化器会生成访问计划,该计划未考虑并发工作负载的锁定成本。将RDBMS用作黑匣子会导致“超时”,从而导致锁定超时和死锁,并降低并发工作负载的吞吐量。为了解决这个问题,我们想出了一个简单但有效的方法

简介

十多年来,IBM一直专注于可扩展数据库研究。这些努力的许多成果已经出现在IBM的DB2关系数据库管理系统(RDBMS)系列中[1]。为了进一步扩展RDBMS功能的范围,IBM Almaden Research现在已经开发了一种称为DataLinks [2]的新技术,该技术使DBMS能够管理存储在外部操作系统文件中的数据。 DataLinks为DBMS提供了对外部数据的全面控制,并提供以下属性:引用完整性,访问控制,协调的备份和恢复以及事务一致性。现在,数家公司和机构(例如,波音,达索和汽车制造商)已经部署了DataLinks技术,以提供对存储在操作系统文件中的分布式科学和工程数据的数据库管理[2,3]。
DataLinks技术包括以下主要组件**:DLFM,DLFF**(DataLinks文件系统过滤器)以及RDBMS引擎(以下称为数据链路引擎)的扩展。它还引入了新的DATALINK数据类型[4],以方便RDBMS引用和管理外部存储的数据。数据链接引擎负责处理DDL请求以创建数据链接列,并负责处理针对数据链接列的DML请求。另一方面,DLFM和DLFF组件位于存储数据库管理的外部数据的文件服务器上。 SQL表中datalink列的值为URL,它可以引用相同或相同的文件
在这里插入图片描述

DataLinks技术

DataLinks是一种软件技术,使DBMS可以管理存储在外部操作系统文件中的数据,就好像该数据直接存储在数据库中一样。通过将DBMS的范围扩展到操作系统文件,DataLinks使用户可以灵活地在数据库内部或外部适当地存储数据。为了在DBMS之外存储和引用数据,数据库应用程序开发人员在创建SQL表时声明DATALINK数据类型的列。然后,将数据链接列中存储的值用于表示和引用外部文件中的数据。图2说明了DataLinks技术的体系结构。如图所示,DataLinks包含两个组件:数据链接引擎和数据链接管理器(参见图2)。数据链接引擎驻留在主机数据库服务器中,并作为数据库(DB2)引擎代码的一部分实现。它负责处理涉及数据链接列的SQL请求,例如表创建以及使用数据链接列的记录的选择,插入,删除和更新。数据链接管理器由2个组件组成,数据链接文件管理器(DLFM)和数据链接文件系统过滤器(DLFF)

datalinks 架构

在这里插入图片描述

DataLinks应用程序

数据链接应用程序是一种操作**SQL表中数据链接属性(列)**的应用程序,就数据库而言,它与常规数据库应用程序没有什么不同。在数据链路应用程序可以发出任何请求之前,它必须首先建立数据库连接。作为数据库连接请求的一部分,将标识一个DB2代理(进程或线程)来为应用程序提供服务。建立连接后,应用程序可以开始向数据库引擎提交SQL请求。如果SQL请求需要处理数据链接列,则调用数据链接引擎以处理特定于请求的部分。到数据链接列。反过来,如果需要的话,数据链路引擎向DLFM发送一个或多个请求,以操纵存储在文件服务器上的文件和元数据
在这里插入图片描述

Datalink File Manager

DB2 Data Links Manager的Data Links File Manager(DLFM)组件在管理外部文件中起着关键作用。它负责在链接到数据库(在其中引用)的同一事务中执行链接/取消链接操作。当文件最初链接到数据库时,DLFM会**应用约束以实现引用完整性,**访问控制,DATALINK列定义中指定的备份和恢复。例如,如果DBMS控制读取访问,则DLFM将文件的所有者更改为DBMS,并将文件标记为“只读”。对DLFM存储库和文件系统的所有这些更改都作为与发起SQL语句相同的DBMS事务的一部分应用。如果回滚SQL事务,则DLFM所做的更改也将被撤消。DLFM还负责协调外部文件与数据库的备份和恢复。当包含链接文件操作的DBMS事务提交时,如果DLFM负责文件的恢复,则DLFM将启动新链接文件的备份。该文件备份是异步完成的,由于性能原因,它不是数据库事务的一部分。

持久数据结构

DLFM使用本地数据库保留其元数据和状态信息。此信息存储在以下SQL表中。

  1. Dbid表:此表由每个可以连接到此DLFM的主机数据库的注册条目组成。该表中的dbid字段表示主机数据库名称,实例名称和主机名称的唯一组合。
  2. 2.组表:此表由文件组条目组成。每个组条目对应于主机数据库侧SQL表中的数据链接列。
  3. 3.文件表:这是最常访问的表,包含文件服务器上链接的文件和未链接的文件的信息。每当链接文件时,都会在文件表中插入一个新条目。在取消链接操作期间,处于链接状态的现有文件条目被标记为未链接。如果将来需要通过主机数据库还原实用程序还原文件,则该表保留未链接的文件条目。该表中定义的关注列是dbid,filename,transaction_id,Recovery_id,file_status,entry_state。稍后将通过功能处理来描述它们的用法。
  4. 4.事务表:此表跟踪所有活动DLFM事务的事务状态。只要交易处于活动状态,交易状态就会被维护。事务开始时,事务状态信息首先保存在内存表中。当事务开始提交处理的第一阶段时,该条目将插入到SQL表中。交易完成后,其条目将从交易表中删除。
  5. 5.存档表:此表包含需要存档到存档服务器的文件和组条目。当使用load实用程序将大量文件插入主机数据库侧的datalink列中时,而不是复制Archive表中的每个文件条目,而是仅将一个组条目插入Archive表中。将处理“存档”表中的条目以复制一组文件或仅复制一个文件。复制完成后,将从存档表中删除相应的条目。

链接和取消链接

LinkFile和UnlinkFile是两个最常见的操作,**分别与从主机数据库插入和删除数据链接值相对应。**每当应用程序将文件条目插入到datalink列中时,在LinkFile操作期间,DLFM将在File表中放置一个新条目。该条目包括dbid,事务ID,文件名和Recovery ID等。主机数据库上生成的恢复ID由dbid和时间戳组成。保证它在全球范围内是唯一的,并且会单调增加。对于每个LinkFile操作,DLFM都会进行以下两项检查:
1.如果DLFM元数据表中的同一文件已经存在链接条目,则该链接条目将拒绝LinkFile操作,因为该文件已处于链接状态。
2.如果DLFM表中存在未提交取消链接事务(即,进行中或处于怀疑状态)的同一文件的取消链接条目,则它会拒绝LinkFile操作,因为取消链接事务的结果仍是未知的。
但是DLFM必须确保最多一个条目处于链接状态。因此,仅文件名上的唯一索引是不够的,通常在“文件”表中具有数十万或数百万个条目。由于每个链接或取消链接文件操作都需要访问File表,因此从File表中查找和检索条目的效率对于提供良好的整体性能至关重要。
我们要做的第一件事是通过建立多个索引(每个访问路径一个索引)来避免表扫描。
DLFM在文件表中将事务ID与其他信息一起记录为持久性信息。与事务关联的条目在提交处理期间由此ID标识。
DLFM为此提供了四个API:BeginTransaction,Prepare,Commit和Abort
在这里插入图片描述

协调备份和还原

DLFM在协调备份和恢复DBMS数据以及文件数据中发挥着重要作用。当链接文件提交的事务和文件组具有recovery选项7时,DLFM启动将该文件归档到归档服务器(如ADSM.8)DLFM Child Agent(第3.5节中描述)将文件的条目放入存档中表和复制守护程序从存档表中拾取条目,并将文件写入存档服务器。归档表后面的主要目的是避免在主元数据表,文件表中的争用以及从任何DLFM故障恢复后有效重启复制。由于在存档表上定义了多个索引,并且归档表的大小很小(在存档后立即删除条目),因此在访问存档表时,子代理和复制守护程序之间会遇到死锁。禁用DLFM本地数据库中的下一个密钥锁定功能消除了这些死锁。请注意,当未执行下一个密钥锁定时,可能会出现幻像。但是,DLFM无法正常运行可重复读取属性。

请注意,提交事务时,文件的归档是异步的。进行备份副本时,DLFM不持有任何数据库锁。之所以可以进行异步备份,是因为DLFM在提交操作期间取消了文件的“写入”权限。主机数据库端的备份实用程序确保在声明备份成功之前,将自上次备份以来链接的所有文件都存档到存档服务器。如果某些文件的归档正在等待中,则它会要求Copy守护程序以高优先级来归档这组文件。

DLFM流程模型

DLFM是一个并发服务器,即,当接收到DB2代理的连接请求时,它具有一个主要守护程序,该主守护程序会产生子代理(或进程)。然后,子代理与请求DB2代理建立连接。此子代理将提供来自相同连接的所有后续请求。 DLFM的主要守护程序然后等待来自相同或不同主机DB2的另一个连接请求。主机DB2侧的应用程序将与DLFM建立单独的连接,因此它们由DLFM侧的单独的儿童代理服务提供服务。除了儿童代理商之外,DLFM还提供了几种作为守护程序实现的其他服务,并且它们也被主DLFM守护进程产生了它们[REF。图5]。本节介绍每个守护程序提供的功能和服务、
如果将SQL表放在主机DB2端,则DLFM端的相应文件组(如果有)也将需要删除。删除的表中的数据链接列可能引用了许多文件,所有这些文件都需要取消链接。所以在事务前进过程中,文件组在“组”表中被当前事务标记为“已删除”。在准备处理期间,子代理会记录此事务删除的组数,并将其与事务条目一起记录在事务表中。提交处理通过检查事务条目中当前事务中已删除的组数来检查是否删除了任何组,如果已删除,则它将事务ID发送到Delete Group守护程序。使用事务标识,“删除组”守护程序查找在此事务中删除的所有组,然后取消链接每个组中的所有文件
在这里插入图片描述
通过该守护程序取消文件的链接是异步的,并且对drop table的提交处理不会等待它完成。请注意,直到该组中的所有文件都已取消链接,才删除该组条目。并且,只要此事务未提交,就不允许重新链接相同的文件名。因此,如果DLFM在Delete group守护程序完成从已删除的组中取消所有文件的链接之前失败,则在DLFM重新启动后,Delete group守护程序仍可以从事务表中提取所有已提交的事务条目并恢复其工作。


推荐阅读
  • 本文介绍了OpenStack的逻辑概念以及其构成简介,包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文详细介绍了GetModuleFileName函数的用法,该函数可以用于获取当前模块所在的路径,方便进行文件操作和读取配置信息。文章通过示例代码和详细的解释,帮助读者理解和使用该函数。同时,还提供了相关的API函数声明和说明。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • Voicewo在线语音识别转换jQuery插件的特点和示例
    本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件,该插件具有快速、架构、风格、扩展和兼容等特点,适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • Java和JavaScript是什么关系?java跟javaScript都是编程语言,只是java跟javaScript没有什么太大关系,一个是脚本语言(前端语言),一个是面向对象 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • SpringBoot整合SpringSecurity+JWT实现单点登录
    SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]
author-avatar
吉祥话如意
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有