热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

12TBASMRAC磁盘无法mount的案例

本站文章除注明转载外,均为本站原创:转载自lovewifelovelife—Roger的Oracle技术博客本文链接地址:12TBASMRAC磁盘无法mount的案例网友发的信息,从alertlog来看,在手工mountdiskgroup的时候报错如下:ThuAug2810:34:292014WARNING:cac

本站文章除注明转载外,均为本站原创: 转载自love wife love life —Roger 的Oracle技术博客 本文链接地址: 12TB ASM RAC磁盘无法mount的案例 网友发的信息,从alert log来看,在手工mount diskgroup的时候报错如下: Thu Aug 28 10:34:29 2014WARNING: cac

本站文章除注明转载外,均为本站原创: 转载自love wife & love life —Roger 的Oracle技术博客

本文链接地址: 12TB ASM RAC磁盘无法mount的案例

网友发的信息,从alert log来看,在手工mount diskgroup的时候报错如下:

Thu Aug 28 10:34:29 2014
WARNING: cache read a corrupted block gn=3 fn=1 blk=263 from disk 1
NOTE: a corrupted block was dumped to /oracle/diag/asm/+asm/+ASM/trace/+ASM_ora_17918.trc
ERROR: cache failed to read gn=3 fn=1  blk=263 from disk(s): 1
ORA-15196: invalid ASM block header [kfc.c:9133] [obj_kfbl] [1] [263] [3 != 1]
System State dumped to trace file /oracle/diag/asm/+asm/+ASM/trace/+ASM_ora_17918.trc
NOTE: cache initiating offline of disk 1  group 3
WARNING: initiating offline of disk 1.4042510639 (DATA_DG_0001) with mask 0x7e 
NOTE: initiating PST update: grp = 3, dsk = 1, mode = 0x15

对于这个错误,是非常常见的了。Oracle MOS也有不少的文档进行描述,本质上其实就是ASM元数据存在异常了。对于Oracle ASM的元数据,我写了一系列的文章,供参考。需要注意的是,有些元数据如果损坏,那么我们可以很容易修复,比如disk header,Disk directory,PST等等。其他的出现问题了,就比较麻烦了。 我们这里简单描述下这个ORA-15196错误的含义:
ORA-15196: invalid ASM block header [1st] [2nd] [3rd] [4th] [5th != 6th]

Argument Meaning 
1st   Function and line number in the code, where the exception is raised  
2nd  Field failing the validation 
3rd   ASM object number stored in the block 
4th   ASM block number stored in the block  
5th   Value associated with field referenced by argument 2  
6th   Expected value for field referenced by argument 2

根据Oracle MOS 文档的解释,我们这里的这个错误,可以理解为这样一个意思:

Oracle 在执行kfc.c代码的9133行时报错。校验时发现obj_kfbk异常。ASM 对象号为1,存在的block号为263. 发现该block内的值应该是1,而不是3.

这里补充一点,对于asm object,为1标示file directory。这里大家可以参考我之前的一个例子:

SQL> select number_kffxp file#, disk_kffxp disk#, count(disk_kffxp) extents
  2  from x$kffxp
  3  where group_kffxp=1
  4        and disk_kffxp <> 65534
  5  group by number_kffxp, disk_kffxp
  6  order by 1;
?
     FILE#      DISK#    EXTENTS
---------- ---------- ----------
         1          0          2
         2          1          1
         3          0         21
         3          1         21
         4          0          1
         4          1          1
         5          0          1
         6          0          1
       256          0        241
       256          1        241
       257          0        120
   .........
       263          0         28
       263          1         28
       264          0         11
       264          1         10
       265          1          1
?
27 rows selected.

上述查询的file信息,其实就的10g版本中asm所涉及的元数据信息,对应关系如下:

file#   1   ---ASM file 1,file directory
file#   2   ---ASM file 2,disk directory
file#   3   ---ASM file 3,active Change Directory(ACD)
file#   4   ---ASM file 4,continuing Operations Directory (COD)
file#   5   ---ASM file 5,template directory
file#   6   ---ASM file 6,alias directory

所以,根据目前了解的信息来看,这里本质上是file directory出现问题了。如果想进一步了解,我们可以分析alert log中提到的trace文件,下面来简单看看,我们搜索关键字来看下比较重要的一段信息:

*** ACTION NAME:() 2014-08-28 10:34:29.920
?
WARNING: cache read a corrupted block gn=3 fn=1 blk=263 from disk 1
?
*** 2014-08-28 10:34:29.943
OSM metadata block dump:
kfbh.endian:                          0 ; 0x000: 0x00
kfbh.hard:                          130 ; 0x001: 0x82
kfbh.type:                            8 ; 0x002: KFBTYP_CHNGDIR
kfbh.datfmt:                          1 ; 0x003: 0x01
kfbh.block.blk:                    1607 ; 0x004: T=0 NUMB=0x647
kfbh.block.obj:                       3 ; 0x008: TYPE=0x0 NUMB=0x3
kfbh.check:                   152962911 ; 0x00c: 0x091e075f
kfbh.fcn.base:                 49018345 ; 0x010: 0x02ebf5e9
kfbh.fcn.wrap:                        0 ; 0x014: 0x00000000
kfbh.spare1:                          0 ; 0x018: 0x00000000
kfbh.spare2:                          0 ; 0x01c: 0x00000000
kfracdb.aba.seq:                   1722 ; 0x000: 0x000006ba
kfracdb.aba.blk:                   1606 ; 0x004: 0x00000646
kfracdb.ents:                        21 ; 0x008: 0x0015
kfracdb.ub2spare:                     0 ; 0x00a: 0x0000
。。。。。。
ERROR: cache failed to read gn=3 fn=1  blk=263 from disk(s): 1
  CE: (0x380bd96f8)  group=3 (DATA_DG) obj=1  blk=263
      hashFlags=0x0008  lid=0x0002  lruFlags=0x0000  bastCount=1
      redundancy=0x11  fileExtent=1  locator:  obj=1  blk=1
      blockIndex=7 AUindex=0 AUcount=1 mirror=0
      flags_kfcpba=0x09 copies=1 blockIndex=7 AUindex=0 AUcount=1
      copy #0:  disk=1  au=25
  BH: (0x380fb8ed0)  bnum=2635 type=reading state=reading chgSt=not modifying
      flags=0x00000000  pinmode=excl  lockmode=excl  bf=0x380f2e000
      kfbh_kfcbh.fcn_kfbh = 0.49018345  lowAba=1716.2941  highAba=0.0
      last kfcbInitSlot return code=null cpkt lnk is null ralFlags=0x00000000

这里正是我们报错提到的fn=1 blk=263 。这里的au 25其实是有问题的,可惜这里我忘记保留当时的kfed的记录了。很明显这里kfbh.block.obj的值,Oracle认为应该是1,因为这是file directory的信息,但是上面的type显示又是KFBTYP_CHNGDIR,这显然是不匹配的。

对于这样的case,通常是只能利用DUL或ODU等软件来文件级别的抽取。少数情况下,可以利用Oracle patch asm的脚本进行元数据的修复。

备注:11g开始,Oracle的asmcmd就提供了备份asm元数据的命令,对于一些不稳定的版本,真是强烈建议定期备份一下啊。。。

Related posts:

  1. Where is the backup of ASM disk header block? &#8211;补充
  2. oracle asm 剖析系列(5)&#8211;alias directory
  3. oracle asm剖析系列(7)&#8211;Active Change Directory
  4. oracle asm剖析系列(8)&#8211;Continuing Operations Directory
  5. 1.4TB ASM(RAC) 磁盘损坏恢复小记
本站文章除注明转载外,均为本站原创: 转载自love wife & love life —Roger 的Oracle技术博客 本文链接地址: 12TB ASM RAC磁盘无法mount的案例 网友发的信息,从alert log来看,在手工mount diskgroup的时候报错如下: Thu Aug 28 10:34:29 2014 WARNING: cache read a corrupted block gn=3 fn=1 blk=263 from disk 1 NOTE: a corrupted block was dumped to /oracle/diag/asm/+asm/+ASM/trace/+ASM_ora_17918.trc ERROR: cache failed to read gn=3 fn=1 blk=263 from disk(s): 1 ORA-15196: invalid ASM block [...]
推荐阅读
  • 在数据分析工作中,我们通常会遇到这样的问题,一个业务部门由若干业务组构成,需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
  • MyBatis错题分析解析及注意事项
    本文对MyBatis的错题进行了分析和解析,同时介绍了使用MyBatis时需要注意的一些事项,如resultMap的使用、SqlSession和SqlSessionFactory的获取方式、动态SQL中的else元素和when元素的使用、resource属性和url属性的配置方式、typeAliases的使用方法等。同时还指出了在属性名与查询字段名不一致时需要使用resultMap进行结果映射,而不能使用resultType。 ... [详细]
  • 本文详细介绍了在ASP.NET中获取插入记录的ID的几种方法,包括使用SCOPE_IDENTITY()和IDENT_CURRENT()函数,以及通过ExecuteReader方法执行SQL语句获取ID的步骤。同时,还提供了使用这些方法的示例代码和注意事项。对于需要获取表中最后一个插入操作所产生的ID或马上使用刚插入的新记录ID的开发者来说,本文提供了一些有用的技巧和建议。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 本文介绍了通过mysql命令查看mysql的安装路径的方法,提供了相应的sql语句,并希望对读者有参考价值。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • ALTERTABLE通过更改、添加、除去列和约束,或者通过启用或禁用约束和触发器来更改表的定义。语法ALTERTABLEtable{[ALTERCOLUMNcolu ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
author-avatar
曾理Aiheqihao_227
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有