Email: service@parnassusdata.com 7 x 24 online support!
Oracle ASM 磁盘组 dismount 显示 “Waited 15 secs for write IO to PST”
如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!
诗檀软件专业数据库修复团队
服务热线 : 13764045638 QQ号:47079569 邮箱:service@parnassusdata.com
适用于:
Oracle Database – Enterprise Edition – 版本 11.2.0.3 到12.1.0.1 [Release 11.2 to 12.1]
本文信息适用于任何平台。
症状
正常或高冗余磁盘组被dismounted ,显示这些警告消息。
//ASM alert.log
Mon Jul 01 09:10:47 2013
WARNING: Waited 15 secs for write IO to PST disk 1 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 4 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 1 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 4 in group 6.
….
GMON dismounting group 6 at 72 for pid 44, osid 8782162
原因
通常这类信息在以下情况下出现在ASM 警告日志文件中,
延迟的 ASM PST 在正常或高冗余磁盘组上的ASM磁盘上心跳,
因此ASM实例dismount磁盘组。默认下,它是15秒。
顺便说下,对于外部冗余磁盘组,心跳延迟有点被忽略。
ASM 实例停止发出更多PST 心跳直到它成功完成PST 重新验证,
但心跳延迟不直接dismount外部冗余磁盘组。
通过在以下情况中,ASM 磁盘可能无响应:
+ 多路径失败的物理路径的其中一些脱机或丢失
+ 在一个多路径设置中路径 ‘failover’
+ 服务器负载,或任何类型的存储/多路径/OS维护
Doc ID 10109915.8 简述了Bug 10109915(该修复引入了这个underscore参数)。且在Hung NFS Server/Filer 的情况中,问题是没有OS/存储可调超时timeout机制的。然后,_asm_hbeatiowait 帮助设置time out。
解决方案
1] 与OS 和Storage 管理员确认有无磁盘无响应。
2] 尽可能保持磁盘响应在15秒以下。
这取决于多个因素,如
+ 操作系统
+ 多路径(和多路径类型)的存在
+ 任何内核参数
所以你要搞清楚你的设置的磁盘无响应的’maximum’是多少。
例如,在AIX上 rw_timeout 设置影响这一点,且默认为30秒。
另一个例子是原生多路径的Linux。在这样的设置中,物理路径的数量和multipath.conf文件中的POLLING_INTERVAL值将决定这个最大磁盘无响应。
所以对于你的设置(OS / 多路径/ 存储的组合),你需要找到这个。
3] 如果你不能保持磁盘无响应在15秒以下,则可以在ASM实例(在RAC的所有节点上)中设置以下参数:
_asm_hbeatiowait
对于每个内部17274537 ,基于内部尝试,应该将值增加到120秒,这在12.1.0.2中被修复
在asm实例中运行以下来设置_asm_hbeatiowait所需的值
alter system set “_asm_hbeatiowait”=<value> scope=spfile sid=’*’;
然后重启asm 实例/ crs,使新参数值生效。