天灾还是人祸? � Oracle连环夺命未遂记���
萧田国 � �
触控科技 �
个人介绍 � 萧田国,触控科技运维总监 � � � � � � � � � � � � � � � � � � � ACMUG核心成员 � � � � � � � � � � � � � � � � � � � � InfoQ专栏作者【高效运维最佳实践】 �
�
70%
高效运维最佳实践 � @ � � � � � � � � � � � � �
¢ 微信文章 � � 4篇UV均过万(第4篇为2.3万) �
¢ 官网文章 � � 01篇:七字诀,不再憋屈的运维 � � � � � � � � Top � 3 � @40天榜 � � 02篇:员工的四大误区及解决之道 � � � � � Top � 5 � @10天榜 � � 03篇:Redis集群技术及Codis实践 � � � � Top � 2 � @10天榜 � � 04篇:运维2.0,危机前的自我拯救 � � � Top � 1 � @10天榜 �
大大神级别 �
分享内容 �
1、数据块损坏 � 2、服务器假死 � 3、数据库无法关闭 � 4、更换硬件导致 � 5、天灾还是人祸? � �
背景是这样的 �
报表 � nTB数据 � n万张表 �
� � 1:数据块损坏(A) � � � 2:服务器假死(B) � � � 3:数据库无法关闭(C) � � � 4:更换硬件导致(D) �
1、数据块损坏(服务器A) �
负载正常、硬盘正常 �
解决过程 �
• event � 10231 � • dbms_repair � • bbed �
• analyze �
• 真正原因? �
• 最后的解决 �
2、服务器假死(服务器B) �
Ø _allow_resetlogs_corruption � Ø alter � session � set � events � 'IMMEDIATE � trace � name � ADJUST_SCN � level � 1' � �
解决方法 �
3、数据库无法正常关闭(服务器C) �
解决方法 � Ø ps � -ef � | � grep � dbrw � Ø iostat � � Ø strace � �
4、更换硬件导致(服务器D) �
¢ H310 � & � H710P �
解决方法 �
智性? �
5、天灾还是人祸?(服务器A) �
¢ 无法归档模式 � ¢ 无法RMAN � ¢ 无法DG � ¢ 没法expdp � ¢ 不需要备份 �
• processes � � � � & � � � � � sessions � • ETL数据回溯 �
然后呢? �
技术 � 是 �
专业最大的障碍 �
“高效运维”微信公众号 � 每周多篇原创,源自 �
高效运维微信群及运维讲坛 �
联系我 �
高效运维最佳实践 � @InfoQ � 2015 � 深度专栏 � � � � � 转 �
个人微信号 � xiaotianguo � 或扫我 �