RAC警示录-----各位兄弟补充
1.网络问题:
一次网络管理员没有通知我的情况下,由于网络堵塞,ARP原因,他直接重新核心交换机
RAC第2个节点直接DOWN掉,netstat -in查看IP地址,都已经切换到第1台
核心交换机起来以后,我启动CRS,利用srvctl启动所有应用,第2个节点启动,浮动IP切换回来.
2.命令uname -a和hostname
由于是常用命令,而且很熟悉,危险性就出来了,我有一次输入hostname -a
结果把主机名字改为
-a, alert.log:Errors in file /u01/admin/baan/udump/baan1_ora_12539.trc:ORA-00600: 内部错误代码,参数: [keltnfy-ldmInit], [46], [1], [], [], [], [], []Thu Dec 27 17:09:04 2007Errors in file /u01/admin/baan/udump/baan1_ora_12541.trc:ORA-00600: 内部错误代码,参数: [keltnfy-ldmInit], [46], [1], [], [], [], [], []Thu Dec 27 17:09:57 2007Errors in file /u01/admin/baan/udump/baan1_ora_12617.trc:ORA-00600: 内部错误代码,参数: [keltnfy-ldmInit], [46], [1], [], [], [], [], []Thu Dec 27 17:09:58 2007Trace dumping is performing id=[cdmp_20071227170958]Thu Dec 27 17:09:58 2007Errors in file /u01/admin/baan/udump/baan1_ora_12619.trc:ORA-00600: 内部错误代码,参数: [keltnfy-ldmInit], [46], [1], [], [], [], [], [] 通过hostname hpux把主机名改了回来,一切正常,数据库并没有掉 3.权限问题:
一次硬件厂商的工程师为我们新增加硬盘,配置存储,结果用ROOT用户重新刷新了存储的所有硬盘,导致RAC数据库DOWN掉,
我马上把二进制那些设备文件的权限改回orainstall,数据库起来
4.CPU问题:
一天检查发现RAC运行报了一些TRC文件,也看不懂,到metalink也没查到结果,但检查主机syslog的时候,发现了错误级别5的CPU错误
HP工程师检查发现节点1的CPU风扇坏了,马上联系北京,3天后换上新CPU
5.内存问题:
RAC运行一段时间以后,内存变为几十M.过1段时间必须要重启主机,后来联系HP工程师发现,
HPUX下的buffer_cache的控制参数默认50%,直接占掉内存的1半,而我们内存总共才8G,
SGA+PGA+一些其他进程已经超出50%
修改控制参数以后,问题解决
[@more@]
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/10748419/viewspace-998795/,如需转载,请注明出处,否则将追究法律责任。