发新话题
打印

CX500 怪问题

CX500 怪问题

本单位用了EMC CX500,用两台SUN480做双机模式。
前几天要增加一台Redhat 4服务器做oracle数据库测试用,在服务上只上一块qlogic2340卡,linux能自动识别并安装驱动,安装agent后,在EMC管理系统显示正常,所用通道为SPA,但系统检测时总会提示sdc正常,sdd存在问题,系统集成商装oracle 10g 装了2天没装上去。EMC的agent安装后好象跟X界面有点冲突,我以为是系统存在问题,决定重装Linux系统。周末自己就重装了Linux系统,在重装系统的时候Linux能发现盘柜提供的空间,于是就直接将其mount到系统,装好系统后再安装EMC提供的Agent,但估计虽然装了Agent,但在EMC的管理器中显示可能不正常(因为集成商不在,无法访问盘柜管理程序)。
然后再把oracle数据库安装到盘柜提供的空间。
以为没事。
昨天早上发现主柜(两个柜子)左边的灯亮了,开始以为是电池在充电,到了下午灯还亮着,于是咨询集成商。今天集成商过来了,想进入管理界面,发现172.31.1.229的WEB界面进不去,但可以ping 通,于是通过172.31.1.230进入WEB界面,发现SPA已经“F”了,SPB在接替工作,update了几下也不行,把日志提供给EMC,说SPA可能进入死循环了,要用个特殊的命令才能在线重新恢复SPA。今晚要到12点之后才能做呀!!!!想把给linux建的goup删掉,总是提示Agent没起用,删除不了。

想问问,如果Agent没有在盘柜注册好,真的会出这样的问题吗?
如果真是这样,假设以后这Linux台服务器的网卡的网线万一没插好,Agent与盘柜失去联系,而又没及时发现,难道也会出现同样的问题?那不是很恐怖的事?

TOP

昨晚用了navicli -h 172.31.1.229 -rebootSP -o 这个命令,还是没能把SPA给重启上来,还是报错说Ageng not runing,看样子是得down 机了,到时候再看行不行吧?
请问日志里报错“Hard peer error”,然后就remove SPA,这是不是可能硬件有问题?

TOP

我没做过EMC CX的安装,但听朋友讲过,我也一直奇怪那块网卡(网线)不成了单点了吗?后来在一用户那里看到过两台CX300,它的网线就没有连接主机,但还是挺正常的。所以我也有些疑惑。
万里长城十亿兵
国耻岂待儿孙平
愿提十万虎狼旅
越马扬刀入东京

TOP

就是呀,我这次还只用了SPA通道,这样就把SPA给DOWN了,如果我用了两块HBA卡,连到SPA和SPB两个通道,岂不会把两个通道都给DWON了?!

一张网卡出问题可以DOWN掉EMC存储,如此说来,EMC的存储存在很大的安全问题呀!!!!!

EMC的Agent到底是做什么用的?比如RAID卡只要驱动,不装Agent照样可以用,只是不能在线管理而已,也不至于出现丢阵列的情况呀。

出现上而的情况,到底是不是我造成的????

TOP

Agent能收集一些本地的信息,并且通过网络告诉Navisphere。这些信息包括EMC盘阵中的每个LUN在Linux上对应的设备名。比如LUN1对应Linux上的“/dev/sdc”,LUN2对应“/dev/sde”。另外还包括一些访问路径的信息。你应该先检查一下那些设备名称是不是正确,如果那个东西不对,是有可能造成控制器逻辑混乱的。但是Agent能把控制器搞Down机确实罕见,因为Agent提供的那些信息并不是控制器工作必需的。既便不安装Agent,控制器也可以正常工作。而且,既然你的Linux只有一个卡,不需要多链路冗余,我建议你就不要在Linux上装Agent了。

TOP

如果硬是要安装Agent的,也就是说Agent是必须时常与盘柜联系的。这样一旦服务器的网卡或是交换机出了问题,而又没有及时发现,岂不会出大问题??!!而且这样SAN那边用双链路,怎么也抵挡不住单IP网络出问题而造成不可预测的事情?也就是说,SAN那边用双链路又有多大意义?网卡或网络成为单点故障问题的核心,可靠性岂能有保证?

TOP

楼上说的很明白了,AGENT与你的存储控制卡运行没有什么关系,就算网卡HUB什么的断了没什么影响,只是在storage group里看主机会看到(unreachable agent) 在lun里看不到主机认到的盘符而已,没什么问题。

TOP

四川移动吗?

TOP

一哥们在安装CX300时就出现了这个问题,他开始没有在HP-UX上安装agent,结果HP-UX上识别到的LUN数量不对,只认到一部分,后来加上agent就正常了,而且他说网线不能断,断了就不正常
万里长城十亿兵
国耻岂待儿孙平
愿提十万虎狼旅
越马扬刀入东京

TOP

CX系列确实要Agent,也就是说,兄弟们用CX系列盘柜存在着单点故障的隐患。

TOP

发新话题