接到客戶微信報(bào)修,說是共享盤斷開,也就是網(wǎng)絡(luò)驅(qū)動器丟失了,顯示為紅色的叉,無法連接。
我們的技術(shù)人員通過堡壘機(jī),也無法登錄該服務(wù)器。
那就只能驅(qū)動前往了,到了客戶機(jī)房,只看見服務(wù)器是在藍(lán)屏狀態(tài)。
重啟后,又出現(xiàn)“你的電腦出現(xiàn)問題,需要重啟……”,此時(shí)發(fā)現(xiàn),0號磁盤為黃燈,頓時(shí)有種不祥的預(yù)感。
耐心等它跑完,重啟服務(wù)器,沒有看到CTRL+R進(jìn)入陣列卡管理界面的提示,所以就按F2進(jìn)入設(shè)置界面,然后再找到陣列卡配置,查看硬盤狀態(tài)。
很明顯,0號磁盤確實(shí)壞了,好在是RAID5,應(yīng)該不至于丟失數(shù)據(jù)。
退出設(shè)置,嘗試啟動操作系統(tǒng)。
不出所料,系統(tǒng)還是可以進(jìn)入的,看了一下文件資料,應(yīng)該沒有丟失,通知客戶,共享盤暫時(shí)已恢復(fù),同時(shí)申請一塊硬盤。
3T的硬盤不好找了,直接上塊4T的SAS 7.2K。注意,此時(shí)服務(wù)器不要關(guān)機(jī),直接拔掉舊硬盤,插入新的硬盤就可以了,RAID5會自動重建的。
新硬盤插入后,狀態(tài)顯示正常,根據(jù)經(jīng)常,RAID5正在重建中。
由于這臺舊服務(wù)器前期沒有配置iDRAC,此時(shí)又不方便再重啟,所以直接在系統(tǒng)里安裝DELL OpenManage System Management Software,也一樣能看到RAID5同步狀態(tài),當(dāng)時(shí)并沒有截圖,以下是為了寫文章,后補(bǔ)的圖片。
從時(shí)間上日志可以看到,12:37拔出壞硬盤,12:51新硬盤接入,RAID開始重建,到晚上19:56,RAID5重建完成。
順便說一句,在Windows Server中可以通過DELL OpenManage System Management Software來配置iDRAC,修改IP地址,修改密碼等。
然后就能通過瀏覽器,訪問iDRAC,實(shí)時(shí)查看服務(wù)器狀態(tài),以及配置郵件告警等功能。
下圖1是服務(wù)器物理磁盤的狀態(tài),目前狀態(tài)良好;下圖2是服務(wù)器虛擬磁盤的狀態(tài),可以看到兩組RAID5磁盤當(dāng)前都是正常的了。
至于,郵件告警功能,配置也不難,看圖片便知。
第一步,配置發(fā)件服務(wù)器及相關(guān)信息;
第二步,配置收件人,注意,當(dāng)然可以是多個(gè)收件人;
第三步,設(shè)置報(bào)警的內(nèi)容;
下次服務(wù)器再有什么故障,你就能收到郵件了,能在很大程度上防患于未然,尤其是硬盤故障,早點(diǎn)知道,能避免數(shù)據(jù)丟失的損失。
當(dāng)然了,能部署Zabbix或者Prometheus這類實(shí)時(shí)監(jiān)測軟件,那就更好了,凡是我們長期服務(wù)的客戶,基本上都在我們的監(jiān)測之中,我們平時(shí)遠(yuǎn)程,也基本上是通過堡壘機(jī)完成,畢竟,安全第一嘛。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.